携程数仓实习 面试题
1、先介绍自己的项目,然后对项目提问(问得很少)
2、给一个你不熟悉的业务,要求做一些报表、指标,你会怎么做(如何设计数据仓库,数仓建模)
3、Hive有哪些存储文件格式,对应的应用场景?
4、给一个txt文件,load数据到Hive中需要考虑哪些问题?
5、给A、B两张表进行join,描述join的过程
6、用MapReduce详细的描述join的过程
7、给定一张订单表请考虑它的一个表结构(分区表?不分区),存储数据使用增量表?全量表?为什么?
8、基于订单表继续丰富场景,问订单表常发生状态的变化,该怎么存储维度变化?
详细描述一下该如何实现拉链表?
sql题:给定一个打卡表(dep_id,uid,time),求连续打卡次数(用户两次打卡中间没有其他人,则认为是连续打卡)
#发面经攒人品#