某手+用户数仓岗位 数仓实习面试题
1.数仓的概念
2.业务域怎么分的?
3.关于主题的说法,如何划分?
4.ADS的表如何分类,提交什么需求就叫什么表?
5. 数仓分层建设中,DWD、DWS、ADS哪一层最难?
经典问题争议:数仓分层建设中,DWD、DWS、ADS哪一层最难?
6.各层有多少张表,数据量?
7. 刚提到的数据资产建设,数据资产主要是放在那一层产出的?这块是怎么做的?
8.数仓跑了多久
9.hadoop的基本原理。hadoop3跑的啥,tez还是spark?
10.RDD的基本原理,弹性怎么理解
11.宽依赖和窄依赖
12.spark数据倾斜的问题
13.结果表: 客服名称,客户数 ,未完成对话数, 平均响应时间