快手数据开发实习一面
1、介绍项目
2、项目底层数据来源,数据量,全量还是增量,计算引擎
3、spark执行原理
4、spark和mr最大的区别是什么
5、缓慢变化维是什么,怎么处理
6、维度建模(雪花模型 星型模型),数仓开发为什么使用维度建模
7、数仓的分层架构,各层之间的区别,依赖关系,维度表放在哪里
8、OLAP引擎
9、为什么想做数仓
10、数据质量(dqc sla)
11、如果没有按时产出,原因可能是什么?(我答的是任务失败导致的 比如数据倾斜面试官说还可能由于上游数据没有及时产出)
sql手撕
1、判断主键唯一性怎么写代码(selectuserid spuid count)
2、连续登录问题
2、项目底层数据来源,数据量,全量还是增量,计算引擎
3、spark执行原理
4、spark和mr最大的区别是什么
5、缓慢变化维是什么,怎么处理
6、维度建模(雪花模型 星型模型),数仓开发为什么使用维度建模
7、数仓的分层架构,各层之间的区别,依赖关系,维度表放在哪里
8、OLAP引擎
9、为什么想做数仓
10、数据质量(dqc sla)
11、如果没有按时产出,原因可能是什么?(我答的是任务失败导致的 比如数据倾斜面试官说还可能由于上游数据没有及时产出)
sql手撕
1、判断主键唯一性怎么写代码(selectuserid spuid count)
2、连续登录问题
全部评论
相关推荐
01-10 15:49
门头沟学院 数据仓库 点赞 评论 收藏
分享
