快手数据开发实习一面

1、介绍项目
2、项目底层数据来源,数据量,全量还是增量,计算引擎
3、spark执行原理
4、spark和mr最大的区别是什么
5、缓慢变化维是什么,怎么处理
6、维度建模(雪花模型 星型模型),数仓开发为什么使用维度建模
7、数仓的分层架构,各层之间的区别,依赖关系,维度表放在哪里
8、OLAP引擎
9、为什么想做数仓
10、数据质量(dqc sla)
11、如果没有按时产出,原因可能是什么?(我答的是任务失败导致的 比如数据倾斜面试官说还可能由于上游数据没有及时产出)
sql手撕
1、判断主键唯一性怎么写代码(selectuserid spuid count)
2、连续登录问题
全部评论

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务