1.过往经历集中在数据分析,如何看待自己的职业发展,对数仓这个岗位如何能确定自己是能长期做下去的2.介绍一下过往项目,要求详细说明项目的背景,做了什么,怎么做的,结果如何3.一个比较抽象的问题:如果目前有很多视频,有用户id,视频id,开始播放时间,结束播放时间,怎么计算某个时间点最大的视频播放量,不用写sql,口述即可4.在这个过程中遇到数据倾斜的问题,比如某个视频播放量特别大,该如何做分桶,针对哪个字段5.spark中造成数据倾斜的原因是什么(落在shuffle)6.spark中的stage和task是并行还是串行的?spark中有哪些算子会造成数据倾斜?解决数据倾斜的手段有哪些7.了解索...