字节数据开发面经
结果:准备的不太好一面挂
岗位类型:日常实习
1.我看你spark用的比较多,我问你spark的问题吧,sparksql怎么转为底层的执行?
2.解释一下RDD,包括RDD特性等。
3.数据倾斜你是怎么解决的呢?
4.spark shuffle的优化。
5.spark 相关源码有了解吗?
6.SQL题,行转列json的拆分(可能是用get_json_object?)(写不出来————)+ lateral view
7.还有个开窗题,dense_rank() 和 sum()的开窗。
8.Dense_rank,row_number,rank的区别。
9.为什么要设计DWD层,直接DWS层从ODS中读取可以吗?
10.拉链表优点缺点。
岗位类型:日常实习
1.我看你spark用的比较多,我问你spark的问题吧,sparksql怎么转为底层的执行?
2.解释一下RDD,包括RDD特性等。
3.数据倾斜你是怎么解决的呢?
4.spark shuffle的优化。
5.spark 相关源码有了解吗?
6.SQL题,行转列json的拆分(可能是用get_json_object?)(写不出来————)+ lateral view
7.还有个开窗题,dense_rank() 和 sum()的开窗。
8.Dense_rank,row_number,rank的区别。
9.为什么要设计DWD层,直接DWS层从ODS中读取可以吗?
10.拉链表优点缺点。
全部评论
啥学历呀主播,我是公办二本学院,不知道有机会没
相关推荐
昨天 00:11
西北工业大学 后端 点赞 评论 收藏
分享
点赞 评论 收藏
分享
昨天 16:15
门头沟学院 算法工程师 
点赞 评论 收藏
分享