阿里云CIO数开一面1016
半小时面试,之后约了个时间做2小时的在线笔试(区别于牛客的官方笔试,这是面试官自己用面试平台出的,但是确实好多题)
1.手撕每个部门工资前五名的员工 讲解rank、dense_rank、row_number三个窗口函数区别
2.数据倾斜的原因和解决方案
3.小文件过多的原因和方案
4.spark ui当中job和job之间的划分、stage和stage之间的划分
5.什么情况下会产生shuffle?
之后就是隔天1017约的2小时的在线笔试,可以去下一个帖子参考。