结果:准备的不太好一面挂岗位类型:日常实习1.我看你spark用的比较多,我问你spark的问题吧,sparksql怎么转为底层的执行?2.解释一下RDD,包括RDD特性等。3.数据倾斜你是怎么解决的呢?4.spark shuffle的优化。5.spark 相关源码有了解吗?6.SQL题,行转列json的拆分(可能是用get_json_object?)(写不出来————)+ lateral view 7.还有个开窗题,dense_rank() 和 sum()的开窗。8.Dense_rank,row_number,rank的区别。9.为什么要设计DWD层,直接DWS层从ODS中读取可以吗?10.拉链表优点缺点。