1. 自我介绍2. 深挖项目3. 你的 dwd 层,dwm 层,ads 层是怎么确定的4. 你说你对离线整个链路的建设很了解,那你说说你如何开发整个离线链路5. spark 内存模型了解吗6. 抢占内存是个什么机制?7. spark 内存方面的调优说一下8. 你说 CPU executor 内存比例是 144,为什么是这个比例?9. spark 的 join 方式有哪些?10. spark 1 个 CPU 核心只处理一个 task 吗?11. soft merge join 的机制是什么?12. spark 大表关联小表的时候,小表,是怎么广播表到内存中的?13. spark 广播的小表储存在哪里?14. 广播的小表又是怎么取出计算的?15. 两道 sql,topN 和连续登录反问:1.组织架构2.喜欢什么样的人才3.工作强度如何大约45min感觉要凉,特意在面前看了spark的内存模型,以为自己基本上懂了,结果被狂问到不会