1. 先做个自我介绍吧。2. 实习主要做了些什么?3. Spark 和 Hadoop 有啥区别和优势?4. MapReduce 的运行流程是怎样的?5. MapReduce 哪个阶段最容易成为瓶颈?6. 用 Spark 执行 SQL 时,遇到数据倾斜或 OOM 怎么解决?7. 你怎么通过 Spark UI 来定位问题?8. 讲讲数仓的分层结构?9. 如果一个紧急需求和你手头的任务冲突了,你怎么平衡和沟通?10. 手撕 SQL:简单的分组聚合求前三。11. 手撕算法:寻找数组中每个元素的第一个更大元素(单调栈)。