1. 项目介绍2. 实习部门的业务介绍3. 工作中有什么数据倾斜的问题?4. Spark 的内存管理机制是怎样的?OOM 问题是怎么造成的5. 场景题:不一定要局限于 Spark 的框架。有一个很大的数组,这个数组有 1w 个元素,需要对这个数组从小到大进行一个全排序。但我们的内存没有那么多,磁盘够多。有没有什么办法以有限的内存,相对充足的磁盘空间来实现 1w 个元素的全排序6. 介绍一下什么是 Spark Job,什么是 Stage7. SQL 题 3 道。不难,题目忘了,用一些子查询窗口函数解的8. 算法题 leetcode 56 合并区间 mid