二面的强度比较大,问的问题都很深刻,关于对上一段的实习经历的询问就暂时不放出来了,因为是用实习公司的实际运营内容去作答的,涉及到机密问题。 ok,让我们再复盘一下面试官问的技术细节问题吧。1.Spark是怎么做内存管理的?(开头就有点涉及到我的知识盲区了) 因为Spark与MapReduce最大的区别就是Spark是在内存中做计算,中间数据几乎不落盘,所以Spark对内存的管理有一套它自己的规范,主要目的是平衡数据的存储(基本就是RDD 的缓存,注意:很多同学一想到RDD的缓存就也想将checkpoint说出来,但是checkpoint是把时间落盘了的,这点要尤其注意,说错了很减分)和执行计算...