虾皮数开二面面经
1.你是数学专业,为什么想去做一个 DE
2.有了解过什么计算引擎的源码是怎么实现的吗?
3.flink 的处理框架和 spark 的处理框架的区别
4.场景题:
购物车页面推荐:在用户下单时,统计用户一年的消费情况,以便于在购物车页面做出合理的推荐,这个怎么处理呢?你对这个问题是怎么理解的?
5.广播是如何实现的?
6.rdd 具体是如何实现的
7.spark 里边 partition是什么?
8.怎么去识别一个 sparksql 任务是否有倾斜或者需要优化?
9.会用 sparkui 吗
10.对 jvm 的理解
11.堆内内存和堆在内存的理解