一面 1、项目。 2、spark中的shuffle有哪些? 3、mysql、spark中的join原理。 4、算法题:矩阵乘法。 5、HBase的优势,为什么使用了HBase、设计rowkey? 6、spark中几种partitioner、水塘抽样? 7、算法题: 有一个数组, (1)其中有一个数出现次数超过半数,找到这个数? (2)其中有两个数出现次数都超过了30%,找到这两个数? 二面 1、项目。 2、一个application提交运行的过程,画图。 3、算法题。 4、还有一些基础概念。 三面 hr+总监? 1、项目、项目难点在哪? 2、数据倾斜。 3、平时怎么学习一个新技术? 4、三...