1.挑一个项目介绍2.了解实习经历3.针对实习项目,问数据层次怎么分层4.数据分层的作用5.针对具体实习项目,说明业务逻辑6.说明实习项目的“订单量"这个指标从源头到产出的 ETL过程7.针对实习项目,复盘后最大的难点是什么8.复盘之后有什么收获9.你刚才说复盘收获是处理小文件,那么spark怎么处理小文件的?10.处理小文件有哪些方法,举例子11.hive冷热分离的方法12.你刚才提到了组里有做ec存储,你了解ec存储吗13.暑期实习有什么感受,转正了吗 15分钟14.了解spark的semi join吗,他是干嘛的15.了解spark的AQE,这是什么16.你刚才讲AQE提到了广播机制,这个在spark中很重要,讲讲广播过程呢17.了解网络吗?讲讲三次握手和四次握手区别。18.了解数据结构吗?讲讲0(nlog n)的不稳定排序算法Q1.求开方:给定排序算法。num=5.79,error=1e-8,求x使得abs(x^2-num)<error