项目追问: 1.你如何去评估一个数据仓库的好坏?2.你如何去完成数据的质量治理?3.你如何去制定优化数据仓库的方法?总体来说都是很开放性的题目,要对数据仓库有自己的思维和理解,以及要有一定的整体意识和目标意识。八股:1.spark的作业调度2.spark和mapreduce的区别3.sparksql的执行流程以及catalyst优化4.spark的内存结构5.flink和spark有什么区别?项目的flink是如何使用的?八股部分比较基础。算法:三道简单sql一道leetcode hot100 是medium还是hard忘了,不过都hot100了出啥都一样算法部分比较简单。