总计35min,一场八股盛宴1. 自我介绍2. 深挖项目3. 数仓分层的建模理念4. 你的dwd层只做了数据的清洗转换,那没有这一层不是也可以嘛?(这里感觉回答的不好,说到最后反而觉得面试官说的有点道理。。)5. 除了三范式建模和数仓建模,其他建模方式了解嘛? 我答不了解,不常用,书里有6. 聊聊雪花模型和星型模型7. 哪里人8. 数仓中的压缩算法和文件的存储格式了解嘛? 答了parquet+snappy 和 zlib+orc9. orc的压缩倍率高还是parquet的压缩倍率高? 我答orc,我猜的10. spark3的aqe了解吗?11. aqe的优化方向有哪些?12. aqe在什么场景下适用,在什么场景下用了反而不好?13. Flink 的exactly once14. Flink的两阶段提交和三阶段提交有啥差别?(我蒙的,我说Flink的两阶段提交实际上是三阶段的前两个阶段合并,利用checkpoint机制相当于合并了三阶段的前两个阶段)15. 场景题:大数据场景下,如何取某个参数为前1000的user_id16. 你们日常的需求开发流程是怎么样的?17. 场景题:如果有一个需求很紧急,需要插入到这次的开发进程中,你会怎么处理?18. 什么时间能来实习?反问:1. 业务2. 改进点3. 工作强度更新:已挂