一面:技术面1、自我介绍2、怎么看待加班?3、怎么看待上游效率低而导致的加班?(沟通、分析、一起解决问题)4、介绍一下实习内容5、数据是怎么入库的6、细抠去重逻辑,面试官最后说没太懂,就过了7、怎么进行数据清洗?(SQL也是ETL工具)8、介绍一下维度建模9、星型模型和雪花模型的区别是什么?10、数仓为什么要分层?(面试官提示还有解耦)11、熟悉哪些大数据组件?12、怎么创建Kakfa topic?13、Kafka为什么能支撑大规模数据?性能为什么快?14、HDFS有哪些组件?各自的作用是什么?15、HDFS如何实现高可用?16、HA自动切换的原理?ZK怎么监控HA节点?17、HA的时候合并日...