1.讲一下实习做的东西,学到的东西2.数据集市涉及到的维度和事实表有哪些3.讲一下数据对于整个公司,业务的意义作用4.数仓分层的理解5.分数据集市建设的数仓架构优缺点6.了解的大数据基础组件7.Spark Ui怎么看,关注哪一些点去判断数据倾斜8.Sql语法中哪些关键词最容易导致数据倾斜9.说一下shuffle,以MR为例shuffle中涉及到哪些算法,不同算法涉及到哪些场景10.之前实习开发的表会有加监控吗11.作为数据同学,应该注意数据质量的哪些方面,以及如何保障数据质量12.聊家常,聊最近在学啥,聊aiSql 连续登录