美团大数据面试
一面8.25
自我介绍
讲了下数仓项目
问了下数仓分层有什么好处
数据清洗做了什么
数据质量监控做了什么
主要问了spark和hive的问题:
spark shuffle过程
数据倾斜如何发现,原因,以及解决方式
说一下为什么建表数据类型不一样会发生数据倾斜
stage划分
能产生shuffle的算子有哪些
spark内存模型
给了两个sql语句,问得到的结果一样吗,哪个效率更好?
手撕:sql题,求周同比
稍微有点琐碎,暂时能想起来就这么多
不知道为啥,40分钟就面完了,没撕算法题😂
当时感觉学过的基本都答上来了,下来再看了看,感觉有些问题答的不是很全面,也不知道能不能过,许个愿
-----------------------------------------------------------------
还愿,时隔4天收到二面通知了
9.1二面
大概40多分钟
先了解了一下都学习过哪些内容,问我为什么选择做大数据,不做后端开发
问了kylin的原理,与数据库SQL查询的区别
数据库聚簇索引
B树和B+树
数仓分层的作用
维度建模的过程
数据质量监控如何做的
如果有100亿条数据,保存在文件里,查找topN该怎么做,用java和大数据分别该怎么做
手撕:两个栈实现一个队列
最后又问了些hr的问题
你对第一份工作有什么期待
优缺点
第一个问题答的不是很好,有点忘记了,面试官也没给过多时间思考,其他感觉还行
许愿有三面