美团大数据面试

一面8.25

自我介绍

讲了下数仓项目

问了下数仓分层有什么好处

数据清洗做了什么

数据质量监控做了什么

主要问了spark和hive的问题:

spark shuffle过程

数据倾斜如何发现,原因,以及解决方式

说一下为什么建表数据类型不一样会发生数据倾斜

stage划分

能产生shuffle的算子有哪些

spark内存模型

给了两个sql语句,问得到的结果一样吗,哪个效率更好?

手撕:sql题,求周同比

稍微有点琐碎,暂时能想起来就这么多

不知道为啥,40分钟就面完了,没撕算法题😂

当时感觉学过的基本都答上来了,下来再看了看,感觉有些问题答的不是很全面,也不知道能不能过,许个愿


-----------------------------------------------------------------
还愿,时隔4天收到二面通知了

9.1二面

大概40多分钟

先了解了一下都学习过哪些内容,问我为什么选择做大数据,不做后端开发

问了kylin的原理,与数据库SQL查询的区别

数据库聚簇索引

B树和B+树

数仓分层的作用

维度建模的过程

数据质量监控如何做的

如果有100亿条数据,保存在文件里,查找topN该怎么做,用java和大数据分别该怎么做

手撕:两个栈实现一个队列

最后又问了些hr的问题

你对第一份工作有什么期待

优缺点

第一个问题答的不是很好,有点忘记了,面试官也没给过多时间思考,其他感觉还行

许愿有三面

#面经##校招##美团#
全部评论
lz后续怎么样了
点赞 回复 分享
发布于 2022-09-18 11:26 广东

相关推荐

评论
1
13
分享

创作者周榜

更多
牛客网
牛客企业服务