美团秋招记录

9.14一面
介绍项目
项目中的ETL
项目中的拉链表
项目中的UDF
项目中的Kmeans和DBSCAN
八股
说一下HDFS
说一下进程和线程
说一下数据倾斜
说一下kafka
说一下数仓的建模(雪花,星形,星座)
说一下数仓分层的作用
OLAP和OLTP的区别
说一下数据库三范式
手撕两道SQL
手写冒泡排序
(一面全部答出来了)

9.18二面,二面感觉很考验对大数据的理解
介绍项目
项目中感觉做的最好的地方是哪些
介绍一下中国软件杯的比赛
你觉得你的项目和比赛在哪些地方体现出了大数据的思路
讲讲你对大数据的理解
讲讲你对数仓分层的理解
讲讲你对数据仓库和数据库的区别的理解
数仓和数据库都是SQL Boy, 你对两个SQL Boy的区别的理解
有没有用过Doris和clickhouse(没有)
说一下LSM Tree
说一下Bit Map
我看你项目里有lambda框架,讲一下lambda框架
说一下Hive中的去重
说一下模糊去重(这是真的不会。。。)
说一下Kmeans和KNN的区别
讲一下Java的集合框架
手撕力扣原题,二叉树的层序遍历
反问

9.23 HR面
介绍一下你自己
为什么选择大数据
你是保研的,你的成绩排名是多少
为什么不选择考公或者读博
你认为现在公司需要什么样的人才
你在秋招的时候是怎么介绍自己的
你自己有什么优势(疯狂推销自己,我学习能力强)
你说你学习能力强,怎么体现出来的(幸亏我脑子转的快,答上来了)
两道场景题
1.你入职后,你的师傅负责带你学习,但是刚过了一周,你的师傅被紧急抽调了。这种情况下你如何学习技术。
2.入职后,有人得到了晋升,而你没有。但是你感觉你自己的付出不少于他们。你会怎么做。
反问

9.26 oc #美团求职进展汇总#
全部评论
请问什么部门啊。
点赞 回复 分享
发布于 2024-09-26 16:15 陕西

相关推荐

04-09 20:11
已编辑
快手_Java(实习员工)
日期: 二面(4.9)岗位:后端开发实习生地点:北京背景:  双非科班、两段实习经历面试官全程微笑,体验非常好,除了中间我自己把自己引入坑之外都挺好1. 自我介绍,可以讲讲你学习和成长的经历,不仅限于大学期间(闲聊)2. 对于一个网盘设计,除了本地文件存储,还有其他方案吗?3. 现在有一万份简历,如果我想根据你的名字找到你的简历,有什么比较好的方案吗?(这里回答不知道怎么提到了ElasticSearch,后来问AI是能用ES实现,但是我没用过ES)4. 有用过ES吗?(没有)ES搜索的底层原理是怎么实现的知道吗?(??)5. ES和ClickHouse有什么区别呢?6. 你在大学期间还参与了哪些项目,可以介绍一下7. 问数学建模经历8. 不论是在实习期间还是你自己做项目期间,哪个项目是你觉得比较有趣的9. Kafka保证消息不丢失有做哪些设计?10. 刚才说消息确认可以等到所有的follwer都确认,但这会不会影响到性能?怎么去折中这个事情?11. 你自己在什么项目中有用过Kafka吗?12. Kafka里面怎么保证消息是有序的?13. Kafka本地磁盘存储耗尽了怎么办?14. 你在AutoMQ实习的一段时间对你有哪些帮助?在支持这么多云的情况下有哪些功能是需要适配的?15. 你的项目中用到了SSE,这个使用场景是什么?还有其他方式吗?WebSocket和SSE的区别是什么?16. 在自己的学习或工作中有用到AI吗?17. 自己做项目有遇到什么不符合预期的场景吗,怎么解决的?18. 你自己对后续的职业规划是怎么想的?19. 反问业务(电商 + AI),几轮面试(3-4轮)
查看18道真题和解析
点赞 评论 收藏
分享
04-15 20:33
已编辑
门头沟学院 Java
双非本偶遇阿里系约面,深挖项目强如怪物,拼尽全力无法战胜岗位Java研发工程师基本是跟着简历一行一行问,没什么参考价值的面经,全程1小时多几分钟TimeLine2.24 官网内推投递3.15 笔试 ak4.10 约面4.15 一面 挂1. 自我介绍2. 实习比较有挑战性的事情?3. 消息推送是由系统触发还是人为触发的?4. Redis Pub/Sub数据会丢,有没有考虑用其他方式让他不会丢呢?(答了Stream)5. 为什么选择Kafka,而不是其他,比如RabbitMQ?RocketMQ?6. Kafka快的原因是什么?7. 接T6,那其他MQ是否也能通过顺序读写磁盘做到这么快?(乱答一通)8. 实习期间SQL优化怎么做的?9. 联合索引ab,where b > 2 and a = 1可以用到索引吗?10. 刚才提到最左匹配原则,为什么是最左匹配?11. 自增ID和UUID作为主键有什么区别?12. UUID作为主键插入B+树会怎么插入?13. 大VARCHAR,TEXT能否存入聚簇索引?14. Kafka异步处理为什么能提高性能?15. 现在有这样一个场景,我要针对某个特征(比如针对某个地区、某个年龄、某类客户端)的用户或者说全部用户进行消息推送,这种场景你会怎么设计?16. 消息推送记录是否会落盘?全量用户推送数据量很大,比如百万、千万级甚至上亿,如果我多推送几次,数据量就数十亿了,MySQL存储的话数据库压力会很大,有没有什么好的解决方案?(一时间没想到什么方案,先扯了分库分表,面试官显然并不满意)17. 有没有其他更好的方式?比如分析他的特征?提示一下,这种全量推送,一般来说内容是一样的。(答从业务角度考虑,考虑将这类任务特殊处理,只存一行数据来确认这次任务是否推送成功)18. 既然你要这样存,那和原来存的表就不兼容了,这一部分你怎么解决?(开始扯NoSQL,MongoDB的名字还忘了,难绷)19. 链路追踪怎么做的?为什么要做这个功能?(自定义LogUtil埋点)20. 如果说我现在是微服务,各个模块之间的调用链路非常复杂,甚至可能出现某个模块被多次重复调用,那你会怎么做链路追踪?怎么知道这个模块是第一次调还是第二次调?我怎么通过这个链路追踪来知道出问题的时候具体是哪里出问题了?(几乎完全没思路,已经开始汗流浃背了)21. 限流是怎么设计的?限流的方式有哪几种,为什么选用滑动窗口?令牌桶不行吗?22. (场景是24小时内请求次数限流)为什么不能固定窗口切成一小时一次的?为什么不能用令牌桶设置生成速率来做?23. 去重(接口幂等)怎么做的?(通过Redis)24. 接T23,那假设现在你下发消息失败了,Redis又已经存入这个key,那怎么再下发这条信息?(答设置合理的key过期时间)25. 接T24,那Redis要设计过期时间,如果你发送成功了,然后服务又崩了,不知道成功了,现在再发一次或者重试不就不能做到去重了吗?这种情况你怎么处理?26. 为什么使用责任链模式?可以是模板方法模式吗?可以是装饰器模式吗?27. 你说使用Kafka搭配EasyExcel流式处理做异步用户批量注册,这是怎么个原理?28. 直接用内存队列或者线程池不行吗?他们的差异是什么?(答内存队列如果宕机对丢失信息)29. 接T28,那有没有什么优化手段?30. Kafka不保证唯一消费,消费有可能重复,这种情况你怎么处理?(通过UNIQUE KEY + 插入时IGNORE)31. 用了WebSocket实现数据搭配,为什么用WebSocket?32. WebSocket是长连接对吧?那其他长链接我们也有用TCP的嘛,那他们有什么差异?33. 刚才提到了HTTP升级到WebSocket,他是怎么升级的,具体是什么命令呢?34. WebSocket粘包问题?35. TCP的包是一个一个发出去的,如果说有一个包延迟了会怎么办?36. 前面(T28)提到过kill -9,kill和kill -9的区别是什么?有没有用过其他Linux的命令?37. 如果说CPU占用非常高,如果是某个Java线程出问题了,怎么定位?(答了Arthas)38. 如果只用Linux命令呢?(top,jstat,顺便开始扯可能是因为内存爆了引起fullgc导致高占用,撤jmap)39. 那垃圾回收算法有哪些?40. G1和CMS的主要差异?41. 玩过什么游戏?42. base地要求?43. 用过什么加速器?反问:1. 改进?建议?2. 面试结果大概什么时候出?(本周)3. 业务?(biubiu加速器)半小时后流程已结束,我的暑期到这基本也结束了,以3面0offer收场,希望接下来能找到一个好一点的日常混混日子罢
最喜欢春天的钝角很想回学校:感觉很强啊
点赞 评论 收藏
分享
评论
4
10
分享

创作者周榜

更多
牛客网
牛客企业服务