2025-11-13 11:10 门头沟学院大数据开发工程师

关注

腾讯校招大数据开发面经

1.WordCount 具体是怎么跑的?比如怎么分片、map 阶段做了啥、shuffle 是咋回事、reduce 最后怎么汇总的
2.MapReduce和Spark 到底差在哪儿?适用场景这些都得对比着说
3.Spark 提交任务时，Client模式和集群模式有啥不一样?比如 Driver 在哪跑、日志在陖瞎圈看、适合啥场景
4.同一条 SQL，为啥 SparkSQL 跑起来比HiveSQL 快?得从执行引擎、优化器这些底层说说原因
5.自定义 UDF 怎么实现?比如在 Hive 或Spark 里，具体步骤是啥，有没有踩过坑
6.设计 HBase 表得注意啥?rowkey 怎么设计才合理、列族要不要分、版本数怎么设，这些睪腘狐旨を曽斷纰可能问到
7.HBase 里的 HLog 是干嘛的?跟数据持久化、故障恢复有关系吗
8.都是存在 HDFS 上的数据，为啥 HBase 能支持在线实时查询，Hive 就不行?底层存储结构不一样在哪
9.用 SparkSQL 操作 Hive 数据时，有没有縈区堠浓ゴ壮攥到过兼容性问题?比如某些函数不支持、数据格式读不对之类的，怎么解决的
10.Spark Streaming、Storm、Flink 这几个流处理框架，区别在哪?各自的优缺点和适用场景得搞明白
场景题:
11.数据量特别大，要用三个 Map 和一个Reduce 来做 Top10，哪种方法效率最高?得考虑怎么减少数据传输、避免倾斜

全部评论

推荐最新楼层

努力提升自己l

门头沟学院大数据开发工程师

楼主简历是有hbase么，我到现在还没遇到过hbase的问题

点赞回复分享

发布于 2025-11-17 17:40 安徽

努力求捞捞

门头沟学院 Java

祝楼主早日收到offer！

点赞回复分享

发布于 2025-11-14 11:39 广东

游戏连败但心态超好

门头沟学院测试工程师

面试结果什么时候出？

点赞回复分享

发布于 2025-11-14 11:38 北京

中国第一拖拖拉机集团有限公司拖拉机学院大数据开发工程师

腾讯还是有难度

点赞回复分享

发布于 2025-11-13 12:02 上海

01-12 17:21

门头沟学院大数据开发工程师

2026春招“捡漏”指南：数据人如何抓住隐藏机会？

前言2026届秋招时，许多同学投了上百份简历却石沉大海，还有一部分考研的同学发挥失常，不得不临时转向就业赛道，焦虑、迷茫、自我怀疑——这些情绪我都经历过。但我想告诉你：相信自己，别急着沮丧本人在2023年春招期间，靠着对数据岗位的针对性准备，接连拿下字节、美团、滴滴等多家中大厂的数据开发offer。回头看，关键不在于投得多，而在于方向准、准备深、行动快所以今天，我想系统分享一套春招“捡漏”策略，帮忙大家在最短的时间内找准方向，收获心仪offer春招“捡漏”三步走第一步：简历包装——实习很重要，但没实习也有解很多同学卡在简历关，不是技术不行，而是经历没被“翻译”成业务语言。尤其对于2026届在校...

数据人的面试交流地

点赞评论收藏

分享

2025-12-29 12:05

已编辑

门头沟学院 Java

美团数据开发秋招面经

timeline: 8/16投递，9/9一面， 之后挂了，9/26被另一个部门捞一面第一次一面：先项目拷打八股：Java中有哪些数据结构Java中的基本数据类型了解Java的线程吗？线程池有哪些方法？LRU Cache怎么实现？了解大数据框架吗，如Hadoop, HiveMysql 中UNION和UNION ALL的区别不同join类型的区别Mysql底层数据结构B树和B+树的区别Mysql索引的原理是什么Mysql索引类型有哪些SQL题:类似lc185. 部门工资前三高的所有员工，考OVER用法算法题：lc704. 二分查找第二次一面：开放性问题：为什么选数据开发方向？了解想在这个方向就业需要学哪些知识吗？对于没有接触过的东西你是怎么学的？八股：JVM的内存结构你了解哪些垃圾回收算法，如何运作？多线程实现的方式有哪些？有什么手段能保证线程安全？具体用过的有哪些？什么场景下用的？为什么要用？解决了什么问题？数据库的事务是什么？解决了什么问题？MySQL中是如何实现事务的？MySQL有哪些引擎，区别是什么？MySQL中有哪些索引，结构是什么样的，怎么实现的？如何优化慢SQL?如何判断索引是否命中？如果用分库分表的方式查询，该怎么组织查询结果？如何找到要查询的数据库？SQL题：sales表有product_name, date, sales_amount字段，计算销售额最高的3个商品如何把排名显示出来如何计算每周销售额前三的产品算法题：lc8. 字符串转换整数 (atoi)，要考虑各种情况（正负整数，浮点数，NaN，科学计数法，百分数等）因为项目做的内容是偏数据的，以为投数据开发也行，但是对大数据框架、SQL题并不了解岗位不匹配，两面都挂了，白白用掉了投递机会家人们还是老老实实投Java开发，不要投错岗了

点赞评论收藏

分享

01-11 00:32

门头沟学院大数据开发工程师

字节数据开发

之前面试过字节数据开发，问题如下1 先自我介绍2 将你目前的项目进行简单的介绍一下，技术栈和项目难点说明一下3 离线开发建模主要是怎么设计的模型，对于数据倾斜和大任务一般怎么优化的4 对于画像你是怎么理解的，画像一般都是有哪些模型需要设计，为什么需要画像5 对于用户的转化率和重合度为啥很多公司都要做这个，你目前做过吗，对于这个你是怎么思考的6 对于数据质量监控和实时开发你这边有涉及吗，怎么做的

查看6道真题和解析

点赞评论收藏

分享

01-10 15:49

门头沟学院数据仓库

数据开发手撕高频率必考题

sql实现连续登录问题，主要考察窗口函数的应用sql实现排序问题，主要考察复杂排序问题另外在面试中必问数据倾斜问题的解决方案，以及日期函数的使用

一人分享一道面试手撕题

点赞评论收藏

分享

01-09 18:30

门头沟学院大数据开发工程师

快手数据开发实习一面

1、介绍项目2、项目底层数据来源，数据量，全量还是增量，计算引擎3、spark执行原理4、spark和mr最大的区别是什么5、缓慢变化维是什么，怎么处理6、维度建模(雪花模型 星型模型)，数仓开发为什么使用维度建模7、数仓的分层架构，各层之间的区别，依赖关系，维度表放在哪里8、OLAP引擎9、为什么想做数仓10、数据质量(dqc sla)11、如果没有按时产出，原因可能是什么?(我答的是任务失败导致的 比如数据倾斜面试官说还可能由于上游数据没有及时产出)sql手撕1、判断主键唯一性怎么写代码(selectuserid spuid count)2、连续登录问题

查看13道真题和解析

点赞评论收藏

分享

评论

2

15

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 哪些公司开春招了？ #

10356次浏览 118人参与

# 互联网公司评价 #

478618次浏览 4075人参与

# 上班以后，你还有哪些坚持的爱好？ #

7179次浏览 176人参与

# 你的秋招进行到哪一步了 #

2505266次浏览 23247人参与

# 你都在哪些场所面过试？ #

19842次浏览 224人参与

# 实习离职怎么跟领导说 #

75881次浏览 432人参与

# 聊聊你的被动加班经历 #

2744次浏览 58人参与

# 工作压力大怎么缓解 #

137702次浏览 1241人参与

# 你觉得今年秋招难吗 #

1943807次浏览 18458人参与

# 找工作以来，你最看不惯__ #

14523次浏览 307人参与

# 我和mentor的爱恨情仇 #

101222次浏览 916人参与

# AI coding的好用工具分享 #

18209次浏览 373人参与

# 实习怎么做才有更好的产出 #

12059次浏览 219人参与

# 实习好累，可以辞职全力准备秋招吗 #

518481次浏览 3557人参与

# 实习教会我的事 #

51646次浏览 401人参与

# 工作一周年分享 #

49980次浏览 262人参与

# 四大天坑是哪四家？ #

100572次浏览 234人参与

# 一人一个landing小技巧 #

142646次浏览 1495人参与

# 你最近因为什么迷茫？ #

34028次浏览 544人参与

# 实习生工资多少才算正常？ #

12763次浏览 199人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务