11-13 12:10 门头沟学院大数据开发工程师

关注

美团数据开发一面秋招面经

1.实习介绍
2.能理解为你的项目就是对指标和标签做一个规范整理吗?
3.你在切换标签的时候如何保障数据质量?
4.你在实习过程中有遇到过数据倾斜的情况吗?你是如何解决的?
5.标签存储用的是什么数据库?
6.用Doris存储主要是为了加快查询，你有遇到过下游报表查数慢但不是数据倾斜的情况吗?你是如何解决的?
7.两道Sql:
(1)很简单;
(2)找出那些有5个下属的经理id及其名称
8.能实习多久?实验室有要求出勤吗?base地能否接受?
9.面试官介绍部门业务线。
10.反问环节。

全部评论

推荐最新楼层

牛客285724757号

中国农业大学数据分析师

数据倾斜咋办

点赞回复分享

发布于 11-20 14:21 北京

11-02 22:17

已编辑

National University of Singapore 大数据开发工程师

【数开实习面经】字节跳动-生活服务（暑期）

面试时间：2025.03面试部门：生活服务timeline：3.12一面，后续已拒一面（45min）自我介绍离线数仓项目介绍（业务细节+建模过程）实习经历中如何整合异构数据源（说了数据采集工具、采集过程以及ELT思路）事实表的分类及其应用场景（事务型，周期快照型，累计快照型）简要说明数据倾斜问题如何解决（hive+spark）sql手撕：最大连续登录天数算法手撕：数组倒序排序（选一种排序方法即可，我选的快排）

查看7道真题和解析

点赞评论收藏

分享

11-13 11:10

门头沟学院大数据开发工程师

腾讯校招大数据开发面经

1.WordCount 具体是怎么跑的?比如怎么分片、map 阶段做了啥、shuffle 是咋回事、reduce 最后怎么汇总的2.MapReduce和Spark 到底差在哪儿?适用场景这些都得对比着说3.Spark 提交任务时，Client模式和集群模式有啥不一样?比如 Driver 在哪跑、日志在陖瞎圈看、适合啥场景4.同一条 SQL，为啥 SparkSQL 跑起来比HiveSQL 快?得从执行引擎、优化器这些底层说说原因5.自定义 UDF 怎么实现?比如在 Hive 或Spark 里，具体步骤是啥，有没有踩过坑6.设计 HBase 表得注意啥?rowkey 怎么设计才合理、列族要不要分、版本数怎么设，这些睪腘狐旨を曽斷纰可能问到7.HBase 里的 HLog 是干嘛的?跟数据持久化、故障恢复有关系吗8.都是存在 HDFS 上的数据，为啥 HBase 能支持在线实时查询，Hive 就不行?底层存储结构不一样在哪9.用 SparkSQL 操作 Hive 数据时，有没有縈区堠浓ゴ壮攥到过兼容性问题?比如某些函数不支持、数据格式读不对之类的，怎么解决的10.Spark Streaming、Storm、Flink 这几个流处理框架，区别在哪?各自的优缺点和适用场景得搞明白场景题:11.数据量特别大，要用三个 Map 和一个Reduce 来做 Top10，哪种方法效率最高?得考虑怎么减少数据传输、避免倾斜

查看11道真题和解析

点赞评论收藏

分享

11-13 16:06

National University of Singapore 大数据开发工程师

【数开秋招面经】阿里-智能信息

面试部门：内容数据工程timeline：09.24投递，10.14笔试通知，10.21一面，次日挂，并取消10.25的笔试一面（35min）自我介绍实习内容介绍实习中最复杂的一项工作，主要内容是什么，从中有哪些收获主要用什么技术栈JVM的内存结构如何排查OOM问题内存泄漏在什么场景下会发生算法：最大子数组和

查看8道真题和解析

点赞评论收藏

分享

11-04 23:05

门头沟学院大数据开发工程师

滴滴校招数据开发一面面经

1.mapreduce执行流程2.hdfs如何保证数据一致性3.flink和kafka如何保证数据的一致性4.flink的checkpoint里的barrier对齐和非对齐分别如何实现exactly-once；非对齐实现需要怎么做？5.kafka如何保证数据一致性6.spark和mr的shuffle有哪些区别7.spark的内存参数一般怎么调整；一般集群的spark内存参数会在什么样的一个级别？8.数仓分层，每一层有什么作用？具体的全链路流程是什么样的？9.维表应该如何进行设计？10.用户画像如何搭建？11.然后是一些数据结构的考察。12.然后是两道sparksql题，不难。其中一个是考察数据构造，需要对sparksql有较深的使用了解。

查看12道真题和解析

点赞评论收藏

分享

11-10 10:45

National University of Singapore 大数据开发工程师

【数开秋招面经】百度-电商

面试时间：2025.09面试部门：电商timeline：09.24一面，09.29二面，然后转到正式批流程中，就没有后续了一面（80min）面试官介绍部门业务自我介绍+实习经历简介实习经历全方位拷打（35min）Spark SQL的运行流程Spark SQL编译过程中做的一些优化手段刚才提到的都是静态优化，有没有动态优化的手段Spark有哪些Join方式，如何选择，优先级是什么sql题：给一张表student，记录了学生的分数：id, item（课程）, score求科目前10名 以及每个科目的最高分 追问：求最高分是否可以不用join求各学科均>60的学生追问：如果极端情况，某一科所有...

查看16道真题和解析

点赞评论收藏

分享

评论

2

3

全站热榜

更多

华为开奖交流

热聊中

创作者周榜

更多

正在热议

更多

# 十二月请对我好一点 #

5892次浏览 140人参与

# 父母对你找工作是助力还是阻力？ #

1957次浏览 54人参与

# 哪一瞬间让你觉得“这班不如不上” #

1895次浏览 21人参与

# 为了去实习，我赌上了___ #

1839次浏览 35人参与

# 工作中出现了XX情况正常吗 #

7239次浏览 90人参与

# 聊聊我眼中的AI #

484504次浏览 6704人参与

# 一人推荐一个值得做的项目 #

2546次浏览 46人参与

# 高薪高压 vs 低薪wlb，你怎么选？ #

3316次浏览 41人参与

# uu们，春招你还来吗？ #

1844次浏览 21人参与

# 回顾今年你干过的最“勇”的一件事 #

4212次浏览 67人参与

# 公司福利里最没用的一项是啥 #

2360次浏览 54人参与

# 工作前VS工作后，你的心态变化 #

3562次浏览 32人参与

# 秋招有哪些公司要求提前实习 #

90879次浏览 481人参与

# 机械人的金三校招总结 #

38859次浏览 465人参与

# 追觅科技求职进展汇总 #

28857次浏览 181人参与

# 职场上哪些事情令人讨厌 #

32176次浏览 142人参与

# 应届生，你找到工作了吗 #

90886次浏览 570人参与

# 2023届毁约公司名单 #

228574次浏览 1056人参与

# 美团秋招笔试 #

176321次浏览 1000人参与

# 你被哪些公司挂了？ #

106956次浏览 669人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务