2022-09-20 15:27 已编辑字节跳动_员工

发布于北京

关注

个人遇到的大数据面试问题汇总

近期面试了一些公司，以下总结一些问的很多的和印象比较深的面试问题。（人比较懒

，没有每一面都总结，合在一起写个帖子，公司以互联网为主，包括字节阿里滴滴快手等）

经常问的：

1、数仓建模系列（个人方向偏向数据开发，不偏向底层组件研发，所以数仓聊的很多）

数仓建模的特性；

具体分层，每层有什么特点；

范式建模和维度建模，有什么优缺点；

维度和粒度的区别；

维度建模的标准流程；

如何评判数仓的优劣（穿透率什么的）；

数仓从哪一层开始会有一些跨域的建设；

数据治理的常用方法；

怎么理解用户画像，需要注意什么；

还有一些场景题（给个业务场景，怎么建模，涉及什么维表，什么事实表，怎么分层，优势在哪，劣势在哪）等

2、shuffle

mr shuffle 和spark shuffle的共同点与不同点，需要说出详细流程；

mr shuffle在shuffle时会进行3次排序，可不可以不排序，排序/不排序有什么优点，适合什么场景；

spark的宽窄依赖，划分stage；

spark具体有几种shuffle方式，分别有什么优缺点；

sql中哪些会发生shuffle（union/union all join 等）；

3、数据倾斜

什么是数据倾斜；

怎么定位一个任务发生了数据倾斜，发生在哪里，怎么能清晰的找到位置（看sparkUI解决一切）；

直播日志关联主播大维表，会不会发生数据倾斜，怎么解决；

数据倾斜的常用解决方式（shuffle IO倾斜，CPU计算倾斜）；

手机写好难受啊，但电脑没电了，先写这么多，有人看的话就补一下其他印象深刻的，这次一定！

#面经##校招##数据##大数据##大数据开发#

全部评论

推荐最新楼层

路过菜鸡一枚

河南师范大学大数据开发工程师

数仓从哪一层开始会有一些跨域的建设；数据治理的常用方法；这俩我昨天面试刚问到

1 回复分享

发布于 2023-02-22 09:28 浙江

斯沃福德

北京神舟航天软件技术股份有限公司_基础平台软件部_Java研发工程师

这才是校招问的问题啊。。。昨天面试问了些啥，问我saprkcore debug有什么思路？10000个spark用户，怎么管理线程？我tm。。。。直接坐牢半个小时。

点赞回复分享

发布于 2022-09-27 11:22 重庆

男刀内推

泰隆银行_信息开发部_it菁英工程师

数仓从哪一层开始有跨域建设，这个怎么回答呀

点赞回复分享

发布于 2022-09-23 09:26 浙江

11-05 10:14

门头沟学院研发工程师

百度内推码百度内推码百度内推码百度内推码

俺的百度内推码：IS9CAR 百度内推链接： https://talent.baidu.com/jobs/list?recommendCode=IS9CAR&recruitType=GRADUATE 欢迎大家投递我们的百度~ 速投，根据历史经验，越早投递越容易 百度正在寻找有才华、有创造力的学弟学妹们，加入我们，一起创造更多的价值！  抓瓦面经，摘自优秀牛油 百度一面面经7.14 1.布隆过滤器使用场景 2.redis自增命令生成唯一id 3.雪花算法的实现 4.乐观锁解决超卖的逻辑 5.项目中下单部分的逻辑 6.如何实现一人一单 7.限流方法 8.redis分布式锁 9.分布式锁的其...

点赞评论收藏

今天 09:23

门头沟学院后端工程师

作业帮一面

📍面试公司：作业帮🕐面试时间：10.25💻面试岗位：go服务端开发❓面试问题：手撕：移除元素，k个一组翻转链表口述：每日温度SQL：查询至少有两门课程成绩不低于80的学生八股：数组和切片的区别数据库分表和索引优化map的实现和扩容GMP中为什么必须要有Predis的常用类型；除了这五种常用的，还知道哪些缓存击穿、缓存穿透、缓存雪崩以及如何解决同时调用A服务和B服务，如果一个执行失败了（重试也一直失败），怎么保证数据一致性🙌面试感想：可能是简历没什么亮点，一直都是写题，写完说思路，然后问一两句八股

查看11道真题和解析

点赞评论收藏

10-23 15:58

华中农业大学 Java

约到字节面试了但是有面评不敢去

27届211 java没面过一个大厂，听说字节有面评，不敢面，怎么办

LZStarV：冲就好了，就算真的是字节也冲，面评脏了大不了等三四个月就淡了，而且等到那个时候实力进步了选择还多，何必拘泥于字节

点赞评论收藏

10-29 12:14

武汉大学运营

你好的博弈

打招呼的奥秘 hello的神秘 重复的压力 问候的活力 坚持的魅力 对话的意义组成了一个诡异

秋招响当当：一共经历几次握手

点赞评论收藏

11-10 15:49

江西理工大学 Java

双非本 Java offer选择

点赞评论收藏

123

招聘动态

昇维旭2026校园招聘

昇芯相连，旭写篇章

字节跳动火山引擎

2026校园招聘

联想

2026届校园招聘

字节跳动

2026校园招聘

联想

26届AI专项｜内推码NK2026

快手

2026届校园招聘

联想

2026届校园招聘

全站热榜

创作者周榜

正在热议

# 秋招暂停，我将对以下公司做出处罚__ #

# 军工所铁饭碗 vs 互联网高薪资，你会选谁 #

# 双11，我的offer购物车开箱啦 #