Shopee 大数据开发暑期实习面经

📍 公司:虾皮(Shopee)

💼 岗位:大数据开发工程师

📅 面试时间线:

7.30 一面
8.4 二面
8.8 收到感谢信(未通过)
面试问题记录
请介绍你实习中负责的数仓数据流向及核心业务场景。
详细说明一个具体业务模块,包括所用技术栈与上下游用户。
针对问题2中的业务,如何处理并发场景下的“不可重复读”问题?
大数据技术栈掌握情况?重点提问 Spark 的使用经验。
如何优化实际 Spark 任务?请举例(如数据倾斜、Shuffle 优化)。
描述快速排序算法的基本思想(穿插在数据倾斜优化中考察基础)。
是否遇到过数据写错的情况?若数仓数据写入 Kafka 错误,如何修复?
➤ 进一步追问:HDFS 数据已错,但 Kafka → 业务表已生效,如何保证一致性与服务可用性?
若需从某个 Kafka Topic 消费数据并入库数仓,你会如何设计流程?(开放性问题)
🙌 面试感悟
虽为实习经历深挖,但问题贴近真实生产场景,尤其关注高可用、数据一致性、容错与恢复机制;
对数据链路的闭环理解要求较高,需清楚“从出错到修复”的全链路影响;
建议提前准备:
✅ 典型数据倾斜解决方案(如加盐、两阶段聚合)
✅ Kafka 重放与幂等写入策略
✅ 数仓分层中各层容灾与回溯能力设计
📌 C端业务对数据质量与系统稳定性要求高,面试更倾向考察“出问题后怎么办”的应急思维。

#发面经攒人品#
全部评论
这么复杂还没通过嘛 太哈人了
1 回复 分享
发布于 09-12 17:25 澳大利亚

相关推荐

点赞 评论 收藏
分享
09-18 20:41
百度_Java
点赞 评论 收藏
分享
评论
2
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务