上海 xxx 大数据面经

6.6 下午3:45左右 4:15左右出  30min
1. 自我介绍
2. 哪里人(自我调侃
3. 你觉得你有xx人的那些品质吗?
4. 做过班长是吧,为啥又不干了呢?
5. 学校党员多么?
6. 为什么想做开发?大环境也不行,为啥还要入行开发?
7. 你的学历不占优势、以及大环境这么差,你怎么保证你的能力可以干开发呢?你怎么卷得过别人?
8. 你说你喜欢技术,不做管理路线?所以想发展到架构方向了?
9. 在你面前抽烟能接受么,来一根?(不抽烟,推了
10. 你觉得你做开发需要的能力是什么?你最需要提升什么能力?
11. 提到AI,你都用过哪些?
12. 能干销售吗?能演讲吗?
13. 你上一段实习做的什么?(社群运营)为啥要去那个实习?面试过程是什么?
可能还有点细节忘了
然后是开始介绍他们公司,加班的看法、要求等
反问:
用的什么技术栈:分布式很少微服务、SpringBoot那一套
上班时间:9:30 - 18:00 加班少,项目紧才会(不好说是不是真的
最后:
大数据了解吗?在学校用过数据平台吗?
说还有什么问题?没了
全部评论
看起来就 好。。。好害怕 请问最后结果如何呢
点赞 回复 分享
发布于 08-27 12:47 澳大利亚
《在你面前抽烟能解决吗》我能说不接受吗
点赞 回复 分享
发布于 06-15 11:53 上海
你好问一下,三本有机会嘛。。。不要求大厂
点赞 回复 分享
发布于 06-13 16:49 浙江
感觉有点像hr面的问题
点赞 回复 分享
发布于 06-06 22:50 上海

相关推荐

09-09 20:08
产品经理
📍 公司:虾皮(Shopee)💼 岗位:大数据开发工程师📅 面试时间线:7.30 一面8.4 二面8.8 收到感谢信(未通过)面试问题记录请介绍你实习中负责的数仓数据流向及核心业务场景。详细说明一个具体业务模块,包括所用技术栈与上下游用户。针对问题2中的业务,如何处理并发场景下的“不可重复读”问题?大数据技术栈掌握情况?重点提问 Spark 的使用经验。如何优化实际 Spark 任务?请举例(如数据倾斜、Shuffle 优化)。描述快速排序算法的基本思想(穿插在数据倾斜优化中考察基础)。是否遇到过数据写错的情况?若数仓数据写入 Kafka 错误,如何修复?➤ 进一步追问:HDFS 数据已错,但 Kafka → 业务表已生效,如何保证一致性与服务可用性?若需从某个 Kafka Topic 消费数据并入库数仓,你会如何设计流程?(开放性问题)🙌 面试感悟虽为实习经历深挖,但问题贴近真实生产场景,尤其关注高可用、数据一致性、容错与恢复机制;对数据链路的闭环理解要求较高,需清楚“从出错到修复”的全链路影响;建议提前准备:✅ 典型数据倾斜解决方案(如加盐、两阶段聚合)✅ Kafka 重放与幂等写入策略✅ 数仓分层中各层容灾与回溯能力设计📌 C端业务对数据质量与系统稳定性要求高,面试更倾向考察“出问题后怎么办”的应急思维。
查看9道真题和解析
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务