知乎 大数据开发工程师 面经

一面:

感觉一上来就是主管面,主业务面,考验业务能力和沟通能力

介绍下专业的课程,说说最喜欢哪一门,为什么

直接问实习经历

实习中的项目,扣细节(大部分时间都在问这个)

在同程做了什么业务

广告业务数仓负责哪些东西

广告投放的指标,如曝光、转化等等

广告有哪些类型

聊聊广告投放流程,投前、投中、投后

投中的过程每一轮具体的事情

对比hive和spark

为什么业界都用spark不用mr了

聊聊flink(不大熟)

反问

总结:主管真的很亲和,感觉沟通很流畅,一直在引导我,非常有领导风采

快大半个月没动静了,应该没了

#知乎##面经##数据研发#
全部评论
今天面得吗?
1 回复 分享
发布于 2023-04-20 19:30 陕西
一共几面啊
1 回复 分享
发布于 2023-04-20 19:24 重庆

相关推荐

09-07 10:54
南开大学 Java
📍面试公司:知乎🕐面试时间:9月7号💻面试岗位:后端开发❓面试问题:**一、八股**1. Java中AQS的实现原理和应用场景2. JVM中类加载器的双亲委派机制及其打破方式3. Spring事务传播机制及其底层实现4. MySQL的间隙锁和临键锁的区别5. Redis的Stream数据类型及其在消息队列中的应用6. 分布式系统中的BASE理论具体指什么7. Kafka如何保证Exactly-Once语义8. 如何设计一个分布式系统的服务注册发现机制9. 什么是DDD领域驱动设计10. Java中强引用、软引用、弱引用的区别11. 数据库连接池的监控指标有哪些12. 如何实现分布式系统的灰度发布13. 什么是服务网格的遥测技术14. 如何设计一个高性能的分布式计数器15. 谈谈你对事件溯源模式的理解**二、项目**1. **苍穹外卖项目**:- 分布式锁在订单系统中的具体实现方案- 如何设计商户端的权限管理系统2. **黑马点评项目**:- 评论系统的分词和敏感词过滤如何实现- 用户行为日志的收集和分析方案**三、手撕**1. 力扣79.单词搜索:给定一个m×n的二维网格和一个字符串单词,判断单词是否存在于网格中- 思路:回溯算法,深度优先搜索,注意剪枝和visited标记2. 力扣48.旋转图像:给定一个n×n的二维矩阵,将其顺时针旋转90度- 思路:先对角线翻转再水平翻转,或者直接计算新位置
查看21道真题和解析
点赞 评论 收藏
分享
09-09 20:08
产品经理
📍 公司:虾皮(Shopee)💼 岗位:大数据开发工程师📅 面试时间线:7.30 一面8.4 二面8.8 收到感谢信(未通过)面试问题记录请介绍你实习中负责的数仓数据流向及核心业务场景。详细说明一个具体业务模块,包括所用技术栈与上下游用户。针对问题2中的业务,如何处理并发场景下的“不可重复读”问题?大数据技术栈掌握情况?重点提问 Spark 的使用经验。如何优化实际 Spark 任务?请举例(如数据倾斜、Shuffle 优化)。描述快速排序算法的基本思想(穿插在数据倾斜优化中考察基础)。是否遇到过数据写错的情况?若数仓数据写入 Kafka 错误,如何修复?➤ 进一步追问:HDFS 数据已错,但 Kafka → 业务表已生效,如何保证一致性与服务可用性?若需从某个 Kafka Topic 消费数据并入库数仓,你会如何设计流程?(开放性问题)🙌 面试感悟虽为实习经历深挖,但问题贴近真实生产场景,尤其关注高可用、数据一致性、容错与恢复机制;对数据链路的闭环理解要求较高,需清楚“从出错到修复”的全链路影响;建议提前准备:✅ 典型数据倾斜解决方案(如加盐、两阶段聚合)✅ Kafka 重放与幂等写入策略✅ 数仓分层中各层容灾与回溯能力设计📌 C端业务对数据质量与系统稳定性要求高,面试更倾向考察“出问题后怎么办”的应急思维。
查看9道真题和解析
点赞 评论 收藏
分享
评论
10
31
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务