11-26 06:02 The University of Sydney 大数据开发工程师发布于澳大利亚

关注

文远知行数据开发/Data Infra 实习一面

自我介绍

项目介绍

Spark：Stage如何切分？
原因？

倾斜原因？
如何解决？

介绍一下概率算法（HLL、CMS）

Flink vs Spark 容错机制、故障恢复机制异同？

Flink 窗口处理迟到机制？除了Watermark呢？

Exactly-once

Ray了解吗？

算法：三个数组各取一个数得到 a, b, c
问：min(|a - b| + |b - c| + |a - c|) length < 1e6

问有排序后 ON 做法吗？

#数据开发##实习#

全部评论

推荐最新楼层

11-29 13:53

北京邮电大学 Java

神策数据面经

三面-两周完成三面流程-后续两周推进oc一面：项目介绍；项目难点介绍；HashMap和TreeMap，安全的Map，锁粒度；ThreadLoacl作用；虚拟内存，映射方式；手撕：实现一个随机访问的集合；long数据存储去重怎么做；位图，16GB内存可以去重多少数据；16 GB = 16 × 2³⁰ Byte= 16 × 2³⁰ × 8 bit= 16 × 2³ × 2³⁰ bit= 2³⁷ bitk个有序链表排序怎么做；取10000个数据的前10个数据怎么做；查看占用CPU最高的进程，有哪些工具可以看；fullGC和MinorGC，G1垃圾回收器，怎么限制进程最大内存；死锁以及出现情景；二面： 50min项目介绍，挑一个项目详细介绍；前端到后端的调用是怎样的；单体项目到微服务项目是怎么转换的，调用方面有什么不同；Get和Post有什么不同；用户验证怎么做的；高并发分布式锁怎么处理；缓存与数据库一致性怎么处理；Redis内存满了怎么处理；RDB和AOF有什么不同；LRU实际应用怎么实现；怎么排查慢响应；索引数据结构，给所有字段加索引行不行；B+树有什么优点；手撕：Z遍历树；三面：20min自驱力怎么体现，详细说明；工作地点怎么选择，有什么期望；分布式数据库怎么设计，有哪些需要关注的点；hr介绍了业务需要钻研，问候选者自身能不能沉得住气；期望薪资；能不能实习；

点赞评论收藏

分享

11-04 16:36

National University of Singapore 大数据开发工程师

【数开实习面经】京东-京东零售（暑期）

面试时间：2025.03面试部门：平台产研timeline：3.5一面，3.10二面，3.12hr面，3.15oc一面（1h）自我介绍，问最早什么时候能来实习JVM内存模型和垃圾回收机制线程和进程的区别一个进程中有三个线程，其中一个线程OOM了，会对其他两个线程造成影响吗？如果会的话有什么影响算法手撕：判断是否是完全二叉树SQL手撕：给定一张订单表，求出近30天内每日订单销量排名前十的省份用过Flink SQL吗？介绍一段实习经历/项目经历，有哪些难点？如何解决的？反问二面（35min）自我介绍讲一个实习/项目中的难点，如何解决的Spark任务提交的运行流程（讲了Spark on YARN的c...

数据开发面经

点赞评论收藏

分享

11-24 19:03

已编辑

门头沟学院数据仓库

数新智能数据开发一面

30分钟 0.自我介绍1.谈了谈有无考公考研的打算2.回归正题 介绍项目（某硅谷的离线实时，还有paimon湖仓）讲了讲ads层指标什么三天登录，用户流向分析之类的，我说这三个项目指标都差不多问了我在哪做的，我说在自己虚拟机上部署的问数据来源，我说是有模拟生成业务库数据和日志数据的jar包，然后讲了一个这两条链路的数据的路径，maxwell，flume,kafka什么的然后问我paimon湖仓 怎么做的  我说paimon湖仓用官方的mysql-paimon的包直接进行同步，代替了maxwell然后我说paimon的snapshot+tag代替了传统离线的拉链表，感觉很方便，问我什么地方做的拉链，我说的用户表，然后我又讲了讲hdfs的小文件，paimon怎么解决的实时写入的小文件问了有没有遇到过什么问题  我说遇到执行任务的时候doris fe节点崩溃，查不到数据，然后我就一直扩大内存，虚拟机也搞得一台25g了3.flink怎么保证数据不丢不重   我答了kafka支持事务，checkpoint记录状态和kafka消费位点，又讲了paimon sink的时候自动清除没有snapshot指向的manifest来删除故障前多读的数据，说了一堆paimon相关的，比如lsm树文件结构，checkpoint时产生snapshot，还有paimon写入文件的大概流程4.数据倾斜  我说的原因就是比如短视频业务下某个视频火了产生热点key，导致某个分区数据特别多，可以用flink的重分区算子，写代码加盐打散，或者自定义kafka的分区逻辑5.sql优化  我说的谓词下推提前过滤，多表join优先join小表，还有starrocks，doris这些olap引擎的CBO优化查询，讲了starrocks物化视图是一个实际读出来的表，可以设置新鲜度来变更读的频率，而且CBO会自动查询sql语句的查询结果是不是某个物化视图的子集，以此来优化，然后这些引擎底层也会帮我们做些优化。6.问我知道paimon的结构化非结构化数据的存储格式吗    不知道，没接触过6.1讲一下什么是湖仓一体 我说是湖的各种数据都能存和仓的规范的，规定好字段名，类型等元数据便于分析的能力的结合，我自己又说了一些什么schema on write，read之类的7.问我还知道什么数据湖技术  我说iceberg，hudi 区别我之前看过，但是忘了，我就记得paimon和flink的集成比较好，比较亲儿子，然后就没问了8.怎么看现在很多人都投身大模型行业   我说的感觉很正常，因为这个ai本身看着就很吸引人（）8.1我说我用过那个阿里云的data什么，面试官说dataworks是吧，就是我们之前做的，问我还用过什么，我说阿里云的flink,fluss都用过，也用过神策，然后面试官讲了讲他们的产品8.2说了说我做过的其他东西，我说我搭建过网站，做过抖音小游戏但是上架太麻烦（）9.英语好不好  我答：半废   面试官说那海外业务就不考虑你了10.怎么看data+ai （因为我简历上写了了解data+ai）我说的就是从前我们用个什么库只能对文字完成基本情感的正负分析，而引入了大模型就可以做出更精确的判断，比如用在用户直播间识别弹幕给主播提建议，或者金融行业智能agent检测到风险实时邮件通知之类的反问 15分钟1.flink现实市场上用的多不多2.paimon这类数据湖到底用的多不多当时忘录音了（），有的问题记不清了整场面试也是又说有笑，面试体验给到夯（）🤠🤠🤠

查看21道真题和解析

点赞评论收藏

分享

11-18 21:47

National University of Singapore 大数据开发工程师

【秋招数开面经】哈啰

面试时间：2025.10面试部门：数科事业部timeline：09.29投递，10.21一面，10.23二面，11.03HR面，11.05意向一面（1h）自我介绍实习经历中的监控体系详细说明（20min）讲一个你负责的需求，并说明有哪些难点（10min）hive中外部表和内部表的区别hive中order by/sort by/distribute by/cluster by的区别什么是数据倾斜问题如何解决数据倾斜问题sql题：给一张用户还款表，字段有id，还款时间，还款金额求每个用户的总还款金额求每个用户截止到当日的累计还款金额反问2025.10.23 二面自我介绍实习内容介绍实习过程中遇到的...

查看17道真题和解析

点赞评论收藏

分享

11-26 00:34

江汉大学大数据开发工程师

商汤数开一二三面

一面： 自我介绍拷打实习询问慢sql怎么解决DQC怎么保证手撕golang 写mapreduce流程二面：自我介绍拷打实习二面很简单 基本上没有八股 问一下实习经历三面：自我介绍拷打实习linuex命令docker命令shell脚本编写

查看8道真题和解析

点赞评论收藏

分享

评论

1

2

招聘动态

成方金融科技有限公司

MiniMax

全站热榜

更多

华为开奖交流

热聊中

创作者周榜

更多

正在热议

更多

# 十二月请对我好一点 #

5250次浏览 126人参与

# 父母对你找工作是助力还是阻力？ #

1739次浏览 47人参与

# 工作中出现了XX情况正常吗 #

6439次浏览 86人参与

# 为了去实习，我赌上了___ #

1605次浏览 31人参与

# 哪一瞬间让你觉得“这班不如不上” #

1749次浏览 20人参与

# 聊聊我眼中的AI #

484120次浏览 6696人参与

# 一人推荐一个值得做的项目 #

2372次浏览 43人参与

# 高薪高压 vs 低薪wlb，你怎么选？ #

3146次浏览 39人参与

# uu们，春招你还来吗？ #

1758次浏览 21人参与

# 公司福利里最没用的一项是啥 #

2294次浏览 53人参与

# 工作前VS工作后，你的心态变化 #

3218次浏览 31人参与

# 回顾今年你干过的最“勇”的一件事 #

4051次浏览 62人参与

# 秋招有哪些公司要求提前实习 #

90869次浏览 481人参与

# 机械人的金三校招总结 #

38852次浏览 465人参与

# 职场上哪些事情令人讨厌 #

32089次浏览 142人参与

# 追觅科技求职进展汇总 #

28841次浏览 181人参与

# 应届生，你找到工作了吗 #

90866次浏览 570人参与

# 2023届毁约公司名单 #

228559次浏览 1056人参与

# 美团秋招笔试 #

176308次浏览 1000人参与

# 哪些公司真双非友好？ #

49169次浏览 227人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务