深圳飞未云科数据工程师面经

#数据人offer决赛圈怎么选##秋招的第一个offer,大家都拿到了吗##数据开发面经##数据开发工程师实习#
一面
1.项目拷打
2.讲讲项目中重要的表
3.数据清洗是怎么做的
4.Spark中Driver和Execture,如果要计算比较大的表应该怎么分配内存
5.如果我要广播一个100M的表我应该考虑哪些内容?
6.Spark中默认广播大小是多少
7.讲讲宽窄依赖
8.宽依赖算子
9.map跟mapPartition的区别
10.hive中动态分区跟静态分区写入数据的区别
11.flink一致性语义是怎么做的
12.flink怎么处理迟到数据
13.如果迟到1 2 个小时的数据,应该怎么处理
14.水位线有哪几种?
15.SQl题目 求出至少连续3次出现的数字
16.项目中收获最大的是什么
17.工作场景中,作为新人遇到一些问题,该怎么解决
18.如果很多需求方都来需求,任务很紧急该怎么办
19.反问
HR面
1.#牛客AI配图神器#技术是学校课程还是自学的?
2.往数据开发方向学习的原因
3.java跟python的区别
4.对数据工程师岗位的理解
5.对那个项目理解比较深?
6.项目主要做的工作有哪些
7.项目比较耗费时间的事情是什么?
8.项目中的困难点
9.做项目中的成就感有哪些
10.为什么选择深圳
11.对实习有什么期望和想法
12.目前投简历大概多长时间了
13.反问
全部评论
HR面挂了
1 回复 分享
发布于 07-15 16:55 辽宁
哥们一面到hr面隔了多久呀
点赞 回复 分享
发布于 07-18 18:57 广东
sql是手撕们,还是说个思路
点赞 回复 分享
发布于 07-18 15:09 上海
有点难啊,佬这是暑期实习还是秋招
点赞 回复 分享
发布于 07-16 22:45 广西

相关推荐

数开岗,面的非常愉快一开始先介绍了面试流程1.自我介绍,挑实习经历讲一讲2.代码手撕3.八股考察4.QA环节直接介绍实习经历,没有自我介绍,讲了10分钟开始手撕。1.数据是真实数据吗2.来源系统是同一个系统吗了解了一下主要做的项目数据来源手撕:问了下比较熟的编程语言(java)连续子数组最大和多少知道虾皮是干嘛的吗SQL  求销量表,每个类别下售量TOP10的商品id排名连续怎么做衣服这一品类数据量特别多,导致数据倾斜怎么处理,只针对这一场景处理(二次聚合)给谁加随机值,怎么加,举例还有别的方法吗,只针对这个情景(压缩)你知道spark有做这件事吗(压缩)自己工作中会开这个配置吗spark和flink哪个比较熟,或者其他组件哪个学的好,可以自己挑个熟悉的来讲,还是随便挑个问1.flink状态后端知道哪些2.讲一下checkpoint是在干嘛3.如果状态后端是Rocksdb,checkpoint是怎么存的4.一个算子是怎么知道自己该做checkpoint5.从checkpoint恢复的时候,怎么做的6.一个算子,怎么知道恢复时应该读哪份文件7.看过checkpoint文件里面的结构吗8.有遇到过从checkpoint恢复时失败,是由于算子找不到从哪恢复的问题吗spark方面的问题1.executor, 他的内存分成几部分?堆内堆外内存区别为什么会有堆内堆外内存2.在shuffule的过程中,这几部分是否/如何参与其中3.节点0OM,我有哪些方法或者配置,去优化?最后反问总结,面试官全程态度超好,一直在说别着急,没问题,会有正反馈,体验最好的一次面试
查看29道真题和解析
点赞 评论 收藏
分享
评论
4
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务