hertz_24 level
获赞
3
粉丝
1
关注
12
看过 TA
23
邢台市第二中学
2026
大数据开发工程师
IP属地:辽宁
峡谷乱斗君忠实粉丝
私信
关注
前两个流程一面挂,三面挂,加起来九面终于拿下了数开岗,终于有个稍微好一点的部门了求求其他的也给我泡出来吧,26秋招对我好一点--timeline一面 9.22二面 9.24三面 9.26hr面 10.10加面 10.16oc 10.22意向 10.28--附面经-------------------------------------一面(常规八股+项目深挖+coding)--项目(15+10min)1.拷问比较深,两个都问了一下--八股1.谈谈hadoop生态的理解(又问了nn,小文件,mr有几次归并排序)2.groupingset和cube的区别3.sql提交到hive的解析过程4.hive数据类型有哪些5.spark数据倾斜6.Spark AQE特性7.三次握手四次挥手8.网络传输的七层架构--手撕1.算法:最长连续无重复子字符串长度2.sql:连续登陆--简单唠会嗑-------------------------------------二面(+1,50min,没记太全)--项目拷问(15min+5min)--八股1.数据倾斜2.spark与mr区别3.count distinct优化4.数仓分层意义5.场景:结合订单过程,设计事实表6.checkpoint7.反压-------------------------------------三面(+2,70min,开放问题较多,考的比较广泛)--数分&数产1.数据分析师常用的分析方法?2.埋点定义的核心3.数据采集通用的属性(埋点公参)4.指标定义怎么做?5.一个业务过程的不同阶段应该看什么数?6.做数据看板的关键7.数据看板不同的数据内容怎么摆放(提示了一下产品动线)--数据研发1.app层的需求过来之后怎么理解和解决2.如何理解数仓模型重构3.怎么从业务中抽取维度和事实4.数仓模型好坏怎么衡量5.Shuffle的oom6.jvm7.服务器cpu满了怎么排查8.java读写数据库9.java调用api--数据挖掘1.python中常用机器学习包有哪些2.随机森林算法原理--智力1.小球称重问题--手撕1.汉诺塔(又出了一道字符串,我说考过了,换成这个了)--反问1.字节的中台架构-------------------------------------hr面(40min)1.自我介绍2.项目介绍3.优缺点,举例说明4.优先级怎么分5.手上意向-------------------------------------加面(+3,40min,场景题)1.clickhouse2.行式存储和列式存储的区别3.数据如何反哺业务4.如何理解业务数据化和数据业务化5.场景题1:视频+点赞数,设计一个架构(不限于数仓)6.场景题2:功能上线之后,请以分析师/dpm的角色设计指标体系--反问1.数据业务化怎么做?2.ai落地场景?
如果秋招能重来,我会__...
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务