字节大数据开发跨部门转正
一面(8.27)
- 实习内容
还在职吗
实习期间主要干什么
和你对接的同学有哪些
产运和算法同学怎么使用你产出的数据
数据集底层用什么技术栈
你写SQL任务的时候是怎么优化代码的,写代码的时候哪些地方需要注意
有自己搭建过看板吗
知道SLA基线吗,有主动了解过吗
- 大数据技术问题
一个spark任务怎么优化
发现写好的spark任务运行的很慢要怎么办
数据倾斜怎么处理
如果任务在读文件的时候运行很慢怎么办
内存利用率过低怎么办
CPU利用率过低怎么办
你经常用的spark参数还有哪些
- SQL
table 有字段id user_id_list device_id_list app_id_list 写一段SQL将三个列表中的元素展开,并且元素需要一一对应(user_id_1 对应 device_id_1 对应 app_id_1) 最后的结果应该是id user_id device_id app_id的形式
这个SQL写完的结果数据量会变多吗
二面(8.29)
- 实习内容
还在职吗
有独立做过需求吗
做过最难的需求是什么
你处理的数据量有多大
有接过实时的需求吗
Flink了解多少
有主动钻研过数据领域的技术吗
保障过SLA基线吗
保障SLA基线要从哪方面着手
生服这么缺人力为什么要跨部门转正呢
- 场景题
如果一周给你定容了三个需求,你会怎么排期呢
如果你排期完成后,发现自己判断失误,这个需求在原定排期内做不完,你会怎么办
你觉得保障SLA基线最困难的点在哪里
- SQL
table 两个字段 a b 代表了a关注了b 写一个SQL找到相互关注的用户(尽量高效)
table student_id course score 1 语文 78 找出单个学科成绩第三名的同学的ID,总成绩和总成绩的全班排名
table date people 2025-08-01 141 2025-08-02 35 日期是主键,people代表当日人流量 找出连续三天人流量>100的date
三面(8.30)
- 实习内容
还在职吗
你实习做过最难的需求,难在哪里
口径都是谁定的
你负责这块业务,团队的关注点在哪里
你负责这块业务每日gmv多少
你处理的数据量多大
你怎么做数据探查的
- 场景题
你和产运同学,DS同学是怎样的合作模式
这个合作模式你觉得优点是什么,缺点是什么
你的职业规划
你是北方人,为什么去湖南读大学
为什么高考志愿选择计算机
为什么选择做数据
你平时喜欢逛什么社区
有看什么书吗
- 大数据技术问题+计算机基础知识
HA高可用
zookeeper是什么
HDFS是什么架构
MapReduce的过程讲一下
三次握手四次挥手
进程和线程的区别
线程的通信安全是如何保障的
AI了解过吗
GPT 5刚发布,比上一代做出了哪些优化呢
- SQL
table1 id user_id 这两个字段为联合主键 table2 id order_id 这两个字段为联合主键 写一段SQL,求出id,user_id_cnt,order_id_cnt(效率越高越好)
hr面(9.1)
- 唠嗑
还在职吗
实习学到了什么
你有在面其他公司吗
假如你有多个offer,你选择的标准有哪些
实习遇到最大的困难是什么
相比校招生,你的优势在哪里,缺点又是什么
base意向
意向(9.2)
-----------------------------------------------------------------------------------------------
意向之后就有了更多时间,根据自己的学习进度,后面可能会做一些大数据技术栈的分享吧。