字节大数据开发跨部门转正

一面(8.27)

  • 实习内容

还在职吗

实习期间主要干什么

和你对接的同学有哪些

产运和算法同学怎么使用你产出的数据

数据集底层用什么技术栈

你写SQL任务的时候是怎么优化代码的,写代码的时候哪些地方需要注意

有自己搭建过看板吗

知道SLA基线吗,有主动了解过吗

  • 大数据技术问题

一个spark任务怎么优化

发现写好的spark任务运行的很慢要怎么办

数据倾斜怎么处理

如果任务在读文件的时候运行很慢怎么办

内存利用率过低怎么办

CPU利用率过低怎么办

你经常用的spark参数还有哪些

  • SQL

table
有字段id user_id_list device_id_list app_id_list
写一段SQL将三个列表中的元素展开,并且元素需要一一对应(user_id_1 对应 device_id_1 对应 app_id_1)
最后的结果应该是id user_id device_id app_id的形式

这个SQL写完的结果数据量会变多吗

二面(8.29)

  • 实习内容

还在职吗

有独立做过需求吗

做过最难的需求是什么

你处理的数据量有多大

有接过实时的需求吗

Flink了解多少

有主动钻研过数据领域的技术吗

保障过SLA基线吗

保障SLA基线要从哪方面着手

生服这么缺人力为什么要跨部门转正呢

  • 场景题

如果一周给你定容了三个需求,你会怎么排期呢

如果你排期完成后,发现自己判断失误,这个需求在原定排期内做不完,你会怎么办

你觉得保障SLA基线最困难的点在哪里

  • SQL
table
两个字段 a b   代表了a关注了b
写一个SQL找到相互关注的用户(尽量高效)
table
student_id  course  score
1           语文     78
找出单个学科成绩第三名的同学的ID,总成绩和总成绩的全班排名
table
date        people
2025-08-01  141
2025-08-02  35
日期是主键,people代表当日人流量
找出连续三天人流量>100的date

三面(8.30)

  • 实习内容

还在职吗

你实习做过最难的需求,难在哪里

口径都是谁定的

你负责这块业务,团队的关注点在哪里

你负责这块业务每日gmv多少

你处理的数据量多大

你怎么做数据探查的

  • 场景题

你和产运同学,DS同学是怎样的合作模式

这个合作模式你觉得优点是什么,缺点是什么

你的职业规划

你是北方人,为什么去湖南读大学

为什么高考志愿选择计算机

为什么选择做数据

你平时喜欢逛什么社区

有看什么书吗

  • 大数据技术问题+计算机基础知识

HA高可用

zookeeper是什么

HDFS是什么架构

MapReduce的过程讲一下

三次握手四次挥手

进程和线程的区别

线程的通信安全是如何保障的

AI了解过吗

GPT 5刚发布,比上一代做出了哪些优化呢

  • SQL
table1 
id user_id 这两个字段为联合主键
table2
id order_id 这两个字段为联合主键
写一段SQL,求出id,user_id_cnt,order_id_cnt(效率越高越好)

hr面(9.1)

  • 唠嗑

还在职吗

实习学到了什么

你有在面其他公司吗

假如你有多个offer,你选择的标准有哪些

实习遇到最大的困难是什么

相比校招生,你的优势在哪里,缺点又是什么

base意向

意向(9.2)

-----------------------------------------------------------------------------------------------

意向之后就有了更多时间,根据自己的学习进度,后面可能会做一些大数据技术栈的分享吧。

全部评论
为什么每个人都问:还在职吗?字节ssp佬
1 回复 分享
发布于 09-04 14:45 北京
所以生服这么缺人力为什么跨部门转正
点赞 回复 分享
发布于 09-12 08:36 上海
太牛了
点赞 回复 分享
发布于 09-10 15:40 北京

相关推荐

bg 9本硕,某团暑期实习。记录一下80分钟:5分钟1. 自我介绍35分钟2. 了解实习经历3. 针对实习项目,问数据层次怎么分层4. 数据分层的作用5. 针对具体实习项目,说明业务逻辑6. 说明实习项目的“订单量”这个指标从源头到产出的ETL过程7. 针对实习项目,复盘后最大的难点是什么8. 复盘之后有什么收获9. 你刚才说复盘收获是处理小文件,那么spark怎么处理小文件的?10. 处理小文件有哪些方法,举例子11. hive冷热分离的方法12. 你刚才提到了组里有做ec存储,你了解ec存储吗13. 暑期实习有什么感受,转正了吗15分钟14. 了解spark的semi join吗,他是干嘛的15. 了解spark的AQE,这是什么16. 你刚才讲AQE提到了广播机制,这个在spark中很重要,讲讲广播过程呢17. 了解网络吗?讲讲三次握手和四次握手区别。18. 了解数据结构吗?讲讲O(nlog n)的不稳定排序算法。20分钟两个编程题:Q1.求开方:给定num=5.79,error=1e-8,求x使得abs(x^2-num)<error19. 先讲讲思路吧,有什么思路:二分O(log n)20. 刚开始没做出来,面试官提示了下细节21. 后面二分法做出来了,面试官说那如果num小于1有什么变化呢22. 面试官问还有什么方法吗:牛顿下山法23. 公式写上去,但是面试官不关心公式,关心原理:会无限逼近24. 如果是三次方四次方,牛顿下山怎么用呢,公式会变的Q2.1TB的int类型数据怎么在512MB的虚拟机中求中位数25. 已经70分钟了,没时间了,没要求写代码,只要讲思路:外部排序,归并思想26. 面试官问还有什么方法吗:没想到了,但是后面搜了下有分布式排序,mapreduce排序等,估计想让我回答spark相关的,但是真不知道。5分钟反问27. 反问业务、作息、感受:都是套话28. 反问可以提升的点、我的不足:涉及到应聘者的评价,不能说。29. 谢谢面试官勒,吃饭去咯。
查看26道真题和解析
点赞 评论 收藏
分享
评论
6
17
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务