达不溜季

09-02 16:34 字节跳动_生活服务_大数据开发实习生(实习员工)

发布于北京

关注

字节大数据开发跨部门转正

一面（8.27）

实习内容

还在职吗

实习期间主要干什么

和你对接的同学有哪些

产运和算法同学怎么使用你产出的数据

数据集底层用什么技术栈

你写SQL任务的时候是怎么优化代码的，写代码的时候哪些地方需要注意

有自己搭建过看板吗

知道SLA基线吗，有主动了解过吗

大数据技术问题

一个spark任务怎么优化

发现写好的spark任务运行的很慢要怎么办

数据倾斜怎么处理

如果任务在读文件的时候运行很慢怎么办

内存利用率过低怎么办

CPU利用率过低怎么办

你经常用的spark参数还有哪些

table
有字段id user_id_list device_id_list app_id_list
写一段SQL将三个列表中的元素展开，并且元素需要一一对应（user_id_1 对应 device_id_1 对应 app_id_1）
最后的结果应该是id user_id device_id app_id的形式

这个SQL写完的结果数据量会变多吗

二面（8.29）

实习内容

还在职吗

有独立做过需求吗

做过最难的需求是什么

你处理的数据量有多大

有接过实时的需求吗

Flink了解多少

有主动钻研过数据领域的技术吗

保障过SLA基线吗

保障SLA基线要从哪方面着手

生服这么缺人力为什么要跨部门转正呢

场景题

如果一周给你定容了三个需求，你会怎么排期呢

如果你排期完成后，发现自己判断失误，这个需求在原定排期内做不完，你会怎么办

你觉得保障SLA基线最困难的点在哪里

table
两个字段 a b   代表了a关注了b
写一个SQL找到相互关注的用户（尽量高效）

table
student_id  course  score
1           语文     78
找出单个学科成绩第三名的同学的ID，总成绩和总成绩的全班排名

table
date        people
2025-08-01  141
2025-08-02  35
日期是主键，people代表当日人流量
找出连续三天人流量>100的date

三面（8.30）

实习内容

还在职吗

你实习做过最难的需求，难在哪里

口径都是谁定的

你负责这块业务，团队的关注点在哪里

你负责这块业务每日gmv多少

你处理的数据量多大

你怎么做数据探查的

场景题

你和产运同学，DS同学是怎样的合作模式

这个合作模式你觉得优点是什么，缺点是什么

你的职业规划

你是北方人，为什么去湖南读大学

为什么高考志愿选择计算机

为什么选择做数据

你平时喜欢逛什么社区

有看什么书吗

大数据技术问题+计算机基础知识

HA高可用

zookeeper是什么

HDFS是什么架构

MapReduce的过程讲一下

三次握手四次挥手

进程和线程的区别

线程的通信安全是如何保障的

AI了解过吗

GPT 5刚发布，比上一代做出了哪些优化呢

table1 
id user_id 这两个字段为联合主键
table2
id order_id 这两个字段为联合主键
写一段SQL，求出id,user_id_cnt,order_id_cnt（效率越高越好）

hr面（9.1）

唠嗑

还在职吗

实习学到了什么

你有在面其他公司吗

假如你有多个offer，你选择的标准有哪些

实习遇到最大的困难是什么

相比校招生，你的优势在哪里，缺点又是什么

base意向

意向（9.2）

-----------------------------------------------------------------------------------------------

意向之后就有了更多时间，根据自己的学习进度，后面可能会做一些大数据技术栈的分享吧。

全部评论

推荐最新楼层

zhiyog

美团_前端(实习员工)

为什么每个人都问：还在职吗？字节ssp佬

1 回复分享

发布于 09-04 14:45 北京

09-05 18:00

南京大学 Java

秋招阶段性总结

本着精投的想法，8.10投了一批，8.26投了一批，目前为止共投递十余家互联网公司。一开始以为凭借自身双9+两段大厂的优势能够拿到大量的面试，需尽可能保证面试通过率。然而事实恰恰相反，给面的大部分都能通过，但70%的投递都石沉大海，拿到的面试寥寥无几...已投递：腾讯：8.25 teg云架平存储一面，kpi面，全答后挂；9.3混元一面，官网流程变复试，尚未约二面淘天：暑期测评挂，秋招无缘阿里云：大概率同淘天，无消息阿里国际：9.4一面，未出结果蚂蚁：笔试完无动静虾皮：笔试ak，9.5约一面京东：8.19一面 8.21二面 9.2线下hr面后挂（一生黑，三场面试全部相谈甚欢结果hr面莫名其妙挂掉，至今问不到原因）快手、滴滴、联想、tme、pdd、百度、饿了么、阿里控股：简历评估中，无消息未投递但走了流程的：美团：转正流程中，结果未知字节：7.30hr主动把我暑期实习的简历捞起并加微信约面，8.7一面 8.12二面 8.19三面 8.28hr面 一周后意向不知道为啥今年秋招开的格外早，也不知道是因为投晚了还是自身简历确实缺少竞争力，大部分投了就是石沉大海。说来也是讽刺，唯一的意向来自于我并未投递的字节。挺感谢它的，要不是早早的主动拉我约面，我大概率也会在八月份才不紧不慢的开投，最后因为池子已满被卡在简历评估状态吧只能说秋招现在越来越癫了明明是9月初，居然连面试都寥寥无几，很多公司都像是招满了似的奉劝27的各位一定要早投+海投，至少先拿到保底意向，之后心态方面都会好很多

墨西哥大灰狼：HR看到🐗神简历直呼留不住，RD看到🐗神简历不敢发起面试了

点赞评论收藏

08-27 11:07

东北林业大学大数据开发工程师

字节数据开发一面

开头聊实习，项目八股：知道数据倾斜吗？说一下mapreduce工作原理spark了解吗怎么判断一个sql需要优化应该怎么去写一个高效的sql那些操作可能会导致数据倾斜手撕：两个字段的sql表，一个关注者，一个粉丝，找出互相关注的行，去重后返回

查看7道真题和解析

点赞评论收藏

09-04 10:42

门头沟学院数据仓库

数据开发高频面试题

场景优化方面：怎样解决数据倾斜的，主题域的划分，数仓分层的作用；你是如何进行数据同步的大数据组件八股：了解到什么大数据组件，分别有什么作用；HDFS怎么读取文件；spark宽窄依赖sql方面：手撕或者口述连续登录思路；留存率问题；简单点就是两表连接

查看10道真题和解析

点赞评论收藏

09-02 07:45

门头沟学院大数据开发工程师

腾讯 WXG 数据开发一面挂面经

问获取电池电量信息后，spark怎么计算平均耗电（？）速率上来第一个问题，我没重视随便答了一下用DataFrame存储，然后用SparkSQL处理，计算差值什么的（感觉应该是不太满意）问做过什么，简单介绍了一下项目（Spark模拟点击流近似去重），很简单的小项目没细问手撕算法三元组 （暴力出奇迹（？））然而要写int main，但是给的数据是leetcode风格（即输入为一个数组num = []）问了问让手写硬编码跑一个样例SQL不太熟 :(在练了在练了.jpg反问：建议（多学多练，找个实习，学个java（而不是cpp，我补充cpp只是打比赛/做题，开发用的python，没理我QAQ））公司有...

查看8道真题和解析

点赞评论收藏

09-01 16:09

门头沟学院 Java

兄弟们，美团是真不看笔试啊，30号笔试的时候和b站笔试冲突了，想了想美团可以顺延还是做了b站的，结果今天看了一下直接免笔试了😂

自来熟的放鸽子能手面...：不看，0 0 0照样一周意向

投递美团等公司10个岗位

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 面试被问“你的缺点是什么?”怎么答 #