字节九面挂面经(算法岗)，持续更新

#互联网回暖，字节要招4000+人# 刚告诉我简历又被锁了，估计又要打复活赛了。这下面试爷是不虚了，爱过不过去****，反正过不过也不在于我，继续拷打字节。
就当面着玩了以后，趁还记得一些把之前面试的面经写一下回馈给牛油们，我也不算浪费时间。

7.22
某缺人部门海招ByteIntern，当时很多人都接到电话了，当时我也没面试过寻思就当练手了。后来才知道字节一直保留面评，当时要是知道就不面了。这一面个人觉得是最难的。
Transformer经典八股：
·Transformer结构
·手写自注意力然后问我Q,K,V的线性变换矩阵能不能共享权重，这个我现在也不知道能不能，问同学说能问GPT4说不能。
·为什么÷sqrt(dk)
·多分类损失函数 ——交叉熵；交叉熵里每一项的意义是什么？
·讲一下Adam优化器的原理以及优化过程
·八股记不得了，手撕lc84，面了快40次唯一一个考hard的

8.5 第二面(ByteIntern一面)
还是ByteIntern，当时是在官网随便投的，没想到被看到了。部门是做AI评估音乐的，一面面试官说因为看到我简历上钢琴10级适合以及我本来就是做声学AI算法的感觉非常合适。
·问了点声学的知识，可能参考意义不大。梅尔频谱怎么来的，MFCC怎么来的，他们什么关系
·还是Transformer，自注意力。问了一个cross attention，我当时都没听说过这啥，面完赶紧补习了一下，后来百度二面也问了。
·BERT和Transformer区别
·TTS相关的，FastSpeech和Tactorn区别。这个不是做语音合成、语音大模型相关的应该也没啥参考的
·手撕，手写一个带通滤波器对特定频段的声音加强；最长无重复子字符串

8.8 第三面(ByteIntern二面)
没太问八股
·怎么评价生成式模型生成的音乐（我项目里有一个用diffusion生成音乐的）的好坏
·KL散度
·Linux熟悉吗？我说我就会cd mkdir rm -rf
剩下的不记得了
·手撕，括号字符串是否合法，栈秒了

然后告诉我要加面，我可去你...
接下来的两轮技术面一轮是业务场景题，一轮是一个酷似《狂飙》里蒋天的人给我讲了一堆入职之后的事就没了，然后是HR面，就这么ByteIntern前后面了一个月后顺利“通过”了。期间我还面了网易的推荐算法实习，也过了，但是因为这个ByterIntern已经告诉我准备入职了我就推掉了....
然后offer审批了两周，字节HR打电话告诉我说那边说因为这是能转正的实习，看的表现符合预期但没有超出预期，所以没审核通过。我可阐释你的梦啊，生怕我转正是吧。
ICASSP截稿9.9，正好实验做完了，那几天光速写了一篇，反正就4页，快得很。

然后9.3被正式批捞了，一个叫用户增长（User Growth）的部门，我也不知道干啥的，去校招网站看会数据结构机器学习深度学习这些就行，那就面呗。HR加我微信问：&quot;同学我看你都六面了啊而且面评也不错的，怎么回事啊？&quot;是啊，怎么回事啊，你们企业传统艺能你都不知道吗？不过这回效率倒是快，秒锁我简历，我本来正和国际音乐那边的聊得不错准备内推我，结果发现已经被用户增长锁了，锁完就约面。

9.5 第七面（正式校招岗一面）
估计是看我之前算法八股考差不多了，开始考我数据结构啥的了
·知道哪些排序算法？时间复杂度都是多少
·哪些是空间换时间的排序算法？
·栈和堆的区别
·泊松分布和γ分布的区别（？woc开始考数学了）
·β分布和γ分布的关系
·卡方分布和γ分布的关系
·softmax公式
·AUC，机器学习里样本不均衡怎么解决，二分类的话如果负样本过多对AUC有什么影响，sigmoid的平均值会怎么变
·手撕，最大子数组乘积，lc152

9.6第八面（正式校招岗二面）
这面我了个大草啊，拷打半天数学。
·线程和进程的区别（我草你就那么确定我学过OS吗，这真是我自己好奇自学的）
·C语言里临时变量怎么存的，全局变量怎么存的，临时变量可以用指针指向吗？我就记得当时学CASPP的时候临时变量是放栈里全局变量是放堆里，栈里的物理地址总变我估计是不能用指针指的，我就这么说的。
·手撕，给定先序遍历和中序遍历，输出后续遍历，递归秒了。
然后面试官直接放弃繁文缛节了，开始我面试以来最汗流浃背的一小时：“我看你学数学的，我得看看你数学基础怎么样”
这一部分参考意义其实不小，我PDD二面也考了贝叶斯估计，现在偏机器学习算法岗的岗位会有考
·多项式方程，怎么写程序求解？直接懵了，这我把大二学数值代数的知识回想起来了，最后说出来牛顿迭代法，记忆恢复20%。好在没让我动手实现一个
·抛硬币，直到抛出两次正面停止，预计要抛多少次（求期望）。本来我信誓旦旦的写了一个求期望的级数，准备用级数求和再不济用高中的错位相减算，结果写到5次的时候汗流浃背了，发现这个表达式太难写了。最后努力回忆起上辈子的记忆用马尔科夫状态转移算求出来了。答案是6次，具体怎么算牛油们查一下就找到了，挺经典的题。
·抛10次硬币，4次正面，6次反面，求抛出正面的概率p的极大似然估计。我上早八，我都多少年没算过这东西了，开始边胡诌边说了，我说我记得这玩意是无偏估计....诶，无偏估计，那这东西算出来最后应该是2/5...最后倒果为因，从结果倒推推出来了极大似然估计的式子算出来了

9.11第九面（正式校招岗三面）
·lc31 下一个排列
·二分类问题的损失函数。为什么是BCE？表达式是什么，为什么是这个形式？
答：因为交叉熵是凸的，好优化；另外交叉熵和KL散度之间差了个目标分布的熵，优化BCE就是减小KL散度，让预测分布和目标分布差距减小。面试官连连称好虽然没有luan用
表达式一开始写完少写了个符号，提醒我之后写出来了。

9.12因风格不融洽（nm$l），三面挂，我去问了一下之前国际音乐的HR能不能给我推进进程，她告诉我发现我又被锁简历了，这次是机器学习算法岗的，哥们又要打复活赛了。这回爱过不过，全当去给牛油们更新热乎的面经了。

全部评论

推荐最新楼层