26届秋招算法岗面经|字节推荐算法
timeline:
9.30 一面,2小时后通知通过
10.10 二面,第二天通知通过
10.21 三面,2小时后通过
10.22 hr面,电话十分钟问了下offer情况,然后走offer审批
10.27 收到意向
一面
1. 算法题:
1. 312. 戳气球
2. 多头自注意力
2. 八股:
1. transformer为什么要除以根号dk
2. pre norm和post norm分别适用于哪些场景?
3. 实习相关
1. 为什么不用tranformer decoder做序列生成
2. 用户侧和广告侧用到了哪些特征?
3. 如果考虑用户历史行为序列,如何加入做特征交叉
4. 如何做可导sample
5. 两个模块的分数,如何融合在一起做infer
二面
1. 算法题:322. 零钱兑换
2. 实习项目相关
1. 一价计费满足激励兼容吗?
2. GSP和VCG中的效用和社会福利分别代表什么含义?
3. regret net如何保证激励兼容?
4. 扰动的范围对结果有哪些影响?
5. 如何设计机制来保证激励兼容?
6. 机制设计经历了哪几个阶段的模型发展?DeepGSP是怎么做的?
7. DNA为什么要用MIN-MAX网络?
8. 广告主的出价模式是什么?
3. 八股:
1. transformer里使用了什么激活函数?
2. 为什么要用relu?
3. relu有哪些缺点?
4. GPT中用了什么激活函数
5. transformer的attention中的QKV是一样的吗?
6. 为什么要设计成不一样的?
7. 了解哪些优化器?
8. adam之后的优化器是怎么做的?
三面
1. 算法题:40. 组合总和 II
2. 八股:
1. 训练模型时遇到过哪些问题,怎么解决的?
2. 梯度消失怎么解决?
3. 离线和在线指标不一致怎么解决?
3. 实习项目:
1. 小波分解的结果如何确定是噪声
2. 小波分解具体是怎么做的
3. 线上怎么infer的
4. baseline是什么?
#校招##面经##算法##秋招#