字节27实习 多模态大模型二面凉经
感觉面完人都通透了,还是太菜了,下去沉淀一下
1.项目拷打,每个问题都很深很细节,问到你不会为止
八股:
1.attention怎么算?
2.QKV和softmax公式;为什么要除根号d?除d行不行?
3.grpo不同模型架构上训练的差异
4.ppo的value model怎么做的?和actor model输出区别。
手撕ppo,grpo公式,两者核心区别,advantage怎么算,kl怎么加。
最后一些数据提纯和视频生成的场景题。
1.项目拷打,每个问题都很深很细节,问到你不会为止
八股:
1.attention怎么算?
2.QKV和softmax公式;为什么要除根号d?除d行不行?
3.grpo不同模型架构上训练的差异
4.ppo的value model怎么做的?和actor model输出区别。
手撕ppo,grpo公式,两者核心区别,advantage怎么算,kl怎么加。
最后一些数据提纯和视频生成的场景题。
全部评论
相关推荐
查看14道真题和解析