字节27实习 多模态大模型二面凉经

感觉面完人都通透了,还是太菜了,下去沉淀一下
1.项目拷打,每个问题都很深很细节,问到你不会为止
八股:
1.attention怎么算?
2.QKV和softmax公式;为什么要除根号d?除d行不行?
3.grpo不同模型架构上训练的差异
4.ppo的value model怎么做的?和actor model输出区别。

手撕ppo,grpo公式,两者核心区别,advantage怎么算,kl怎么加。
最后一些数据提纯和视频生成的场景题。
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务