字节 多模态 算法面经 攒人品
整体面试还是不错的,但是没后续了,不知道是哪里出了问题
1.介绍项目
2.介绍ppo,grpo,gspo,dapo及他们的改进
3.qwen3coder的架构是什么,其中有多少个专家
4.gspo训练中有没有遇到奖励突然下降和训推不一致的情况?
5.qwen2.5VL的架构?
6.说一下react是什么
7.如何用agent做可学习的多模态的数据生成
8.代码题是MHA
1.介绍项目
2.介绍ppo,grpo,gspo,dapo及他们的改进
3.qwen3coder的架构是什么,其中有多少个专家
4.gspo训练中有没有遇到奖励突然下降和训推不一致的情况?
5.qwen2.5VL的架构?
6.说一下react是什么
7.如何用agent做可学习的多模态的数据生成
8.代码题是MHA
全部评论
相关推荐

查看5道真题和解析