1. 介绍了自己的课题,如果使用vlm来做,可以做吗,任务怎么迁移(开始聊天并引导),SFT应该怎么做2. vlm的架构了解吗,qwen3-vl的论文有没有看过3. agent训练的结果是如何评估的4. RFT的数据如何获得,轨迹数据的评估清洗能否用llm提效5. 课程学习是怎么做的,有没有对比使用课程学习和不使用的结果6. 在当前scaling law的背景下,你觉得课程学习还有必要吗,为什么7. Adam对比SGD改善的地方8. 训练环境稳定性,做了哪些工作,问了下可优化的地方9. 八股:位置编码+ layer Norm10. 有没有跟一些最新的paper面试官非常好,会主动引导思考