快手 日常实习一面
1. 介绍了自己的课题,如果使用vlm来做,可以做吗,任务怎么迁移(开始聊天并引导),SFT应该怎么做
2. vlm的架构了解吗,qwen3-vl的论文有没有看过
3. agent训练的结果是如何评估的
4. RFT的数据如何获得,轨迹数据的评估清洗能否用llm提效
5. 课程学习是怎么做的,有没有对比使用课程学习和不使用的结果
6. 在当前scaling law的背景下,你觉得课程学习还有必要吗,为什么
7. Adam对比SGD改善的地方
8. 训练环境稳定性,做了哪些工作,问了下可优化的地方
9. 八股:位置编码+ layer Norm
10. 有没有跟一些最新的paper
面试官非常好,会主动引导思考
2. vlm的架构了解吗,qwen3-vl的论文有没有看过
3. agent训练的结果是如何评估的
4. RFT的数据如何获得,轨迹数据的评估清洗能否用llm提效
5. 课程学习是怎么做的,有没有对比使用课程学习和不使用的结果
6. 在当前scaling law的背景下,你觉得课程学习还有必要吗,为什么
7. Adam对比SGD改善的地方
8. 训练环境稳定性,做了哪些工作,问了下可优化的地方
9. 八股:位置编码+ layer Norm
10. 有没有跟一些最新的paper
面试官非常好,会主动引导思考
全部评论
这回看懂了一些
相关推荐
11-06 13:49
重庆邮电大学 前端工程师 点赞 评论 收藏
分享
11-04 20:35
广东工业大学 Java 投票
后端转测开第一人:考研还能沉淀三年 就业能多挣三年米 看自己了 毕竟考研不一定能成功 就业也不一定能去大厂 选哪条路都不要美化另外一条没走过的路 点赞 评论 收藏
分享
点赞 评论 收藏
分享
