美团大模型算法实习一面分享
发点面经攒攒人品~
1. 实习拷打
2.过程监督的信号具体是怎么设计的。过程监督的信号还能应用在哪些地方。
3. 如何保证强化学习的训练效率,grpo训练过程中出现了全0或者全1怎么解决。
4. 混合推理是怎么做的(OpenAI GPT-5),大模型在增强推理的时候如何保证通用数据不遗忘。
5. 现在大模型还有那些能力值得增强。
6. 介绍第二篇论文
7. 介绍第一段实习,介绍落地的场景。
8. 写题,非hot100的模拟
1. 实习拷打
2.过程监督的信号具体是怎么设计的。过程监督的信号还能应用在哪些地方。
3. 如何保证强化学习的训练效率,grpo训练过程中出现了全0或者全1怎么解决。
4. 混合推理是怎么做的(OpenAI GPT-5),大模型在增强推理的时候如何保证通用数据不遗忘。
5. 现在大模型还有那些能力值得增强。
6. 介绍第二篇论文
7. 介绍第一段实习,介绍落地的场景。
8. 写题,非hot100的模拟
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
