京东日常实习-大模型应用算法 凉经
被横向挂了,希望发出来对大家有帮助!
项目拷打+实习拷打
1. GRPO在线学习策略过程,listwise 数据如何训练reward模型。
2.MOE模型相关原理和微调经验。
3. 逆序对实现和讲解(计算逆序对时如何避免重复计算)
项目拷打+实习拷打
1. GRPO在线学习策略过程,listwise 数据如何训练reward模型。
2.MOE模型相关原理和微调经验。
3. 逆序对实现和讲解(计算逆序对时如何避免重复计算)
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享