京东日常实习-大模型应用算法 凉经

被横向挂了,希望发出来对大家有帮助!
项目拷打+实习拷打
1. GRPO在线学习策略过程,listwise 数据如何训练reward模型。
2.MOE模型相关原理和微调经验。
3. 逆序对实现和讲解(计算逆序对时如何避免重复计算)
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 今天 10:20 广东

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务