米哈游27届实习-LLM算法实习生

工作职责
1、设计严谨和科学的针对post train model的benchmark，准确评估基础模型能力，设计模型能力优化方向，提升基础模型的social intelligence
2、设计和训练奖励模型，深度参与基础模型的后训练优化，持续解决reward hacking问题和扩大强化学习训练规模
3、研究Reward System，涉及但不限于LLM-as-Judge, Generative Reward Model, Agentic Reward Model, Sandbox等技术

任职要求
1、硕士及以上学位在读，计算机、人工智能等相关专业优先
2、深入了解LLM后训练，具备LLM Benchmark设计/奖励信号设计/强化学习训练项目经验者优先
3、具备良好的中英文阅读和鉴赏能力，有良好的沟通合作能力
4、熟练使用python语言和pytorch框架

加分项
1. 在ACM/ICPC，NOI/IOI，TopCoder等编程大赛上有获奖
2. 在后训练/模型评估有NeurIPS/ICML/ACL/EMNLP顶级论文发表，积极追踪大模型方向前沿进展和应用
3. 具备良好的文学素养，对游戏、影视、小说等人文和娱乐内容有浓厚兴趣

投递链接
https://jobs.mihoyo.com/?sharePageId=121176&recommendationCode=052BT&isRecommendation=true#/campus/position/7913

#米哈游##校招##内推##秋招##春招##游戏##llm#

全部评论

推荐最新楼层

昨天 08:44

湖南信息学院 C工程师

大佬们帮我看看简历，哪些地方需要优化

点赞评论收藏

05-20 22:21

门头沟学院 Unity3D客户端

出去实习却被老师严查，该怎么办？

我是每周3，4，5才有课，今天上的是这周的第一节课，虽然我找了代课，但是班长没看到我人，后面辅导员又来开班会，专门来找我的，看我来了没有，结果就是代课被发现了，然后辅导员让我回去，如果不回去就要给我处分，我该怎么办，我不会被开除吧

点赞评论收藏

05-06 14:35

门头沟学院算法工程师

找不到实习

四月十号左右开始投递暑期。到现在仅有bat和一家中厂约面。只有一家流程中了，其他全挂了，中厂基本不给面。五月该怎么做，或者说简历有什么需要优化的。辛苦大佬支个招

点赞评论收藏

05-13 00:41

已编辑

北京邮电大学 Java

27暑期0offer

大佬们，我快顶不住了。up四非本211硕投了三十家了，只有滴滴给了面试，但是是处女面，一面挂了。美团笔试做了后似乎太差，三个志愿都挂了华为笔试挂网易笔试挂京东投了没给面，一直泡池子百度一直挂一直投快手也是一直挂一直投阿里10个已经挂了7个，剩下三个估计也没戏了字节给面，约了下周三腾讯还在池子里pdd估计这两天笔试其他的厂都是投了没鸟我想请教一下大佬，是简历有问题么需要补充ai的项目进去么，要做rag的项目么还是agent感觉自己凉的不能再凉了啊，周围的同学基本都拿到offer了，好焦虑

理性的杰克刷牛客：ai肯定要有的，最好学一下agent方向加一个智能客服什么的进去，并且多加点什么skill，mcp啥的，另外你现在的项目深度有些浅，这些功能都太简单了，而且也不是真正能扛高并发的实现，没有什么太大的亮点，可以去网上找点更有深度的项目。可以先投一些中小厂，有实习经历以后再去大厂，你现在这个大厂可能机会不大

点赞评论收藏