米哈游27届实习-LLM算法实习生

工作职责
1、设计严谨和科学的针对post train model的benchmark，准确评估基础模型能力，设计模型能力优化方向，提升基础模型的social intelligence
2、设计和训练奖励模型，深度参与基础模型的后训练优化，持续解决reward hacking问题和扩大强化学习训练规模
3、研究Reward System，涉及但不限于LLM-as-Judge, Generative Reward Model, Agentic Reward Model, Sandbox等技术

任职要求
1、硕士及以上学位在读，计算机、人工智能等相关专业优先
2、深入了解LLM后训练，具备LLM Benchmark设计/奖励信号设计/强化学习训练项目经验者优先
3、具备良好的中英文阅读和鉴赏能力，有良好的沟通合作能力
4、熟练使用python语言和pytorch框架

加分项
1. 在ACM/ICPC，NOI/IOI，TopCoder等编程大赛上有获奖
2. 在后训练/模型评估有NeurIPS/ICML/ACL/EMNLP顶级论文发表，积极追踪大模型方向前沿进展和应用
3. 具备良好的文学素养，对游戏、影视、小说等人文和娱乐内容有浓厚兴趣

投递链接
https://jobs.mihoyo.com/?sharePageId=121176&recommendationCode=052BT&isRecommendation=true#/campus/position/7913

#米哈游##校招##内推##秋招##春招##游戏##llm#

全部评论

推荐最新楼层

04-03 13:02

浙江大学算法工程师

网易 C++ 研发岗二面面经

1. C++ 的内存模型中，happens-before 关系是什么？答：happens-before 是 C++11 内存模型中定义的一种偏序关系，用来描述操作间的可见性保证：如果操作 A happens-before 操作 B，那么 A 的结果对 B 一定可见。建立 happens-before 的方式：同一线程内，代码顺序靠前的操作 happens-before 靠后的操作（sequenced-before）mutex 的 unlock happens-before 下一次 lockatomic 的 release 写 happens-before 另一个线程对同一变量的 acquire...

C++八股文全集

点赞评论收藏

04-08 23:19

中南大学 Java

携程员工的好日子又双叒叕来了？

携程集团宣布，将于2026年5月1日起，在部分业务部门启动为期一年的无理由事假管理实验。 据悉，携程约6000名员工将被随机分配为实验组和对照组，实验组员工可在现有各类带薪假期之外，额外获得每年累计最多45天的无理由事假额度，组内员工可根据个人需要随时申请使用该额度，且无需说明具体事由。 轰轰烈烈的实验开始了！各位携程员工有没有被老板的小巧思暖到呢？ 来个携程董哥说说内部的真实情况吧！

携程工作体验

点赞评论收藏

03-15 13:10

已编辑

淮阴师范学院 Java

鼠鼠找到工作了，但很紧张

鼠鼠是二本学历，学的是java，面的是软件工程师，面试的时候没问什么技术，就问了一些项目经验，我就把之前公司的项目经验说了一下，但是复盘面试的时候发现讲的很多东西都不会甚至有的根本没听过（mes，仿真，ai）。虽说面试官说了有学习的机会，进去以后先从mes学起，如果学习能力强会调去ai，但鼠鼠还是很紧张，可以说是不自信吧，也可以说是被打压太久了反而没有信心了😭

查看1道真题和解析

点赞评论收藏

02-25 16:29

齐鲁工业大学 golang

这份简历有救吗

25届本科生，简历写成这样可以吗，毕业回家了过完年来找工作，很迷茫，不知道投什么岗写项目完全离不开ai，就是投小厂开发岗也感觉过不去面试

找工作勤劳小蜜蜂：自我描述部分太差，完全看不出想从事什么行业什么岗位，也看不出想在哪个地区发展，这样会让HR很犹豫，从而把你简历否决掉。现在企业都很注重员工稳定性和专注性，特别对于热爱本行业的员工。你实习的工作又太传统的it开发（老旧），这部分公司已经趋于被淘汰，新兴的互联网服务业，比如物流，电商，新传媒，游戏开发和传统的It开发有天然区别。不是说传统It开发不行，而是就业岗位太少，基本趋于饱和，很多老骨头还能坚持，不需要新血液。工作区域（比如长三角，珠三角，成渝）等也是HR考虑的因素之一，也是要你有个坚定的决心。否则去几天，人跑了，HR会被用人单位骂死。

点赞评论收藏