米哈游27届实习-LLM算法实习生
工作职责
1、设计严谨和科学的针对post train model的benchmark,准确评估基础模型能力,设计模型能力优化方向,提升基础模型的social intelligence
2、设计和训练奖励模型,深度参与基础模型的后训练优化,持续解决reward hacking问题和扩大强化学习训练规模
3、研究Reward System,涉及但不限于LLM-as-Judge, Generative Reward Model, Agentic Reward Model, Sandbox等技术
任职要求
1、硕士及以上学位在读,计算机、人工智能等相关专业优先
2、深入了解LLM后训练,具备LLM Benchmark设计/奖励信号设计/强化学习训练项目经验者优先
3、具备良好的中英文阅读和鉴赏能力,有良好的沟通合作能力
4、熟练使用python语言和pytorch框架
加分项
1. 在ACM/ICPC,NOI/IOI,TopCoder等编程大赛上有获奖
2. 在后训练/模型评估有NeurIPS/ICML/ACL/EMNLP顶级论文发表,积极追踪大模型方向前沿进展和应用
3. 具备良好的文学素养,对游戏、影视、小说等人文和娱乐内容有浓厚兴趣
投递链接
https://jobs.mihoyo.com/?sharePageId=121176&recommendationCode=052BT&isRecommendation=true#/campus/position/7913
#米哈游##校招##内推##秋招##春招##游戏##llm#
1、设计严谨和科学的针对post train model的benchmark,准确评估基础模型能力,设计模型能力优化方向,提升基础模型的social intelligence
2、设计和训练奖励模型,深度参与基础模型的后训练优化,持续解决reward hacking问题和扩大强化学习训练规模
3、研究Reward System,涉及但不限于LLM-as-Judge, Generative Reward Model, Agentic Reward Model, Sandbox等技术
任职要求
1、硕士及以上学位在读,计算机、人工智能等相关专业优先
2、深入了解LLM后训练,具备LLM Benchmark设计/奖励信号设计/强化学习训练项目经验者优先
3、具备良好的中英文阅读和鉴赏能力,有良好的沟通合作能力
4、熟练使用python语言和pytorch框架
加分项
1. 在ACM/ICPC,NOI/IOI,TopCoder等编程大赛上有获奖
2. 在后训练/模型评估有NeurIPS/ICML/ACL/EMNLP顶级论文发表,积极追踪大模型方向前沿进展和应用
3. 具备良好的文学素养,对游戏、影视、小说等人文和娱乐内容有浓厚兴趣
投递链接
https://jobs.mihoyo.com/?sharePageId=121176&recommendationCode=052BT&isRecommendation=true#/campus/position/7913
#米哈游##校招##内推##秋招##春招##游戏##llm#
全部评论
相关推荐
查看1道真题和解析 点赞 评论 收藏
分享
02-25 16:29
齐鲁工业大学 golang
找工作勤劳小蜜蜂:自我描述部分太差,完全看不出想从事什么行业什么岗位,也看不出想在哪个地区发展,这样 会让HR很犹豫,从而把你简历否决掉。现在企业都很注重员工稳定性和专注性,特别对于热爱本行业的员工。
你实习的工作又太传统的it开发(老旧),这部分公司已经趋于被淘汰,新兴的互联网服务业,比如物流,电商,新传媒,游戏开发和传统的It开发有天然区别。不是说传统It开发不行,而是就业岗位太少,基本趋于饱和,很多老骨头还能坚持,不需要新血液。
工作区域(比如长三角,珠三角,成渝)等也是HR考虑的因素之一,也是要你有个坚定的决心。否则去几天,人跑了,HR会被用人单位骂死。 点赞 评论 收藏
分享
查看26道真题和解析 点赞 评论 收藏
分享
