米哈游【提前批】LLM算法研究员(后训练方向)
工作职责
1、研究LLM后训练算法,探索LLM Agent在游戏场景中的落地应用,包括在游戏设计、玩法以及研发管线中的应用等;
2、针对各应用场景,收集LLM后训练数据,制定数据流转pipeline,参与构建后训练数据飞轮;
3、研究LLM模型的后训练策略,使用强化学习等技术提升LLM Agent的性能,参与游戏领域LLM模型的调优、训练和迭代,推动LLM在游戏场景中的技术突破;
4、与游戏制作管线中的其他团队紧密合作,打造新的AI游戏开发流程,创造次世代游戏体验;与工程团队紧密合作,交付稳定可靠的LLM服务。
任职要求
1、计算机科学、数学等相关领域的应届毕业生,有良好的编程能力和扎实数理基础;
2、熟悉LLM常用工具和框架,如transformers,llama-factory,verl等。熟悉适用于LLM后训练的强化学习算法,如PPO,GRPO,DAPO等;
3、有LLM项目实践经历,包括但不限于LLM模型训练,Code Agent,RAG系统,AI搜索,AI NPC,各类AI工作流等。
加分项
1、在NeurIPS/ICML/ICLR/ACL/EMNLP等会议或期刊上发表过论文者优先;
2、获得过国际或国内信息竞赛奖项者优先;
3、有游戏技术栈开发经历的优先,参与过 AI Agent 工业化工具开发优先。
面向对象
2026届(2025.9-2026.8之间毕业)
#秋招##内推##提前批##米哈游##llm##算法#
1、研究LLM后训练算法,探索LLM Agent在游戏场景中的落地应用,包括在游戏设计、玩法以及研发管线中的应用等;
2、针对各应用场景,收集LLM后训练数据,制定数据流转pipeline,参与构建后训练数据飞轮;
3、研究LLM模型的后训练策略,使用强化学习等技术提升LLM Agent的性能,参与游戏领域LLM模型的调优、训练和迭代,推动LLM在游戏场景中的技术突破;
4、与游戏制作管线中的其他团队紧密合作,打造新的AI游戏开发流程,创造次世代游戏体验;与工程团队紧密合作,交付稳定可靠的LLM服务。
任职要求
1、计算机科学、数学等相关领域的应届毕业生,有良好的编程能力和扎实数理基础;
2、熟悉LLM常用工具和框架,如transformers,llama-factory,verl等。熟悉适用于LLM后训练的强化学习算法,如PPO,GRPO,DAPO等;
3、有LLM项目实践经历,包括但不限于LLM模型训练,Code Agent,RAG系统,AI搜索,AI NPC,各类AI工作流等。
加分项
1、在NeurIPS/ICML/ICLR/ACL/EMNLP等会议或期刊上发表过论文者优先;
2、获得过国际或国内信息竞赛奖项者优先;
3、有游戏技术栈开发经历的优先,参与过 AI Agent 工业化工具开发优先。
面向对象
2026届(2025.9-2026.8之间毕业)
#秋招##内推##提前批##米哈游##llm##算法#
全部评论
相关推荐
03-31 12:20
厦门大学 ETL工程师
勇敢的卷王在等off...:和同事聊了发现这7步里前3步就是产品经理的日常工作,所以PM做vibe coding有天然优势。但注意第2步——写给研发看的PRD和写给AI看的PRD完全是两个东西。给研发写'用户可以筛选订单' 研发秒懂 给AI写同样的话它会给你生成一个你完全不认识的筛选器。所以建议在PRD里每个功能都附一句'验收标准是什么' 点赞 评论 收藏
分享
02-25 12:06
天津大学 嵌入式硬件工程师 点赞 评论 收藏
分享