阶跃星辰-强化学习 for AIGC 研究实习生

#实习##人工智能##大模型##强化学习#
实习目标
本实习岗位高度偏向科研探索。您将有机会与团队的资深研究员和科学家密切合作,深入探索RL在AIGC领域的创新性应用。我们期望实习生不仅能实现现有算法,更能提出新颖的想法,设计严谨的实验,并最终产出具影响力的研究成果(如顶会论文、技术报告、开源项目等)。

核心职责
前沿研究: 调研并跟踪RL与AIGC交叉领域的最新进展(如RLHF, DPO, RLAIF, 视觉(图像生成、编辑以及3D生成)RL等)。
算法创新: 设计、实现并评估新型的强化学习算法,以解决AIGC模型在奖励建模、人类偏好对齐、可控生成、安全性、推理等方面的难题。
实验与迭代: 构建大规模的离线与在线实验平台,进行严格的消融实验和性能分析,以验证新方法的有效性。
论文撰写: 将研究成果整理成文,目标是投稿至NeurIPS, ICML, ICLR,CVPR,ICCV 等顶级机器学习或AI会议。
代码贡献: 撰写高质量、可复现的研究代码,并可能开源以促进社区发展。

任职要求
学历背景: 计算机科学、人工智能、数学、统计学或相关领域的在读硕士/博士研究生(优秀的高年级本科生也可考虑)。
理论基础: 对深度学习和强化学习的核心概念(如MDP, Policy Gradient, PPO, Q-Learning)有深刻理解。
编程能力: 熟练掌握Python,并具有使用主流深度学习框架(如PyTorch, TensorFlow, JAX)的经验。
研究经验: 拥有扎实的科研基本功,能够独立阅读、复现并批判性思考学术论文。
动手能力: 具备出色的算法实现和调试能力,有相关项目或研究经历者优先。
求知欲与自驱力: 对未知领域充满好奇,具备强大的自我驱动能力和解决问题的能力,乐于接受挑战。

感兴趣的同学欢迎投递简历至邮箱 **********, 请注明邮件主题:RL for AIGC方向应聘-姓名-学校-专业
全部评论

相关推荐

09-01 21:40
已编辑
同济大学 Java
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务