🔥 日薪3500元!顶尖RL实习生招募中 | 小红书Hi Lab大模型团队等你加入! 🔥

寻找对强化学习充满热情的 25届及以后毕业的硕士/博士!

🚀 你加入的是什么神仙团队?
小红书 Hi Lab 基座大模型团队!我们刚刚开源了 DOT.LLM1,现在正全力研发下一代大模型系列——你的加入,正当其时!

🧠 挑战前沿课题:
面向复杂场景的大规模强化学习系统!你将有机会独立负责以下激动人心的方向之一:

🤔 Reasoning RL:让AI学会深度思考与决策!

💻 Code Agent RL / Agent RL:打造能写代码、能自主行动的智能体!

📈 Scalable Oversight (可扩展监督):解决大模型高效对齐的核心难题!

❤️ 人文情怀世界奖励模型构建:赋予AI理解人类价值观的能力!

🔄 Pretrain 与 RL 的深度融合:探索基座模型与强化学习的协同进化!

🌟 为什么选择我们?

顶级薪酬:行业极具竞争力的实习薪资!

顶尖团队:参与开源大模型研发的核心力量!

前沿方向:深度探索RL与大模型结合的最热领域!

独立负责:获得宝贵的一线科研与工程实战经验!

👉 如果你:

是 25届及以后毕业的硕/博,对强化学习(RL)有扎实基础和浓厚兴趣;

渴望在大模型与RL交叉的前沿领域大展拳脚;

具备优秀的动手能力和钻研精神;

🔥 别犹豫了!
快带上你的简历和热情,加入小红书Hi Lab,一起定义AI的未来!
简历请发送至:****************

#强化学习#RL #大模型#AI实习 #高薪实习#人工智能招聘 #小红书招聘#博士招聘 #硕士招聘#算法实习 #AI前沿
全部评论

相关推荐

07-10 22:46
Java
牛友们好,先来个背景介绍,鼠鼠是一名来自新型双非即将大二小登,之前鼠鼠大一跟着一个同学一起学java,上个月月初刚干完苍穹外卖,然后备战期末考,然后到现在一直在学其他的鼠鼠的学校的培养方案是大一学期末分配一个学术导师,然后他直接管理我们接下来要研究什么以及要学什么,分配任务什么的,学校的培养方案很类似于提前读研。然后我的导师是研究多模态之类的,现在也在跟着他学习,鼠鼠感觉这些很nb很有意思但是鼠鼠很迷茫,鼠鼠想赚钱,但是鼠鼠不知道会走多远,像学java的同学,大二就可以开始找实习,积累经验,但鼠鼠的课好多,导师也管的严,可能更希望我们去跟着他的节奏走,这个方向我感觉大二暑假也很难找到实习,缺少经验。而且走这个方向的话,鼠鼠估计要考研(保研估计失败了),考研的不确定性也在那里,鼠鼠觉得这个上限很高,我也想跟着学校方案学下去,但是鼠鼠很担心考研失败什么的,鼠鼠现在比赛=0,科研成果=0,照这样下去简历到时也为0,学校也是新双非没啥名气,整个人就彻底完蛋了所以鼠鼠现在就很纠结,是继续跟老师一路走下去,还是直接all in java不管老师了对了,学校当时还承诺我们这一届可以保就业,不知道能不能相信学校,感觉信又不信无论如何,谢谢看到这里的牛友,感谢你的耐心
你觉得专业和学校哪个对薪...
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务