内推|百川智能一大模型算法工程师-急招

职位描述:

负责后训练(Post-training)相关研发工作,提升模型在数理推理、Planning、RAG、指令跟随、工具调用等方面的能力;
优化和迭代大模型的对齐训练策略和工具,包括 SFT、RLHF、Self-play RL、Agent 优化、模型融合、模型蒸馏等;
开展人类和机器偏好相关研究,提升奖励信号的质量和多样性,解决 Reward Hacking 和奖励融合问题;
参与数据飞轮、合成管道、训练实验、评测工具的开发与升级,提升团队效率,跟进并适配领域和开源的最新进展;
职位要求

计算机或数理相关专业背景,硕士或博士学历优先;
具备优秀的编程能力,精通 Linux、Python 和 Pytorch;
熟悉 Transformer 架构和大模型基础知识,有后训练及数据处理经验者优先;
具备强大的研究和实践能力,能够制定高效实验方案,快速定位和解决问题;
具有良好的沟通和协作能力,具备挑战精神和结果导向。
加分项:

在顶级会议上发表过论文并具有学术影响力。
拥有知名开源项目经验,在开源社区有影响力。
深度参与过知名大模型项目,并在关键技术上有深入实践经验。
有医学背景/医疗大模型/医疗落地实践等经验
百川智能社招内推码: UHA2UC9
投递链接: https://cq6qe6bvfr6.jobs.feishu.cn/s/iAE3p1em#人工智能招聘#
全部评论
已投递
1 回复 分享
发布于 2024-11-26 14:21 广东

相关推荐

最近在面试AI产品经理,记录一下这些天的真实经历。今早刚面完一家初创AI公司,面的时候还觉得聊得不错,结果聊到后面,面试官问我:你有做过Vibe Coding吗?我说做过。然后就开始疯狂追问,接着就是灾难式翻车。我习惯用录音来复盘,一边听一边恨泪写下这篇经验贴,希望能帮到后来人。🎯 Vibe Coding项目的讲法框架其实不复杂,就是经典的5步:背景 → 用户 → 问题 → 方案 → 结果下面每一步拆开讲。1️⃣ 背景:为什么做?❌ 错误示范:“因为我刚好在找工作,想有个项目经验,而且看别人没做过,所以就做了。”——说实话,我真的是这么想的,也真的这么说了。但面试官听完完全没有共鸣。✅ 正确思路:体现“用户驱动 + 行业认知”,讲清楚“发现问题 → 验证 → 解决”的闭环。正确说法:“我发现了一个很具体的问题XXX,验证了这个场景确实存在,所以做了这个项目。”2️⃣ 用户与问题:给谁用?解决什么?❌ 错误示范:“用户是XXX,这个产品能帮助他们XXX。”这种说法太笼统,没有层次感。✅ 正确思路:用户分层 + 优先级正确说法:“目标用户是XXX,核心特征是XXX,最核心的需求是XXX。这个产品能帮他们解决XXX问题。”3️⃣ 方案:怎么做?这是我的一个重大发现:面试官其实不太关心你具体怎么实现的,除非跟这份工作高度相关。他们更想听的是你有没有产品思维。❌ 错误示范:“先做了XXX,然后做了XXX,接着接了XXX接口,用了XXX架构……”技术细节讲太多,反而跑偏了。✅ 正确思路:讲清楚三层:输入 → 核心能力 → 输出先讲输入是什么,再讲产品的核心能力是什么,最后讲输出什么结果。面试官如果好奇能力是怎么实现的,会主动追问。他不问,你就别硬讲。4️⃣ 结果:项目的验证与闭环这个我翻车翻得很彻底。我的项目没有上线,没有用户数据。面试官一问,我直接答不上来。✅ 补救方案:即使没上线,也可以说做了初步验证:自测 + 小范围分发给朋友试用。所以强烈建议:项目能上线就尽量上线。哪怕界面很简陋,只要有用户数据,面试的时候就好讲很多。有了数据,你就可以说“根据用户反馈做了XX轮迭代”,闭环意识一下子就出来了。5️⃣ 表述逻辑要清晰,别自己搞断链条❌ 错误示范:“我觉得这个prompt效果挺好的……跑了几次效果都不错……就直接用了……但也没有数据验证……”复盘之后我才发现,这个逻辑链条是断的。正确的逻辑应该是:做了优化 → 有效果 → 验证过 → 确认好用我实际说的是:有效果 → 但其实没验证 → 不确定好不好✅ 正确说法:“从自测和使用体验来看,生成效果符合预期。下一步会补充数据验证。”这样既诚实,又体现了迭代意识。📌 总结如果做Vibe Coding是为了求职,一定要记住:尽量拿到用户数据,哪怕只是小范围试用。这样才能体现产品经理的闭环意识。另外,面试的时候一定要自信。就抱着“我的作品天下第一好”的心态去讲,语气要坚定。虽然咱也没做什么严格的验证,但demo嘛,逻辑合理就是好的。最后,如果有人知道好用的上线方式,求分享!🙏
查看1道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务