百度招实习生啦,简历直达主管,快来投递!

【实习】大模型强化学习基建与算法研发实习生
📍 地点: [北京/上海/深圳] ⏱️ 形式: 实习(建议至少 3-6 个月)

岗位职责 (Responsibilities)
作为大模型基建团队的核心成员,你将参与最前沿的多模态大模型(VLM)后训练体系建设。你将直面大规模强化学习训练中的算法与系统挑战,核心职责包括:

多模态工具调用能力建设: 负责多模态模型在 Tool Use / Function Calling 场景下的后训练(Post-training)流程搭建与优化,通过 SFT 及 RL 提升模型对复杂工具的理解与调用准确率。

强化学习算法优化: 深入研究并改进主流对齐算法,针对多模态数据特性设计强化学习算法策略,解决奖励稀疏与训练不稳定问题。

训练系统基建与性能调优: 参与大规模分布式强化学习训练框架的研发与维护,负责显存优化、通信优化及流水线并行策略调优,提升训练吞吐量与稳定性。

前沿技术探索: 跟踪大模型多模态推理的最新论文,并将前沿算法快速复现并落地到内部基建中。

任职要求 (Qualifications)
学历背景: 计算机、人工智能、数学等相关专业硕士或博士在读,具有扎实的机器学习/深度学习理论基础。

代码能力: 精通 Python 编程,熟练使用 PyTorch,具有优秀的代码风格和工程实现能力。

算法基础:

深入理解 Transformer 架构及 LLM/VLM 基本原理。

熟悉强化学习基本理论,理解强化学习算法细节。

加分项 (Preferred Qualifications):

工具调用经验: 有 LLM Tool Learning、Agent 或 ReAct 相关的实战经验。

基建经验: 熟悉 DeepSpeed, Megatron-LM, vLLM, Ray 等分布式训练/推理框架源码,或有 CUDA 算子优化经验。

多模态经验: 熟悉 LLaVA, Qwen-VL 等多模态模型架构。

开源/学术: 在顶级会议发表过论文,或在 Hugging Face / GitHub 有高 Star 开源项目贡献。#实习##大模型##面试##互联网##百度##算法#
全部评论
请问要如何投递,我可以投递吗,有CCFA发表经历,985硕,能实习六个月
点赞 回复 分享
发布于 2025-12-19 21:47 江苏

相关推荐

2025-12-24 10:12
上海理工大学 C++
📍offer公司1: vivo 影像部端侧大模型💰薪资包: N 纯现金💡优点:  1.  网上风评不错,强度适中(面试官说他们平时 995,上海可能轻松一些)  2.  稳定性高  3.影像部属于核心部门🤦‍♂️缺点: 1. 公积金 5%   2.  年终占比太高,转浮动薪资后万一公司业绩不好年包可能缩水   3.  在 NPU 上部署端侧大模型,方向略窄  4. 离家 30 公里,往返通勤时间共 100 分钟左右📍offer公司 2:  上海人工智能实验室💰薪资包: N-M 的现金和 M 的签字费(共发两年)💡优点: 1. 工作强度真的低 2. 云端大模型推理,方向比较好 3. 实验室稳定🤦‍♂️ 缺点: 1. 两年后总包降M  2.实验室没有企业业务驱动,技术发展感觉可能受限  3. 地铁通勤往返 140 分钟📍offer公司 3:  字节 data 推荐架构💰薪资包: N-5 的现金和 10 的期权,可能还有一笔较少的签字费💡优点: 1. 离家 7 公里 ,通勤往返 50 分钟 2. 应该也属于核心部门?  3. 云端多模态大模型推理优化,后续发展比端侧有优势🤦‍♂️ 缺点: 1. 薪资在 2-2 级别算垫底的,和另外两家没有拉开差距  2. 卷,心累程度会比另外两家高很多字节薪资性价比没有另外两家高,据我的了解这个薪资在 2-2 属于 range 的下限,但又考虑字节未来发展的上限会比另外两家高,特别是字节新政策出来后会不会快速把总包涨到 2-2 平均水平?还请各位大佬理性分析一波,给个建议。
offer帮选
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务