2025-12-18 14:10 百度_算法工程师

发布于北京

关注

百度招实习生啦，简历直达主管，快来投递！

【实习】大模型强化学习基建与算法研发实习生
📍 地点： [北京/上海/深圳] ⏱️ 形式：实习（建议至少 3-6 个月）

岗位职责 (Responsibilities)
作为大模型基建团队的核心成员，你将参与最前沿的多模态大模型（VLM）后训练体系建设。你将直面大规模强化学习训练中的算法与系统挑战，核心职责包括：

多模态工具调用能力建设：负责多模态模型在 Tool Use / Function Calling 场景下的后训练（Post-training）流程搭建与优化，通过 SFT 及 RL 提升模型对复杂工具的理解与调用准确率。

强化学习算法优化：深入研究并改进主流对齐算法，针对多模态数据特性设计强化学习算法策略，解决奖励稀疏与训练不稳定问题。

训练系统基建与性能调优：参与大规模分布式强化学习训练框架的研发与维护，负责显存优化、通信优化及流水线并行策略调优，提升训练吞吐量与稳定性。

前沿技术探索：跟踪大模型多模态推理的最新论文，并将前沿算法快速复现并落地到内部基建中。

任职要求 (Qualifications)
学历背景：计算机、人工智能、数学等相关专业硕士或博士在读，具有扎实的机器学习/深度学习理论基础。

代码能力：精通 Python 编程，熟练使用 PyTorch，具有优秀的代码风格和工程实现能力。

算法基础：

深入理解 Transformer 架构及 LLM/VLM 基本原理。

熟悉强化学习基本理论，理解强化学习算法细节。

加分项 (Preferred Qualifications)：

工具调用经验：有 LLM Tool Learning、Agent 或 ReAct 相关的实战经验。

基建经验：熟悉 DeepSpeed, Megatron-LM, vLLM, Ray 等分布式训练/推理框架源码，或有 CUDA 算子优化经验。

多模态经验：熟悉 LLaVA, Qwen-VL 等多模态模型架构。

开源/学术：在顶级会议发表过论文，或在 Hugging Face / GitHub 有高 Star 开源项目贡献。#实习##大模型##面试##互联网##百度##算法#

全部评论

推荐最新楼层

牛客621092427号

四川大学自动化

请问要如何投递，我可以投递吗，有CCFA发表经历，985硕，能实习六个月

点赞回复分享

发布于 2025-12-19 21:47 江苏

昨天 16:19

上海交通大学游戏后端

秋招失利别慌，好offer不怕晚

大家好，我是25届985硕。记得当时秋招结束后，我把自己关在宿舍整整三天。因为投递得晚，很多公司都已经招满了。简历投了40多家，面试了七八轮，最终全军覆没。室友们陆续拿到offer，只有我还在刷招聘软件，那种焦虑和挫败感，相信现在正在准备春招的你一定懂。 当时我甚至开始怀疑，是不是自己真的不行。但后来我明白了一件事：秋招失利不代表终点，好offer不怕晚。 转机出现在次年2月底，我在牛客上刷到巨人网络的春招信息。因为我一直很喜欢游戏，算是《太空杀》的忠实玩家，就想着投递游戏开发试试看。没想到，7天内收到了笔试邀约，然后很快收到了邀请到巨人网络园区面试，当天把所有面试流程走完，也顺利拿到了off...

巨人网络成长空间 113人发布

点赞评论收藏

分享

04-03 16:13

已编辑

门头沟学院研发工程师

从三月初断断续续面到现在，也有十几场面试了，但都是一面挂。有几场感觉回答的也很好，但两三天以后依然挂，不知道怎么办了，很焦虑。下周有场腾讯科技和阿里控股，感觉大概率是一样的下场 求大佬支个招

点赞评论收藏

分享

04-04 21:33

已编辑

杭州电子科技大学 C++

三月底投到现在至今0约面，是哪里出了问题，是背景问题还是简历问题呢希望大佬指点一下改了一版新的，求大佬们看看

梦想不为空：辰哥的项目

点赞评论收藏

分享

评论

1

收藏

招聘动态

OPPO

2027届寻梦实习招聘

蚂蚁集团

2026春季校园招聘

阿里巴巴集团

2027届实习生校园招聘

正浩创新EcoFlow

2026届春季校园招聘

AI网申助手

网申字段一键填写

招商银行数字金融训练营

火热报名中

新华三

2026届春季校园招聘

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 烂工作和没工作哪个更痛苦？ #

12853次浏览 204人参与

# Tplink求职进展汇总 #

214445次浏览 976人参与

# 厦门银行科技岗值不值得投 #

17891次浏览 419人参与

# 面试体验最好和最差的公司 #

14759次浏览 87人参与

# 27届实习投递记录 #

21989次浏览 428人参与

# 给工作过的公司写一条大众点评，你会怎么写？ #

4927次浏览 68人参与

# 你找工作想离家近 or 离家远？ #

45867次浏览 362人参与

# 携程工作体验 #

27409次浏览 104人参与

# 我是XXX，请攻击我最薄弱的地方 #

70824次浏览 467人参与

# 实习心态崩了 #

112805次浏览 609人参与

# 春招至今，你收到几个面试了？ #

41577次浏览 607人参与

# Agent面试会问什么？ #

13687次浏览 423人参与

# 一人分享一个skill #

2941次浏览 74人参与

# 你收到了哪些公司的笔试？ #

52540次浏览 416人参与

# 我的求职进度条 #

968155次浏览 6444人参与

# 秋招吐槽大会 #

325105次浏览 1586人参与

# AI替代不了什么？ #

9054次浏览 126人参与

# 如何提高实习转正率？ #

103264次浏览 627人参与

# 技术转行的心路历程 #

92245次浏览 783人参与

# 机械人春招想让哪家公司来捞你？ #

397528次浏览 3186人参与

# 职场中那些令人叹为观止的八卦 #

105632次浏览 489人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务