2025-09-27 08:41 门头沟学院推荐算法

关注

百度算法岗二面面经

拷打简历（18min）

对大模型基础的结构有没有了解？

你了解哪些大模型中的优化技术呢？

那对于大模型相关的，传统的那种机器学习技术（如树模型），你有没有了解过？

你了解的推荐技术是什么方面？讲一个例子

聚类ID 的向量从哪来的？

怎么拿到这个聚类用的向量？是输入模型吗？就比如说拿原始视频，把它的一些信息输进去，经过这个模型用什么方法得到这个向量？

你提到了物品间 ID 对，形成向量的过程是什么？相似性怎么定义

假设这个物品是新的，理论上跟它有交互的用户序列基本上是空的，这种冷启动的情况怎么办呢？

那你觉得能用大模型给这个物品生成一些向量吗？有了这个向量以后，你觉得可以应用在什么地方？你觉得系统里面能用到这个相似度的是哪一块？

你了解推荐线上比较核心的环节（比如召回环节）吗？推荐环节一共有哪些？假设你知道推荐环节的步骤，那大模型辅助产出的向量或相似度在这些步骤里哪些能用？能不能举个例子，说明在某一个步骤用怎么比较合理？

召回环节主要解决哪些问题？比如冷启动之类的，之前你了解过吗？

推荐环节的具体步骤解决什么问题，以及主要有哪些内容？

二分类任务，常规看模型精度的，有人用 AUC，你知道 AUC 是什么意思吗？

它有一种类似概率的解释，你还记得它的物理意义吗？

AUC 反映的其实是一种概率吧？比如二分类标签只有 0 和 1，模型会打一系列的分，训练集里有真实标注，那 AUC 是怎么体现这种概率的？

手撕：最长公共子序列。第一遍秒之dp公式略有问题但是样例过了，后面写对了

反问：

1.我这种0推荐基础的进推荐组如何landing？

-模型是搭积木的，策略要自己实现调优

2.搜索大模型用在什么场景上

全部评论

推荐最新楼层

03-20 20:31

同济大学算法工程师

百度 - 大模型后训练实习生二面

📍面试公司：百度 🕐面试时间：2026.03.20💻面试岗位：文心一言 后训练❓面试问题：自我介绍，教育背景，项目，和实习（两段本科Java web实习，没有后训练实习经验）GRPO训练的数据流KL散度的计算公式，怎么做平滑softmax的计算公式，怎么防止数值爆炸，有什么影响GRPO里的$\pi_\theta$, $\pi_\theta_{old}$, $\pi_\theta_{rollout}GRPO里是off-poliy/on-policy，当batch_size非常大时，如何缓解off-poliy的问题？平时使用vibing code的频率，以及使用的模型有哪些？了解TRL，VE...

查看13道真题和解析

点赞评论收藏

03-08 00:25

门头沟学院推荐算法

大模型算法实习面经——百度

攒人品中，祝大家都能拿到满意的Offer！1.介绍DPO和PPO2.DPO损失函数怎么算的3.梯度检查点如何提升效率4.详细讲一下deepseed5.以7B的模型为例，计算训练需要多少显存说明都有哪些部分，每部分怎么算的，以及用deepseed每一个阶段节省多少内存，怎么节省的，计算过程中都有乘以2字节是为什么，什么原理6.做Rag 时候的分块策略7.BM25原理，RRF的原理8.Kl散度的输入是什么，怎么来的手撕：用torch实现kl散度

点赞评论收藏

03-07 02:20

门头沟学院推荐算法

LLM算法实习百度二面面经

继续来分享下之前的面经~强度好大，俺不中咧。。。。1.实习中多智能体系统包含几个智能体？它们之间如何交互？2.意图识别模型需要识别多少个意图？3.750B 模型用于什么场景？4.实习中 Qwen3VL 模型是多少 B 的？用于什么场景？5.在实习中，你主要的贡献是什么？6.检索环节做了哪些优化？7.答案生成环节做了哪些优化？8.是否做了 SFT 或强化学习相关工作？在哪个环节做的？9.SFT 过程中是否对类别标签做了清洗或修正？10.强化学习的样本量是多少？11.基础模型经常分类分不准的案例有哪些？12.在校项目中，为什么用对话数据来增强数据集？13.在校项目任务的输出可以简单描述并举例吗？14.单智能体能否完成在校项目相关工作？为什么要使用多智能体？15.LangGraph 相对其他开源智能体编排工具的优点是什么？16.在现有场景中是否需要用到 LangGraph 的状态管理功能？17.如何理解 Long-term Memory 的实现方式？18.若将电商场景中用户的购买、点击、兴趣等信息设计为长期记忆，有什么想法？19.Context Window 能否储存大量电商交互信息？如何解决存储问题？20.推理时若将大量 Memory 以 Token 形式给到大模型，Token 长度过长该如何处理？21.强化学习有哪些常用技巧？22.若通过 SFT 进一步提升模型准确率，常用的手段有哪些？23.SFT 的理想数据量是多少？如何确定？24.SFT 数据分布一般怎么取？为什么选择该分布而非其他分布？

点赞评论收藏

03-18 21:50

上海交通大学算法工程师

百度二面大模型研发凉经

继续来分享下之前的面经~欢迎友好讨论，信息共享1讨论项目2什么是GAE3解释deepseek的MLA，分析可能有什么缺点4介绍deepseekV3.2的闪电索引器和可能的缺点5介绍MHC残差连接6什么是多头注意力7口述两个算法题，说出求根号的多重方法（牛顿，梯度下降，二分），二分法求到小数点后k位精度算法复杂度8一个哈希表题目，不是力扣

查看8道真题和解析

点赞评论收藏

03-23 17:30

门头沟学院推荐算法

百度大模型多模态算法实习面经分享

被横向挂了，希望发出来对大家有帮助！1. 讲一下主要的多模态模型的模型结构2. 对多模态的数据有什么了解，我回答之前看了一些多模态cot的工作构造的dpo数据，以及毕设做的多模态数据增强3. 之前的工作的多模态数据有什么特点和创新点，觉得还可以有什么改进4.统一生成理解模型下游微调各个任务的数据是怎么构造的5. dpo算法是怎么实现的，和其他强化学习有什么区别6. 看项目有目标检测任务，问了IoU是怎么算的，目标检测一般有哪些损失优化code：1. 实现dpo损失，按照想法能写多少是多少，不要求跑通2. 手写IoU损失，要求跑通

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 华泰星战营，提前锁定校招offer #

百度 算法岗二面面经

全站热榜

创作者周榜

百度算法岗二面面经