大模型再爱我一次

2025-09-05 15:36 门头沟学院算法工程师发布于甘肃

关注

百度提前批三面

📍面试公司：百度
💻面试岗位：大模型
❓面试问题：
1. 场景题，如何提升模型的分类准确率
2. 介绍一下rag
3. 大模型上下文很长怎么办
4. 多智能体多框架
5. 大模型除了训练还能做什么提升准确率
6. 一次lora怎么获得多种领域的专业知识
7. lora是什么意思
8. lora怎么merge，两种办法有什么好处
#发面经攒人品##我的秋招日记##百度秋招提前批进度#

全部评论

推荐最新楼层

中南大学算法工程师

佬，请问一下三面有手撕嘛

点赞回复分享

发布于 2025-09-15 17:05 新加坡

牛客310393555号

上海大学 Java

蹲后续

点赞回复分享

发布于 2025-09-12 14:42 上海

03-06 09:16

浙江大学算法工程师

格蓝若 C++软件开发二面面经

1. 先简单介绍一下你自己，重点说说你最擅长的技术领域和最有成就感的项目。面试官您好，我是XXX。我最擅长的是C++后端开发和系统编程，对高性能服务器、分布式系统比较有研究。最有成就感的项目是我做的分布式缓存系统，从零开始设计实现，经历了性能优化、架构演进的完整过程。最初QPS只有几万，通过内存池、无锁队列、零拷贝等优化，最终达到了20万QPS。这个项目让我深入理解了高性能系统的设计原理，也锻炼了解决复杂问题的能力。除此之外，我对Linux系统编程、网络编程、多线程编程都有比较深入的实践。2. 详细说说你的缓存系统项目，从系统设计的角度介绍架构、技术选型、关键设计决策。这个缓存系统的设计目标是...

C++八股文全集

点赞评论收藏

分享

03-07 02:20

门头沟学院推荐算法

LLM算法实习百度二面面经

继续来分享下之前的面经~强度好大，俺不中咧。。。。1.实习中多智能体系统包含几个智能体？它们之间如何交互？2.意图识别模型需要识别多少个意图？3.750B 模型用于什么场景？4.实习中 Qwen3VL 模型是多少 B 的？用于什么场景？5.在实习中，你主要的贡献是什么？6.检索环节做了哪些优化？7.答案生成环节做了哪些优化？8.是否做了 SFT 或强化学习相关工作？在哪个环节做的？9.SFT 过程中是否对类别标签做了清洗或修正？10.强化学习的样本量是多少？11.基础模型经常分类分不准的案例有哪些？12.在校项目中，为什么用对话数据来增强数据集？13.在校项目任务的输出可以简单描述并举例吗？14.单智能体能否完成在校项目相关工作？为什么要使用多智能体？15.LangGraph 相对其他开源智能体编排工具的优点是什么？16.在现有场景中是否需要用到 LangGraph 的状态管理功能？17.如何理解 Long-term Memory 的实现方式？18.若将电商场景中用户的购买、点击、兴趣等信息设计为长期记忆，有什么想法？19.Context Window 能否储存大量电商交互信息？如何解决存储问题？20.推理时若将大量 Memory 以 Token 形式给到大模型，Token 长度过长该如何处理？21.强化学习有哪些常用技巧？22.若通过 SFT 进一步提升模型准确率，常用的手段有哪些？23.SFT 的理想数据量是多少？如何确定？24.SFT 数据分布一般怎么取？为什么选择该分布而非其他分布？

点赞评论收藏

分享

03-18 10:30

已编辑

阿里巴巴_淘宝_前端

聊一聊最近碰到的一些 Agent 面试题（一）

淘天 27 届暑期实习生正在招聘 各方向都有海量 HC 欢迎看我置顶帖子投递一面 | Agent 生态与工程化面试题 1：请解释 ACP（Agent Communication Protocol）协议的设计思路，它解决了什么问题？参考答案ACP 解决的核心问题：目前各家的 Agent 框架（LangChain、CrewAI、AutoGen 等）各自为政，Agent 之间无法互通。A 公司用 LangChain 写的 Agent 没法直接和 B 公司用 AutoGen 写的 Agent 协作。ACP 要做的就是 Agent 之间的 HTTP——一个开放的、框架无关的通信标准，让不同技术栈的 Ag...

面试问题记录

点赞评论收藏

分享

03-07 09:25

门头沟学院推荐算法

大模型算法实习面经-字节跳动

给我面没招了。。。1. 项目拷打2. 详细阐述Transformer的底层原理，并说明其能够替代RNN的核心优势；结合Transformer架构的成熟度，分析Self-Attention机制在多模态对齐任务中是否存在瓶颈，以及在实际业务场景中，是否出现过注意力权重完全偏移的情况。3. 讲解LoRA的技术原理，说明LoRA是否仅能嵌入Linear层；分析LoRA无法在LayerNorm层之后插入的原因，以及该操作会对模型训练稳定性产生哪些具体影响。4. 结合实操经验，说明QLoRA降低训练资源成本的核心逻辑；列举常见的模型量化方式，并解释QLoRA选择NF4与FP16组合而非其他方案的原因，阐述NF4的分布拟合逻辑。5. 针对采用multi-query attention优化后，decoder延迟仍居高不下的问题，分析潜在性能瓶颈；探讨vLLM自带的KV Cache是否会成为推理过程中的负担。6. 分别说明Embedding模型与Rerank模型处理文本语料的核心流程，并结合实际应用场景举例说明。7. 结合过往RAG项目经验，讲解从数据清洗到检索服务上线的完整链路搭建流程，重点说明chunk切分的具体策略。8. 分析当前RAG技术落地的最大瓶颈，并阐述你在项目中采取过哪些优化手段来提升检索召回率（Recall）。9. 针对XX领域大模型的训练工作，说明SFT（监督微调）数据集的构造方法与核心思路。10. 结合LoRA微调实操经历，说明rank值的选择依据；在合并adapter权重的过程中，是否遇到过梯度爆炸问题，以及对应的解决方法。11. 结合你的模型部署相关经验，说明模型参数量与硬件算力需求之间的对应关系（例如不同参数量级模型所需的算力配置标准）；以部署一个稀疏率千分之三的235B参数量MOE架构模型为例，估算其所需的算力规模。12. 在搭建RAG知识库时，若需对文档进行动态更新，你采用的是全量嵌入还是增量处理方案？若为增量处理，如何规避新旧文档数据分布不一致导致的检索偏差问题。

点赞评论收藏

分享

03-16 05:30

门头沟学院机器学习

携程大模型算法实习面经分享

攒人品中，祝大家都能拿到满意的Offer！1.lora微调原理2.P tuning3.强化学习 ppo grpo4.prompt 微调5.attention结构6.gpt12的结构7.Deepseek r1 训练四个阶段8.Encoder only decoder only 区别9.Llamma12的结构10.Deepseekv2 v3 r1 r1 zero的结构和训练过程11.探讨moe技术细节以及未来发展的困境

查看11道真题和解析

点赞评论收藏

分享

评论

点赞

5

招聘动态

百度

2027届暑期实习

招商银行数字金融训练营

火热报名中

米哈游2026校园招聘

应届生春招&全年实习生专项

新华三

2026届春季校园招聘

联想

27届暑期实习

奥克斯集团

2026春季校园招聘

厦门银行

2026届春季校园招聘

联想

26届补录

携程集团

2026年春季校园招聘

AI网申助手

网申字段一键填写

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 大厂实习和小厂实习最大的区别是什么？ #

3924次浏览 24人参与

# 参加完秋招的机械人，还参加春招吗？ #

120130次浏览 764人参与

# 招商银行数字金融训练营 #

40970次浏览 401人参与

# 牛友の3月总结 #

3605次浏览 33人参与

# 拼多多工作体验 #

52859次浏览 344人参与

# 面试被问到不会的问题，你怎么应对？ #

1033次浏览 12人参与

# 厦门银行科技岗值不值得投 #

10126次浏览 255人参与

# 这些公司卡简历很严格 #

95393次浏览 418人参与

# 研究所VS国企，该如何选 #

259234次浏览 2013人参与

# 通信硬件知识分享 #

48195次浏览 538人参与

# 实习最想跑路的瞬间 #

131071次浏览 740人参与

# 找AI工作可以去哪些公司？ #

18995次浏览 875人参与

# 从事AI岗需要掌握哪些技术栈？ #

16259次浏览 982人参与

# 你做过最难的笔试是哪家公司 #

49883次浏览 882人参与

# 机械人怎么评价今年的华为 #

231856次浏览 1538人参与

# 材料人的华为红黑体验 #

41622次浏览 200人参与

# 金三银四，你的春招进行到哪个阶段了？ #

25158次浏览 300人参与

# 说说你知道的学历厂 #

391121次浏览 1379人参与

# AI面会问哪些问题？ #

38329次浏览 1202人参与

# 想给25届机械人的秋招建议 #

47887次浏览 251人参与

# 如何排解工作中的焦虑 #

292932次浏览 2606人参与

# 机械人避雷的岗位/公司 #

62957次浏览 395人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务