面面俱到神

2025-12-10 00:15 电子科技大学算法工程师

关注

百度大模型算法三面-秋招面经

1.大模型灾难性遗忘是什么？怎么解决的？
2. 数据蒸馏的方法
3.项目中怎么做的多任务学习，有用到经验回放吗
4.deepspeed三个阶段
5.计算attention时候为什么要除以根号dk，还有哪些scale处理？
6.讲DPO、PPO、RLHF什么
7.什么是旋转位置编码，解决了什么问题，为什么
8.讲lora微调，如果是全量参数sft需要多长时间？
9.实践过程中有什么值得注意的点
10.了解deepseek - R1吗，介绍一下
11. QWEN2的架构和训练方式

全部评论

推荐最新楼层

04-07 00:10

广西大学算法工程师

百度大模型开发一面

1. 你对 Claude Code、Codex、OpenHands 这类 Coding Agent 的理解是什么，它们的核心差别在哪这类产品表面上都在做“让模型帮你写代码”，但真正拉开差距的不是补全能力，而是任务编排、工具使用、上下文管理和反馈闭环。像 Claude Code 更强调命令行工作流、仓库级理解和连续执行，适合把模型放进真实开发环境里；Codex 早期更偏代码生成和 API 能力，强在补全和局部代码理解；OpenHands 这类开源 Agent 往往更强调可扩展性和多工具编排，方便接入自己的环境和流程。如果从工程视角看，这类 Agent 最终拼的是三件事：一是对代码仓库的建模能力，...

AI-Agent面试实战...

点赞评论收藏

分享

04-10 18:05

已编辑

深圳大学 Java

百度云暑期技术面（三面挂，三面面得太差了有点）

一面（放松版）实习LRU（下来后发现一摸一样的代码在本地可以运行，在如流的编译器不行，下次遇到这种可以申请本地试试）LRU为啥不用单向链表（删除保证o1）多线程如何改进（syc，reentrantlock,currenthashmap）reentrantlock比起syc的有点在哪（获取线程失败不卡死也就是不会死锁，更灵活可配置，锁中断，锁状态）cas聊聊（乐观锁的实现，重点在于无锁原子化操作）cas出现的问题（aba,单一变量原子性）aba问题有没有什么解决办法呢（版本号/时间戳，比较并且交换的过程不止比较目标值，还比较版本号）update...where name=a,update...where name=b,一个全表扫描，一个走了二级索引原因（a多）如果这两条update并发执行，发生死锁，什么原因（全表扫描是一行一行锁，锁主键就会隐式锁该行二级索引，二级索引更新是先锁索引再锁主键）openclaw和agent的区别在哪（前者是后者的实现，本地文件系统操作，im接入，skill优先）二面（燃尽版）-------------------------------------分割线--------------------------------------------实习explain可以看什么（key，type，row，extra）走了索引还是慢，什么原因（表太大，回表查询，orderby/groupby没走索引）extra可以看什么（这是个补充信息，看是不是走了索引，索引下推，还是说Using filesort）sql优化手段（建索引，小表驱动大表，分库分表，覆盖索引，关联字段索引）超大分页怎么解决（利用主键的范围查询，禁止跳超大页码）b+树（层高，范围查询）如果一个表没有主键id，它有聚簇索引吗（有，默认寻找非空唯一索引，没有的话会创建一个隐藏字段作为聚簇索引）唯一索引是主键索引吗（nope）索引下推是啥（走索引的时候顺带着筛选符合要求的结果，避免回表）索引合并是啥（走多次的单列索引进行交合操作）索引合并和联合索引哪个效果好（一般是联合索引）索引失效（最左前缀，计算，优化器判断走全表效果更优）什么情况下优化器判断走全表效果更优（表的数据量太小，查询数据占比太大需要大量回表，索引选择性不佳）数据库的隔离性怎么保证（锁，mvcc，隔离级别）数据库有什么锁（共享锁，排他锁，临键锁，元数据锁，表锁，页锁，行锁）乐观锁和悲观锁的使用场景（乐观锁读多写少，悲观锁读少写多）为啥乐观锁适合读多写少（写多的时候，会造成大量的cpu自旋）aba怎么解决（版本号，时间戳）元数据锁是啥（保护表结构的锁）元数据锁啥时候用到（修改表结构，执行select/update都会，防止查询的时候表结构改变）意向锁知道吗（表级别的锁，要加表锁的时候可以快速判断有没有行锁，不需要遍历整个表数据）临键锁怎么实现的知道吗（锁一般是mysql中定义的结构体实现，由于索引是有序的，直接锁住上一条记录和当前记录的间隙，左开右闭）java垃圾收集器（cms，g1）cms说说（从名字也看的出来标记清除算法，追求最短stw，也容易有内存碎片）g1说说（分Region，标记复制算法，可预测停顿，一般是堆内存>=45%开始标记）g1工作流程（初识标记stw，并发标记，最终标记也就是stw，筛选回收stw）如果线上服务出现延时比较高的现象，你怎么排查（全局->sql，同步，redis，单点->GC，锁竞争，网络）访问慢可能会排查线程阻塞，那你怎么排查线程阻塞（jstack打印堆栈线程信息）java的两个集合类的根接口（单列collection，双列map）List下面的实现类（arraylist，linkedlist）ArrayDeque的底层数据结构（数组加上双指针）ConcurrentHashMap里什么时候会用CAS，什么时候会用synchronized（cas在目标桶为空的的时候尝试原子无锁插入，如果不为空那么就syc）java对象的组成结构有哪些（对象头，实例数据，对齐字段）mark word存的啥（hashcode，gcage，锁状态，类型指针）你刚才说对象头里有哈希值，那是不是每一种锁状态下，对象头里都会存哈希值？（不是，只有无锁才有，才有空间存储）那你说一说Java锁升级的完整过程。（无锁->单线程获取锁偏向锁，出现竞争升级为轻量级锁，当线程自旋次数过多或者竞争太大改为重量级锁）对象的哈希值是怎么计算的？（直接生成一个随机数）cpu飙到100%（top，top -hp，jastck配合grep，找到对应的代码）k组反转（秒了）三面（写题目被拷打版，一个没写对该死）-----------------------------------分割线------------------------------------个人情况mysql的索引锁在哪里（锁在叶子节点的索引字段）你刚刚说的是逻辑实现，物理实现呢（锁的内存结构体+全局的哈希索引表）这个全局索引表干嘛的（记录挂在当前索引的锁有哪些）输入url到返回结果的过程（1 解析URL，2 dns解析获取ip层数据可能是cdn的服务ip，3 arp获取mac地址，4 tcp三次握手，5 tls握手，6 发送根据网络模型构建的http请求报文，按照上述过程反向注意这个步骤cdn的命中， 8 浏览器解析html，如果是接口库数据，交给框架渲染）arp获取的mac地址是服务器的地址吗（下一跳的路由器mac地址）tcp有什么字段（妈的，当时脑子蒙了，一下没答出来。源端口，目标端口，序列号，确认号，标志位）socket的四元组和上面的关系是啥（四元组由tcp头部的端口字段和ip头部的ip字段标识）dns解析一定是基于udp的吗（不一定）流式传输的实现方式有哪些（websocket，sse，streamablehttp）mysql一定要开启事务才会死锁吗（是的，否则单条sql执行完就释放，不会长时间持有锁）写一个mysql的死锁（怎么开启事务给忘了。。。）给个代码优化（其实是写个策略模式，不会）去掉链表中的重复数（傻逼了有个地方当时没调好）反问：我都没反问，心态有点炸了，下次面试一定要语速慢一点镇定一点，反问可以问一下万能的ai取代问题

点赞评论收藏

分享

03-24 10:25

门头沟学院人工智能

百度文策大模型二面面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你的知识库数据是如何清洗和构造的？如果数据质量参差不齐会对 RAG 系统产生哪些影响？3.文档切分策略是如何设计的？chunk size 和 overlap 会如何影响召回质量和生成效果？4.如果用户的问题在知识库中确实存在，但系统经常没有召回正确文档，你会如何排查？5.如果检索到的文档是正确的，但模型最终生成的答案仍然是错误的，你会如何定位问题？6.实际系统中，如果召回结果经常语义相似但事实不相关，你会如何优化检索模块？7.如果一个问题需要跨多个文档的信息才能回答，你的 RAG 系统如何处理这种情况？8.在 RAG 系统中如何判断问题出在检索模块还是生成模块？9.请详细说明 Transformer 从输入 token 到输出 logits 的完整计算流程。10.FFN 层为什么采用“先升维再降维”的结构，这种设计对模型表达能力有什么作用？11.MHA、MQA、GQA 在推理阶段的 KV Cache 占用和计算效率上有什么差异？12.为什么推理阶段 KV Cache 只缓存 K 和 V，而不缓存 Q？13.RoPE 的核心原理是什么，它在长上下文场景下会遇到什么问题？14.instruction tuning 中多轮对话数据训练时，loss mask 应该如何设计？15.如果 SFT 之后模型在特定任务上能力增强，但通用能力明显下降，你会如何解决？16.LoRA 的低秩分解为什么能够逼近全参数微调的效果？17.如果 LoRA 的 rank 设置不合理，在模型表现上会出现什么现象？18.DPO 训练后模型输出明显变长，在实际系统中你会如何处理？19.如果对齐之后模型变得过于保守，经常拒绝回答，你会如何调整训练策略？20.大模型出现复读机现象通常由哪些因素导致？

点赞评论收藏

分享

03-30 11:59

桂林电子科技大学安卓

百度网盘三面完泡池子

上个星期五下午两点三面完，今天跑去问结果已读不回，有谁是现在在泡池子的吗😭

是何意味：有人面了百度网盘吗，吱一声啊

点赞评论收藏

分享

04-10 09:18

澳门大学算法工程师

百度多模态大模型-暑期一面

应该不是官网投的简历，好像是boss，但是我又没投过多模态，忘记哪个部门的了，KPI面，就面了25分钟，代码也不考就结束了1.自我介绍2.问实习项目，怎么做的，数据是啥样，怎么设计的3.问另外的项目，也是差不多的问法4.PPO的clip和min，我只说了clip，min忘记了，然后就结束了反问：部门在做什么，有agent的，有AIGC的，有多模态的

查看4道真题和解析

点赞评论收藏

分享

评论

点赞

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

31163次浏览 398人参与

# 大学生该如何认清当下的就业环境？ #

161733次浏览 872人参与

# 有哪些公司在面试时考察AICoding？ #

17733次浏览 332人参与

# 运营来爆料 #

98664次浏览 508人参与

# HR面都在聊什么？ #

12661次浏览 154人参与

# 美团开奖 #

407523次浏览 1805人参与

# 26届春招投递记录 #

3376次浏览 39人参与

# 百度工作体验 #

325173次浏览 2247人参与

# 想从事Agent应该学习哪些技术？ #

7707次浏览 261人参与

# 实习学到最有价值的工作习惯 #

69441次浏览 551人参与

# OPPO求职进展汇总 #

808605次浏览 5441人参与

# 校招生月薪1W算什么水平 #

143209次浏览 492人参与

# 你觉得什么岗位会被AI替代 #

56997次浏览 369人参与

# 从投递到OC，你用了多久 #

22306次浏览 229人参与

# 什么人最适合大厂？ #

11973次浏览 124人参与

# 父母问你工作找得怎么样，怎么回 #

21883次浏览 260人参与

# 哪些公司面试还在问八股？ #

13092次浏览 114人参与

373596次浏览 2921人参与

# 我与AI的日常 #

3182次浏览 16人参与

# 实习最想跑路的瞬间 #

137545次浏览 762人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务