offer 好运爆棚 6

04-25 09:40 门头沟学院算法工程师

关注

荣耀大模型算法实习面经分享

给我面没招了，发点面经攒攒人品～
1. 项目拷打
2. 项目数据量一万多条具体指什么，数据格式
3. 为什么选用7B千问基座模型，而不选用更小尺寸的模型？
4. LoRA 微调时参数设置（r=16、alpha=32）的依据是什么？
5. 项目baseline是什么，如何证明微调有效？
6. 模型存在逻辑混乱、重复等问题，回头看可以做哪些改进？
7. 数据量仅1万条，模型容易产生幻觉，该如何解决？
8. 小模型容易出现复读机现象，有哪些方法可以改善？
9. 模型评估采用了哪些方式，人工评估+大模型裁判打分的具体逻辑是什么？
10 是否了解RAG，该法律问答项目是否适合使用RAG，为什么？
11 介绍KL散度的定义，其衡量的“偏差”具体指什么？

全部评论

推荐最新楼层

05-18 12:23

南京邮电大学 Java

简简单单Java开发面经-华为od

HR面· 家庭情况· 对加班的看法· 期望的工作地点及选择原因技术一面· 介绍项目中遇到的最大困难，以及是如何解决的；随后详细追问了项目中 Agent 的开发过程· 对数据库的了解：基本的增删改查，以及如何做优化· Java 中用到了哪些锁· 了解的排序算法有哪些· 手撕算法：力扣 678，有效的括号字符串技术二面· 重点考察了项目中的核心设计· Redis 的持久化机制与集群（项目中有实际使用）· Java 的类加载机制· 手撕算法：力扣 46，全排列主管面· 自我介绍· 兴趣爱好与自我评价· 询问了在校期间获得的奖项· 项目中遇到的最大困难及解决方式· 团队合作中出现分歧时如何处理

查看17道真题和解析

点赞评论收藏

分享

05-26 12:11

门头沟学院算法工程师

海底捞大模型面经

面试官一上来没问传统的八股，直接问一个场景题怎么做一个海底捞智能点餐Agent的后训练。我说那当然是先SFT再RL。但这个不能只简单的sft，根本就没有训练数据，你这个场景还得是多轮的，用户又不是报菜名贯口选手，张嘴就来一串"番茄加牛油 + 麻一度+七寸盘脆毛肚"。没有对话数据，从哪开始炼？先搞数据吧。现在海底捞门店全是 iPad 和小程序点单，数据形态是用户行为轨迹（trajectory），不是对话：- 选锅底（番茄 + 牛油）- 加菜、撤菜- 翻页停留（隐式反馈）- 临时改备注要把这套 UI 操作流翻译成自然语言多轮对话，再喂模型学。目标语料长这样 👇▎ Agent：先看锅底？▎ 用户：有人吃辣有人不吃。▎ Agent：番茄牛油鸳鸯，行么？▎ 用户：可以，麻度调到 1。▎ Agent：开始点涮菜吧。▎ 用户：来份捞派脆脆毛肚……把过去的点单流水批量合成几十万条这种对话，SFT 阶段仅计算 Agent 那一侧的 loss（User轮次全 mask 掉），不然模型会学着模仿用户瞎点菜。多轮在线 RL 比 SFT 难十倍——没人能现场陪你跑几万局。所以得先训一个 User 模拟器：- 输入种子 profile：黑海 / 金海 / 银海等级、历史偏好、过敏忌口、是否「薅羊毛型选手」……- 第一轮 Agent 出招后，模拟器接力生成第二轮回应，往返多轮- profile 里塞一个 「结束点餐」special token，控制对话什么时候自然停下有了这个模拟器，才能稳定 rollout 出多轮 trajectory 喂 RL。面试官追问多轮RL的reward怎么设计？我的思路是全部做成 verifiable reward，避免 reward hacking：符合历史人均消费客单价+100分，点餐分量合理+80分，荤素分布合理或符合历史分布+60分，命中特殊需求轮次奖励+120分。用pav信用算法分配考虑turn级的分配，，引导模型循序渐进引导式点单——而不是一上来甩一整本菜单让用户挑。面试官说又追问，这么做的大模型应用真比直接点餐体验好吗？我愣住了，你们招这岗位，不就是要做这个事吗。。。为啥还要质疑存在的合理性？我只能硬着头皮答😅面试官说:谢谢你的时间。后续是挂了

查看3道真题和解析

点赞评论收藏

分享

05-08 05:25

门头沟学院算法工程师

大模型算法实习一面分享-百度

发点面经攒攒人品～算法题：对话历史构造输入一个 List，包含 session_id、turn_id、query、answer 四列输入不保证按 turn_id 有序输出要求：在原始数据基础上增加 history 列，表示当前轮次之前的历史对话内容1.问实习项目2.项目解决的是什么问题3.训练数据来源4.DPO 训练数据格式5.训练时有没有考虑模型泛化能力6.如何解决模型死循环问题7.解释为什么会有模型死循环问题8.压缩向量的具体形式9.更倾向于研究型工作还是面向业务的工作

查看9道真题和解析

点赞评论收藏

分享

05-11 21:41

中山大学算法工程师

爱奇艺大模型算法岗面经

1️⃣一面 1. Transformer、CLIP原理，图文对齐层工作机制2. CLIP衍生进阶模型；检索场景模型适配改造思路3. Transformer各类Decoder结构4. 大模型通用预训练流程；电商垂域预训练必要性及原因5. GRPO公式推导；PPO四大组成模型手撕：多头注意力MHA代码2️⃣二面1. LoRA落地场景、常用超参配置2. 长文本模型结构优化；Qwen3-VL RoPE、MRoPE原理，其他位置编码方案3. 长文本训练各类优化Trick4. 多模态图像Token冗余过多解决方案；图像Token长度限制实现方式5. BF16与FP32精度差异、训练选型；训练推理精度一致性问题手撕：反转链表3️⃣三面1. 多模态Embedding设计经验、图文对齐方案与主流对齐方式2. Embedding模型与Reranker差异，二者训练Loss区别📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看14道真题和解析

点赞评论收藏

分享

05-24 13:04

门头沟学院深度学习

去实习还是准备秋招

投票

27届研二学生，211本+末流985硕，研究生的方向是医学交叉的多模态，目前有一篇领域内一作B会在投下个月出结果，一篇一作在写（预计也是投领域内的B会）。最近找暑期实习相当挫败，大厂基本连面试都不给，只找到了深圳的一个中厂的专业相关算法（多模态相关）的实习，目前在考虑去实习还是转开发，我对开发的掌握还是比较浅薄的，可能要花整个暑假的时间速通一下，想转开发的原因是经过了找暑期实习之后感觉多模态算法的岗位太难找了，想着转开发会不会能找到更好的工作。求求大家给点建议，或者是转搜广推方向/大模型方向，很希望秋招能找一个比较好的工作

点赞评论收藏

分享

评论

2

7

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 我的实习日记 #

4172904次浏览 33323人参与

# 城市生存手册 #

8730次浏览 121人参与

# 第3届现代汽车Code Faster急速编程挑战赛 #

35972次浏览 542人参与

# 如果人间有后悔药 #

12833次浏览 272人参与

# 牛客AI文生图 #

26359次浏览 267人参与

# 你的房租占工资的比例是多少？ #

104988次浏览 915人参与

# 柠檬微趣笔试 #

5673次浏览 68人参与

# 入职第五天，你被拉进了几个工作群 #

33487次浏览 85人参与

# 入职第一天，你准备什么时候下班 #

129580次浏览 531人参与

# 实习最晚的一次下班是几点 #

40562次浏览 178人参与

# 哪些公司对双非友好 #

245174次浏览 1293人参与

# 双非本科的出路是什么？ #

238373次浏览 1671人参与

# 听到哪句话就代表面试稳了or挂了？ #

279860次浏览 1800人参与

# 为了找工作你投递了多少公司？ #

128744次浏览 802人参与

# 秋招感动瞬间 #

128915次浏览 572人参与

# 现在入门AI应该走哪些方向？ #

36253次浏览 205人参与

# 用一句话形容你的团队氛围 #

54031次浏览 316人参与

# 秋招投递记录 #

433219次浏览 3332人参与

# 新凯来求职进展汇总 #

85354次浏览 197人参与

# 你以为的实习VS真实的实习 #

148260次浏览 768人参与

# 我的租房踩坑经历 #

237840次浏览 1428人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务