🎯【大模型算法面试经验分享】-联影

## 👨‍🎓 背景介绍  
我是个已经毕业几年的“老鸟”了,长期从事深度学习相关工作。目前的主要方向是垂直领域大模型和RAG相关项目。  

因为之前自己也面试过不少人,所以现在面试相对轻松。但每次面试还是收获颇丰,决定整理一些面试过程中遇到的典型问题,供大家参考。  

---

## 🔍 面试问题汇总  

### 1️⃣ 为什么离职? 
这个问题基本上每场都会遇到。好好编一下,比如想去更大的平台?

### 2️⃣ RAG embedding 模型效果衡量?
被问到过如何对比大模型的 embedding 与 bge 等轻量模型。  
重点:结合具体业务场景和检索效果来对比。同一个向量空间?  

### 3️⃣ RAG 分片策略  
数据分片

### 4️⃣ DPO(Direct Preference Optimization)
面试官问得很细,涉及到如何通过 DPO 优化模型生成效果。  
重点:讲清楚 DPO 的基本思路,以及在实际模型训练中的应用场景。  

### 5️⃣ Layout 版面分析 
* 主要针对文档处理中的版面分析任务。  
* 重点:提到一些常用算法如 LayoutLMv3。  

---

## 🔄 反问环节  
* 关于团队技术栈、研发流程、成长空间等,提前准备几个深入的问题,展示对公司的兴趣和了解。  

---

💬 **欢迎大家小窗交流,互相沟通!**  

📌 **后续会持续更新,敬请期待!**  

---

希望这份面经对正在准备大模型相关岗位的朋友有所帮助!🍀 祝大家都能拿到心仪的 Offer! 💪
#牛客创作赏金赛##面经#
全部评论
联影是讲PPT,感觉我的PPT做的不好。搞技术真的头疼PPT
点赞 回复 分享
发布于 2024-12-10 14:49 四川
更新: 挂!基础不扎实? 什么理由?都是渣男渣女经典语录!
点赞 回复 分享
发布于 2024-12-10 11:54 四川

相关推荐

05-19 21:28
门头沟学院 Java
部门:核心本地商业-业务研发平台,好像主要是做搜推的。流程:4.25 投递5.10 笔试5.14 一面5.16 二面一面:主要是结合项目来问,每个项目都挑着问了一些点,我只有第一个项目是java项目,所以聊得相对多一点。1.简单介绍一下项目,要求突出工作2.手撕:删除排序链表中的重复元素II3.结合第一个项目拷打:为什么不用RabbitMQ不用HTTP(降低耦合+异步)为什么用消息队列不用数据库传输文件?数据库有什么缺点吗?不太了解SSE,问了一下是什么客户端是指什么?用户界面是你们设计的吗?(我说sse是实现服务端给客户端的推送,所以问了这个)4.第二个项目拷打,主要是cv相关的,具体的就不放了5.第三个项目拷打,主要是三维重建相关6.项目中用到什么语言?7.这些项目的代码量大吗?8.SpringBoot的lOC和AOP二面:更没有问项目了,只问了20分钟不到,主要在问一些项目收获、大模型、AI相关的问题。1.自我介绍2.在项目中的角色/承担的任务3.在项目中除了开发以外,最大的收获是什么?4.在项目中有没有提出一些个人比较创新性/优秀的想法并实践?5.项目里提到用了opensora,使用体验感怎么样?经过一年多迭代了,有没有尝试更新版本?6.回望项目,AI/大模型技术还可以用在里面做些什么?7.平时有没有用大模型相关的一些产品?尝试落地了吗?8.探索新工具的时候觉得最有意思/能激起学习兴趣的是什么?9.闲聊、反问实习时间等面完正好是周五下午了,到目前为止还没有最新的消息。希望团子给一次做团孝女的机会我等我等我等!
不想搬砖怎么办:
查看19道真题和解析
点赞 评论 收藏
分享
1.请简述什么是大模型,以及它与传统模型的主要区别是什么?2.你如何评估大模型的性能?有哪些常用的评估指标?3.请描述一下你如何对大模型进行优化,以提高其性能和效率。4.你是否有过使用或开发大模型的经验?请分享一个具体的案例。5.大模型中的注意力机制是如何工作的?它在大模型中起到了什么作用?6.大模型中的优化算法有哪些常见的选择?它们各有什么优缺点?7.如何处理大模型训练过程中的梯度消失或梯度爆炸问题?8.在大模型设计中,如何权衡模型的复杂度和性能?9.面对大模型训练和推理所需的庞大计算资源,你有什么解决建议?10.请简述你了解的大模型的主要结构特点。11.reward bench上的reward model分哪几类?12. reward model如何训练的,训练目标是什么?13.dp0训练的损失函数和训练目标,dpo如何改进怎么理解大模型安全,包含哪些方面的内容?14.指令跟随能力的评估集有什么,如何评估的?15.阿尔法狗强化学习策略是什么?提升推理能力和指令跟随能力哪个更难, 为什么, 提升指令跟随能力的优化方式和其他的比如推理有什么不一样的地方?16.dpo训完了一般输出长度会变化吗? 如何解决这个问题大模型训练过程学习率一般是怎么变化的, 退火阶段学习率如何变化的?17.在开发大模型时,当你面临推理阶段的资源需求时,你如何确保模型的可解释性和公平性?18.谈谈你对Transformer模型的理解,以及它在自然语言处理中的应用。19.请简述Transformer的基本结构和工作原理?20.为什么Transformer使用位置编码(Positional Encoding)?21.如何优化 Transformer 模型的性能?22.Transformer在自然语言处理中有哪些应用?23.transformer里边norm的位置在哪里,norm如何计算的多头自注意力机制的作用是什么?24.注意力机制为什么除以根号dk, 为什么不是dk请解释什么是注意力机制,并举例说明其应用场景。25.注意力机制是如何工作的?请简述其计算过程。26.多头注意力机制是什么?它相比单头注意力有什么优势?📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看26道真题和解析
点赞 评论 收藏
分享
评论
1
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务