大模型应用开发面经 (5年经验)

时间范围

近半年

实际面过的公司

阿里、腾讯、美团、字节、快手、同程、京东、360、keep、滴滴、印象笔记、作业帮、彩云科技、蓝色光标、江城互娱、Aviagames、Hungry Stdios、深言科技、即时科技、RockFlow、格灵深瞳、百融云创、印象笔记、网龙、 HiDream.ai、昆仑万维、数驱互动、Authing

先说总结

面试内容 & 难度

个人觉得,在llm应用的面试题上,没有太多复杂、高深的问题,不像上来让你说一下分布式锁怎么设计然后死扣设计细节或是描述一下MVCC原理这种偏高难度的八股文问题(当然也遇到了一两次),究其原因以下几点,一是大模型应用目前仍没有很成熟且被广泛接纳的方案,都还在探索;二是很多公司今年刚开始all in AI(我司all进去的比较早点),面试官也懂得不多,例如RAG这个东西,大部分的面试题无非是“你觉得RAG中最难的是什么?(文档切割喽)”、“你是怎么解决幻觉问题的?”,“微调和RAG的区别是啥?”等等,如果你做过RAG加上你经常看技术文章结合你的“侃侃而谈”,基本面试官都觉得ok。但这里着重说一下我觉得当前非常重要且极大概率提升面试通过率的的一个技术点,就是掌握微调原理并且做过动手做过微调工作再加上动手部署过大模型,这是我面试中最常被问到而又只能说没做过的问题,当然大部分公司都有专门的算法团队去做这件事,自己到没机会参与其中,也是可以理解的。

算法题:一半是DP问题,还有一部分难度是easy的问题,总体上都是“老熟人”,但是,你即使写出来,面试不一定就能过,有的干脆就不考算法题。

八股文:明显比之前少很多,这个和面试的岗位有关系,LLM应用的岗位更偏实践,所有很多一面就是leader面,直接问项目,除非一面也不懂LLM的东西,就会考八股文,但总的来说,八股少了,但是绝对不可以不准备,好几次挂在这上面,别小瞧它。

岗位内容:

游戏公司:基本上是LLM + AB test for 游戏策划;BI 分析;游戏社区客服助手;

toC: Agent 个人助手

toB: Agent for 解决方案

other: 通用 Agent 平台;公司内部AI助手、平台;Agent for 运维

offer

会有很多横向对比,如果你期望薪资比较高,对方说要在等等,基本上凉了。

大部分涨幅基本是不到20%的,但我的期望是30%左右,最后还是拿到了(要有一点点耐心,还要有一定的运气)。

不要眼高手低,先拿一个低于自己预期的offer,再慢慢谈,前提是公司想要你。

规划好时间,集中面试,集中对比,由于我时间线拉的过长,后面安排的很乱。

再总结

每次面完都要复盘,没答好的问题,一定要重新梳理答案。

没把握问题的可以直接说不会,别给个你自己都听不懂的答案。

简历一定要让大模型润色,但自己要check一遍,别吹过头了。

多看技术文章,扩展技术视野,提高二面面试官对你的印象。

表达一定要流畅清晰,不要断断续续的,面试官会觉得你思路不清晰。

项目效果评估是个很重要的问题,不管你的技术多炫酷,终究还是要看效果,看落地效果。

面试题

这里想到多少写多少

LLM 基础

大模型是怎么训练出来的?

Transform 的架构,Encoder 和 Decoder 是什么?

Function Call 是怎么训练的?

微调的方案有哪些?自己做过没有?

大模型分词器是什么?

Embedding 是什么?你们用的那个模型?

Lib

介绍一下 langchian

介绍一下 autogen

有没有用过大模型的网关框架(litellm)

为什么手搓agent,而不是用框架?

mcp 是什么?和Function Call 有什么区别?有没有实践过?

A2A 了解吗?

Prompt

ReAct 是啥?怎么实现的?

CoT 是啥?为啥效果好呢?有啥缺点?

Prompt Caching 是什么?

温度值/top-p/top-k 分别是什么?各个场景下的最佳设置是什么?

RAG

你介绍一下RAG 是什么?最难的地方是哪?

文档切割策略有哪些?怎么规避语义被切割掉的问题?

多路召回是什么?

文档怎么存的?粒度是多大?用的什么数据库?

为啥要用到图数据库?

向量数据库的对比有没有做过?Qdrant 性能如何?量级是多大?有没有性能瓶颈?

怎么规避大模型的幻觉?

微调和RAG的优劣势?

怎么量化你的回答效果? 例如检索的效果、回答的效果。

Workflow

怎么做的任务拆分?为什么要拆分? 效果如何?怎么提升效果?

text2sql 怎么做的?怎么提高准确率?

如何润色query,目的是什么?

code-generation 是什么做的?如何确保准确性?

现在再让你设计你会怎么做?(replan)

效果是怎么量化的?

Agent

介绍一下你的 Agent 项目

长短期记忆是怎么做的?记忆是怎么存的?粒度是多少?怎么用的?

Function Call 是什么做的?

你最大的难题是什么?你是怎么提高效果的?怎么降低延迟的?

端到端延迟如何优化的?

介绍一下single-agent、multi-agent的设计方案有哪些?

反思机制是什么做的?为什么要用反思?

如何看待当下的LLM应用的趋势和方向

为什么要用Webrtc?它和ws的区别是什么?

agent服务高可用、稳健性是怎么保证的?

llm 服务并发太高了怎么办?

系统设计题

短链系统

分布式锁的设计

给你一部长篇小说,怎么做文档切割?

怎么做到论文翻译,并且格式尽可能和原来的统一

游戏社区客服助手设计。如何绑定游戏黑话,如何利用好公司内部的文档

结合线上问题快速定位项目工程代码有问题的地方

有很多结构化和非结构化数据,怎么分析,再怎么得出我要的结论。

八股

go的内存分配策略、GMP、GC

python 的内存分配策略、GC

redis 用过那些?mget 底层什么实现的?、zset怎么实现的?

mysql 索引怎么设计最好?数据库隔离级别?mvcc是怎么实现的?

分布式锁是什么实现的?

kafka的 reblance 是什么?会产生那些问题?怎么保证数据不丢?

fastapi 设计原理?

go 中 net/http 如何处理的tcp粘包问题

http2 是什么?比http1.1有什么优势?

Linux 网络性能调优的方式

如何定位Linux中的pid、端口号等等

个人

在每个项目的里的角色是什么?承担那些工作?项目是几个人在做?

为什么离职、每次离职的原因是什么?

平常怎么学习的?怎么接触到大模型的最新进展的?

对大模型将来的应用发展有什么看法?

你将来的职业规划是什么?

#大模型# #找工作# #实习# #硕士# #博士# #找工作#
全部评论
所有面试题可以开源给大家 后台T一下
7 回复 分享
发布于 2025-07-28 13:19 湖南
求面试题
1 回复 分享
发布于 2025-10-03 14:38 云南
求面试题
1 回复 分享
发布于 2025-09-30 20:25 北京
求面试题
1 回复 分享
发布于 2025-09-26 21:39 湖南
求面试题
1 回复 分享
发布于 2025-09-25 14:43 上海
求面试题
1 回复 分享
发布于 2025-09-22 15:43 辽宁
求面试题
1 回复 分享
发布于 2025-09-10 13:24 重庆
求面试题
1 回复 分享
发布于 2025-09-09 18:14 河南
求面试题
1 回复 分享
发布于 2025-09-05 22:24 江西
求面试题
1 回复 分享
发布于 2025-08-31 14:53 广东
求面试题
1 回复 分享
发布于 2025-08-24 10:02 江苏
mark
1 回复 分享
发布于 2025-08-22 16:18 广东
求面经
1 回复 分享
发布于 2025-08-19 20:02 北京
求面试题
1 回复 分享
发布于 2025-08-15 22:40 英国
求面试题
1 回复 分享
发布于 2025-08-15 22:40 英国
求面试题
1 回复 分享
发布于 2025-08-14 04:33 浙江
求面试题
1 回复 分享
发布于 2025-08-13 22:18 北京
求面试题
1 回复 分享
发布于 2025-08-11 14:30 美国
求面试题
1 回复 分享
发布于 2025-08-08 21:59 江苏
求面试题
1 回复 分享
发布于 2025-08-08 13:14 美国

相关推荐

攒攒人品!有面试过同岗的朋友欢迎评论区交流1.项目拷打2.实习拷打3.OCR 结果有噪声或错误时,你是怎么做纠错或提升解析质量的?4.多模态检索中,图像和文本向量不在同一空间时,如何实现对齐?5.Agent 中长短期记忆如何设计?各自存什么,怎么触发读取?6.多轮对话中,如果不同轮次的记忆发生冲突,你如何处理?7.用户情绪异常(投诉、愤怒)时,Agent 如何在不中断主流程的情况下进行干预?8.长文档为什么一定要切 chunk 再做向量化?不切会有什么问题?9.chunk切分时为什么要有重叠区域?比例一般怎么确定?10.稠密向量和稀疏向量的区别是什么?各自适合什么场景?11.是否做过关键词召回和向量召回的融合?具体怎么做的?12.向量检索中 Top-K 设置过大或过小分别会带来什么问题?13.余弦相似度和欧氏距离在高维空间中的差异是什么?实际怎么选?14.为什么需要 rerank 模型?它解决了向量召回的哪些问题?15.rerank之后的截断策略是怎么设计的?为什么选这个 K 值?16.文档发生局部更新时,如何做增量索引而不是全量重建?17.RAG 中如果没有召回到相关知识,如何约束模型避免胡编?18.HyDE 在 query 模糊时是如何提升召回效果的?19.超长上下文模型出现后,RAG 架构的必要性是否会下降?20.大模型高并发调用时,如何做限流、降级和成本控制?
点赞 评论 收藏
分享
03-30 18:50
门头沟学院 Java
给我面没招了,发点面经攒攒人品~1. 实习拷打2. 项目拷打3. 你的检索是否基于向量实现,搭建完整的 RAG 系统会涉及哪些核心部分?4. RAG 项目的文档上传和分块是怎么实现的?5. 向量检索召回的单次耗时是多久,有没有用到Rerank模型?6. 你如何评估检索召回内容与用户问题的匹配度,有没有做相关的效果评估?7. 你对 Agent 的理解是什么,它包含哪些核心模块?8. 是否了解 Agent 的设计范式,例如ReAct 范式?9. 你的 Agent 循环一般多少步可以完成任务,有没有出现过达到最大步数仍无法完成的情况?10. 你的 Agent 目前接入了哪些工具?11. 你是如何约定并约束大模型进行工具调用的?12. 你的项目推流是否使用 SSE?13. 你的 Agent 编排流程中有没有做 Plan 阶段?14. 从协议层面,介绍 SSE、WebSocket 与 HTTP 的区别和关联?15. 项目为什么限制每个用户只能上传单个文件?16. 项目的图像识别如何实现的,为什么不用多模态大模型,而选择传统的识别模型?17. 你的项目中用到了哪些大语言模型?18. 请介绍 Go 语言的并发和其他语言并发的区别?19. Goroutine 是什么,请介绍一下它的核心原理?20. 你对锁的理解是什么,锁是解决什么问题的?21. 日常开发中用哪种锁更多,还了解哪些后台开发常用的锁?22. 多机器、多进程场景下会涉及到哪些锁,是否了解分布式锁?23. 你对 MCP、Function Call、A2A 分别是怎么理解的?24. 你的项目接入了哪些 MCP 服务?有没有本地手写过 MCP 服务?25. 你日常开发会借助哪些 AI 工具?26. 使用这些工具的心得以及是否有写过相关的 command/skill?27. Claude Code 的实现原理?28. 是否了解OpenClaw以及了解它的实现原理?
LambertCla...:Claude Code实现原理都来了,难道是预测到了这波源码泄露
查看26道真题和解析
点赞 评论 收藏
分享
04-04 16:49
门头沟学院 Java
已挂 1.自我介绍2找一个大模型项目,技术选型,技术框架等介绍下3.bge向量化模型,看过其他模型吗,对比了吗回答的不好,没准备4.向量数据库milvus里面的ANN算法5.它和传统的算法的时间复杂度是怎么样的6.rag的切分策略是什么答得递归切分,三层策略7.LLM的提示词怎么设计的答得结合业务场景,意图识别,角色限定,模型选择,query改写,8.编写提示词有哪些经验,有参考的示例吗架构师,全站工程师,测试工程师,必须,禁止等关键词9.LLM怎么跟rag结合起来的,只听到意图识别检索测和生成侧都有10.查询结果通过精排,LLM结合输出,可以简单的这样理解吗11问答的过程,记忆是怎么实现的12.短期记忆的话涉及到多轮对话,怎么进行压缩,或者说有什么其他策略吗答得近期保留,远处的对话摘要,保持知道这样一个对话13.自我介绍的时候的时候,有做过模型的训练,基于哪个预训练模型YOLOV8,V1114.数据集是什么类型的数据集,准确度能达到多少,指标15.平常用哪些语言,mysql慢查询优化,索引优化策略16.mysql主键索引一定是连续的吗17.默认的情况设定的自增吗,连续吗18.三个线程同时写msqyl数据,第一个比如主键ID为1,第二个主键ID为2,同时向一个唯一索引的写数据,1写成功了,二失败了回滚;此时第三个线程往里面插数据,这个时候第三个线程的主键ID是三还是二呢不会19.kafka消息是怎么存储的,存储的组织结构,topic下面有很多持久化文件或者说现在输入一个id,kafka根据id怎么找到持久化的一个内容20java用的哪个版本,默认垃圾回收器是什么,G1是怎么做垃圾回收的吗可以详细讲下垃圾回收算法吗21项目里面redis除了做记忆存储还有哪些作用list set做存储,bitmap做文件上传标记22redis里面是单机,还是主从还是集群呢23.redis怎么保证高可用的不会24.集群或者是主从一个机器宕机的话,怎么故障回复的;或者说主从切换怎么做的之前有了解吗25.选主策略呢,哪个从节点优选为主节点反问ai业务,业务进度清明节前会更新吗,然后秒挂跨境电商,相关的策略相关的,推荐相关的,在做探索kafka redis高可用知识不系统,后面再看看
查看27道真题和解析
点赞 评论 收藏
分享
评论
97
492
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务