RAG、RAG 类型、Agent 底层原理、多 Agent。

#面试官最爱问的 AI 问题是......#

一、RAG 是什么?(面试必问)

RAG = 检索增强生成(Retrieval-Augmented Generation)
一句话:
先从外部知识库检索相关信息,再把信息喂给大模型生成答案。

作用:

• 解决大模型不知道新知识、幻觉的问题

• 不用重新训练模型,成本低、安全可控

RAG 核心流程(背这 4 步)

1. 文档切分(Chunk)

2. 向量化(Embedding)

3. 存入向量库

4. 用户提问 → 检索相关片段 → 给 LLM 生成答案

RAG 常见类型(面试高频)

1. 朴素 RAG
最简单:切分→向量→检索→生成。
适合简单问答。

2. 高级 RAG(优化版)

◦ 召回前:查询优化、重写

◦ 召回中:多路召回、混合检索(关键词+向量)

◦ 召回后:重排序(Rerank)

3. RAG + 知识库管理
带文档更新、去重、过滤、元数据过滤。

4. 模块化 RAG
可插拔:不同场景用不同检索策略。
二、Agent 底层原理(面试官最爱深挖)

一句话:
Agent = LLM 做大脑 + 工具调用 + 记忆 + 反思 + 规划

核心 5 组件(背这个)

1. 大脑(LLM)
负责思考、决策、理解任务。

2. 记忆(Memory)

◦ 短期记忆:上下文

◦ 长期记忆:向量库/数据库

3. 工具(Tools)
搜索、代码解释器、API、函数调用(FC)。

4. 规划(Planning)
拆解任务、多步推理、自主决定怎么做。

5. 反思(Reflection)
检查结果对不对,错了就修正。

标准执行流程(面试直接说)

1. 理解用户目标

2. 思考:我要做什么?需要哪些工具?

3. 调用工具获取信息

4. 继续推理,直到完成目标

5. 输出最终结果
三、多 Agent 是什么?

多 Agent = 多个智能体分工协作完成复杂任务。

特点

• 每个 Agent 有专属角色

• 互相通信、分工、协作

• 能处理复杂、多步骤、跨领域任务

常见架构

1. 集中式
有一个“主管 Agent”分配任务。

2. 分布式
无中心,Agent 之间互相沟通。

3. 分层式
上层决策,下层执行。

典型应用

• 代码开发团队(产品、前端、后端、测试)

• 内容创作团队

• 企业自动化流程
四、面试高频三连问(标准答案)

1. RAG 和 Fine-tuning 区别?

◦ RAG:外挂知识库,不改模型,安全、实时、成本低。

◦ 微调:改模型权重,适合固定风格/专业领域,成本高。

2. Agent 和普通 LLM 区别?

◦ LLM:你问啥它答啥,被动。

◦ Agent:有目标、会思考、会用工具、自主完成任务。

3. Agent 和工作流区别?

◦ 工作流:固定步骤,按流程跑。

◦ Agent:动态思考,自主决策下一步。
如果你要,我可以直接帮你整理成:
「AI 前端面试 10 分钟速背版」
你拿去背,面试基本稳过。#牛客AI配图神器#
全部评论

相关推荐

03-17 23:54
黑龙江大学 Java
来个白菜也好啊qaq:可以的,大厂有的缺打手
点赞 评论 收藏
分享
本人技术栈主要是Python+Go,之前有两段后端实习经历一面一开始面试官就围着我之前的实习项目问,问得还挺细的:当时做项目的时候,为什么要引入父子索引?还有BM25,引入的原因是什么,比例是怎么设置的,整个具体流程是怎样的,有没有做rerank操作?如果做了rerank, rerank之后返回几个块?有没有做过一些验证来确保效果?rerank之后的topk截断是怎么实现的?为什么选这个k值,有没有考虑过其他方案?让我讲一下上下文工程,还有记忆功能是怎么实现的。除了AI相关的项目,还问了我之前做的后端实习项目,都是一些项目里的细节问题。分布式令牌桶限流、漏桶限流,还有滑动窗口算法限流,这三个都让我讲一下。尤其问了滑动窗口的数据结构会包含哪些字段,滑动窗口对比令牌桶有什么缺点,还有用Redis的什么数据结构能实现滑动窗口。又绕回我自己做的项目,让我讲一下LRU的原理和实现。布隆过滤器的原理、应用场景,也让我详细说一下。MySQL索引失效的情况,这块我八股好久没看了,只想起来两个,被面试官追问了好久,有点没答好。面试官还补问了一句,like查询会不会导致索引失效。MySQL的事务隔离级别,还有一致性相关的内容,让我讲清楚。MVCC这块问得特别细,反复追问,还举了具体场景,问这种情况下会创建几个readview,我当时琢磨了半天,尽量把自己知道的都讲了。最后还问了MySQL的锁相关知识,行锁、表锁这些都涉及到了。手撕代码环节,我跟面试官坦诚说,最近一直在实习,好久没刷过题了,然后面试官就出了一道反转链表,不算特别难,慢慢理清楚思路就做出来了。二面跟一面不一样,二面全程没涉及后端相关的问题,全是AI agent和RAG相关的,而且大部分都围绕我之前做的RAG项目展开,问得特别深入。首先问我,做RAG项目的时候,是怎么评测效果的?有哪些评测维度,具体用到了哪些指标?然后问项目里的数据集包含什么内容,数据来源、数据格式这些都问到了。如果让我对RAG的相关度和回答效果做优化,我有什么思路?有没有更体系化的优化方案,而不是零散的调整。面试官还举了个具体场景,比如有一千条数据,需要做求和处理,让我说说这种数据处理场景,我会怎么设计实现。RAG的性能怎么提升,有没有实际的优化思路,不管是工程层面还是算法层面。我项目里的上下文是怎么处理的,有没有什么优化的方向,比如上下文过长、冗余这些问题怎么解决。agent的长记忆和短记忆之间,怎么做到协同工作的,两者的衔接逻辑是什么。最后问我,有什么思路能让自己做的agent更智能?这个问题我感觉太宽泛了,当时没太get到面试官具体想了解什么,就主要围绕我工程开发中遇到的实际问题,讲了一些针对性的优化思路。手撕代码环节,出的是全排列,这个之前刷过类似的,思路比较清晰,顺利做出来了。感觉面试官比较爱问的AI问题就是RAG 的全链路优化、Agent、减少幻觉
查看23道真题和解析
点赞 评论 收藏
分享
评论
4
11
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务