科大讯飞 AI Agent 二面

1、自我介绍

2、做了一个企业知识库 + 办公助手 Agent的项目

3、Agent 和传统聊天机器人最大的区别是什么

传统聊天机器人更多是围绕对话生成展开，本质上是“用户问一句，模型答一句”。AI Agent 不只是回答，它还要理解目标、拆分任务、决定下一步动作，并且在必要时调用外部工具完成任务。所以 Agent 更强调“决策能力”和“执行能力”，而不是单纯的生成能力。

比如用户问“请假流程是什么”，这更像知识问答；如果用户说“帮我查一下我下周一有没有会，如果没有就给我安排一个项目同步会”，这就不是普通聊天了，因为它涉及状态判断、调用日历工具、执行会议创建等一系列动作，这才更符合 Agent 的定义。

4、Agent 的核心组成有哪些

一个完整的 Agent，一般至少包括任务理解、记忆管理、规划决策、工具使用和结果生成这几部分。任务理解负责识别用户当前意图；记忆管理负责维护多轮上下文；规划决策负责判断当前应该做什么；工具使用负责调用外部系统完成真实动作；结果生成负责把执行结果组织成最终回复。

在工程实现里，还会再加两个关键部分。一个是状态管理，用来明确当前任务处于哪个阶段；另一个是观测和评估，用来分析线上效果和定位问题。真正做过 Agent 项目以后会发现，工程部分的重要性其实不比模型本身低。

5、任务规划是怎么做的

任务规划本质上是把用户一句自然语言请求，转换成一个可执行的步骤序列。如果任务很简单，比如只问一个概念，那通常不需要复杂规划，直接走问答链路就行。如果任务是复合型的，比如“帮我查下今天下午有没有空，然后约个会，再整理会议背景发给组里”，这时就需要先分析目标，再拆出多个步骤。

常见做法有两类。一种是让大模型直接输出计划；另一种是程序控制主流程，把规划限制在固定状态机或工作流里。真实业务里更常见的是第二种，因为完全依赖模型自由规划虽然灵活，但稳定性会差一些。一般会让模型负责理解和补参数，程序负责控制任务流转和关键动作执行。

6、Function Calling 的本质是什么

Function Calling 的本质不是让模型直接做事，而是让模型先输出一个结构化的函数调用请求，再由程序真正去执行。也就是说，模型负责决定调用哪个工具、传什么参数，程序负责执行工具并拿到真实结果。这样做的好处是可控性更高，也更适合接业务系统。

如果没有 Function Calling，模型可能会直接“脑补”一个结果。但用了 Function Calling 之后，像查日程、查数据库、发邮件、调审批接口这类动作，都能通过程序真实执行，结果也更可信。所以在 Agent 项目里，Function Calling 基本是非常核心的一层能力。

7、RAG 在 Agent 里一般起什么作用

RAG 在 Agent 里通常承担“知识获取”这一层能力。Agent 本身负责判断当前需不需要去查知识，RAG 则负责把相关文档检索出来，提供给模型做回答依据。所以从关系上看，RAG 往往是 Agent 的一个子模块，而不是和 Agent 并列的东西。

比如用户问制度规则、产品文档、内部流程，这类信息更适合走 RAG。Agent 先判断这是知识问答任务，然后触发检索、重排、生成。如果用户是要执行动作，比如查日程、创建工单，那可能就不需要 RAG，而是直接走工具调用。

8、多轮对话里上下文怎么管理

多轮对话不能简单把所有历史记录原样拼进去，因为那样会带来 token 成本高、噪声多、信息干扰大的问题。通常会把上下文分成三类处理。第一类是最近几轮对话，这部分一般直接保留，因为和当前任务最相关；第二类是任务状态，比如用户已经补充过哪些参数、当前缺什么信息、上一步执行到了哪里；第三类是长期记忆，比如用户身份、部门、偏好、常用配置等，这些信息更适合结构化存储，按需召回。

在 Agent 场景里，最关键的其实不是“保留多少历史”，而是“保留哪些真正影响当前决策的信息”。

9、怎么减少工具误调用

工具误调用本质上是模型对任务边界理解不清，或者工具描述不清晰导致的。常见的解决方式有几种。第一，工具描述要写得足够明确，尤其是适用场景、参数含义和限制条件；第二，在真正给模型开放工具前，先做一层任务分类，不是所有问题都让模型在全部工具里自由选择；第三，工具参数要做 schema 校验，缺字段或者格式不对时不能直接执行；第四，工具返回结果之后还要做结果校验，避免模型把失败执行包装成成功。

本质上，工具调用不能完全靠模型“猜”，必须通过工程手段做约束。

10、为什么很多 Agent 最后会做成 Workflow，而不是完全自由规划

因为完全自由规划虽然看起来更智能，但真实上线以后会发现稳定性和可控性不够。尤其是在涉及企业办公、教育、客服、审批这类场景时，大家更关注的是链路能不能稳定跑通，而不是模型能不能临场发挥。所以很多 Agent 项目最后会采用 Workflow 方案，把主流程拆成固定节点，每个节点负责明确的事情，比如意图分类、补参数、调用工具、结果校验。

这样做的好处是调试方便、评估方便、回放方便，也更容易控制异常分支。真正落地时，通常不是纯 W

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点，内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线，提供高频题解析、标准答题思路与工程落地方法，帮助你高效查漏补缺.