科大讯飞 AI Agent 二面

1、自我介绍

2、做了一个企业知识库 + 办公助手 Agent的项目

3、Agent 和传统聊天机器人最大的区别是什么

传统聊天机器人更多是围绕对话生成展开,本质上是“用户问一句,模型答一句”。AI Agent 不只是回答,它还要理解目标、拆分任务、决定下一步动作,并且在必要时调用外部工具完成任务。所以 Agent 更强调“决策能力”和“执行能力”,而不是单纯的生成能力。

比如用户问“请假流程是什么”,这更像知识问答;如果用户说“帮我查一下我下周一有没有会,如果没有就给我安排一个项目同步会”,这就不是普通聊天了,因为它涉及状态判断、调用日历工具、执行会议创建等一系列动作,这才更符合 Agent 的定义。

4、Agent 的核心组成有哪些

一个完整的 Agent,一般至少包括任务理解、记忆管理、规划决策、工具使用和结果生成这几部分。任务理解负责识别用户当前意图;记忆管理负责维护多轮上下文;规划决策负责判断当前应该做什么;工具使用负责调用外部系统完成真实动作;结果生成负责把执行结果组织成最终回复。

在工程实现里,还会再加两个关键部分。一个是状态管理,用来明确当前任务处于哪个阶段;另一个是观测和评估,用来分析线上效果和定位问题。真正做过 Agent 项目以后会发现,工程部分的重要性其实不比模型本身低。

5、任务规划是怎么做的

任务规划本质上是把用户一句自然语言请求,转换成一个可执行的步骤序列。如果任务很简单,比如只问一个概念,那通常不需要复杂规划,直接走问答链路就行。如果任务是复合型的,比如“帮我查下今天下午有没有空,然后约个会,再整理会议背景发给组里”,这时就需要先分析目标,再拆出多个步骤。

常见做法有两类。一种是让大模型直接输出计划;另一种是程序控制主流程,把规划限制在固定状态机或工作流里。真实业务里更常见的是第二种,因为完全依赖模型自由规划虽然灵活,但稳定性会差一些。一般会让模型负责理解和补参数,程序负责控制任务流转和关键动作执行。

6、Function Calling 的本质是什么

Function Calling 的本质不是让模型直接做事,而是让模型先输出一个结构化的函数调用请求,再由程序真正去执行。也就是说,模型负责决定调用哪个工具、传什么参数,程序负责执行工具并拿到真实结果。这样做的好处是可控性更高,也更适合接业务系统。

如果没有 Function Calling,模型可能会直接“脑补”一个结果。但用了 Function Calling 之后,像查日程、查数据库、发邮件、调审批接口这类动作,都能通过程序真实执行,结果也更可信。所以在 Agent 项目里,Function Calling 基本是非常核心的一层能力。

7、RAG 在 Agent 里一般起什么作用

RAG 在 Agent 里通常承担“知识获取”这一层能力。Agent 本身负责判断当前需不需要去查知识,RAG 则负责把相关文档检索出来,提供给模型做回答依据。所以从关系上看,RAG 往往是 Agent 的一个子模块,而不是和 Agent 并列的东西。

比如用户问制度规则、产品文档、内部流程,这类信息更适合走 RAG。Agent 先判断这是知识问答任务,然后触发检索、重排、生成。如果用户是要执行动作,比如查日程、创建工单,那可能就不需要 RAG,而是直接走工具调用。

8、多轮对话里上下文怎么管理

多轮对话不能简单把所有历史记录原样拼进去,因为那样会带来 token 成本高、噪声多、信息干扰大的问题。通常会把上下文分成三类处理。第一类是最近几轮对话,这部分一般直接保留,因为和当前任务最相关;第二类是任务状态,比如用户已经补充过哪些参数、当前缺什么信息、上一步执行到了哪里;第三类是长期记忆,比如用户身份、部门、偏好、常用配置等,这些信息更适合结构化存储,按需召回。

在 Agent 场景里,最关键的其实不是“保留多少历史”,而是“保留哪些真正影响当前决策的信息”。

9、怎么减少工具误调用

工具误调用本质上是模型对任务边界理解不清,或者工具描述不清晰导致的。常见的解决方式有几种。第一,工具描述要写得足够明确,尤其是适用场景、参数含义和限制条件;第二,在真正给模型开放工具前,先做一层任务分类,不是所有问题都让模型在全部工具里自由选择;第三,工具参数要做 schema 校验,缺字段或者格式不对时不能直接执行;第四,工具返回结果之后还要做结果校验,避免模型把失败执行包装成成功。

本质上,工具调用不能完全靠模型“猜”,必须通过工程手段做约束。

10、为什么很多 Agent 最后会做成 Workflow,而不是完全自由规划

因为完全自由规划虽然看起来更智能,但真实上线以后会发现稳定性和可控性不够。尤其是在涉及企业办公、教育、客服、审批这类场景时,大家更关注的是链路能不能稳定跑通,而不是模型能不能临场发挥。所以很多 Agent 项目最后会采用 Workflow 方案,把主流程拆成固定节点,每个节点负责明确的事情,比如意图分类、补参数、调用工具、结果校验。

这样做的好处是调试方便、评估方便、回放方便,也更容易控制异常分支。真正落地时,通常不是纯 W

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏 文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点,内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线,提供高频题解析、标准答题思路与工程落地方法,帮助你高效查漏补缺.

全部评论
好家伙,你这整理的真好啊
1 回复 分享
发布于 03-15 18:50 陕西
虽然是3个困难题,但都是hot100上的,真良心呀😍
点赞 回复 分享
发布于 04-16 18:01 黑龙江

相关推荐

04-02 01:37
已编辑
门头沟学院 Java
面试官太温柔了,也有引导,真想再面试一次1.自我介绍,项目难点,担任什么角色2.项目背景下,智能体的工作流链路是怎么实现的3.有用智能体框架什么吗,还是代码控制4.智能体拓展性怎么样5.图文检索怎么做的;语义库是怎么构建的6.ai开发过程中,调用工具,记忆管理怎么实现的7.openclaw使用的体验,跟做的agent有什么区别8.有用过它做过大的工作,管理知识,或者自媒体相关的吗9.to B方向的 sass软件朝着什么方向去演进传统的工作方式,重构之类的,先去用10.python 还是 java,有用过什么ai coding工具吗,cursor claude code11.拿到项目到ai工具到交付,怎么验收,哪些环节需要人注意12.有意识给ai工具优质上下文吗13.ai生成代码很好,但它是不负责的,怎么进行一个代码的review;功能完备,安全,性能要不要考虑14.有用过ai工具自动化测试,做端到端自动化测试15.java掌握程度:hashmap集合里面有用到集合吗16.平时有用到锁吗17.用到可重入锁18.两个线程同时对arrayList同时添加,出现什么问题19.并发问题,比如钱,库存,订单,怎么实现20.java异常:编译期异常,运行时异常21.两种会倾向于抛出哪种异常,22.数据库缓存了解的深吗,怎么保证一致性23.redis实现会话管理,怎么保证redis和数据库中的数据一致 性24.threadlocal管理用户上下文,为撒选择这个上下文管理,线程安全吗25.mysql索引熟悉吗,组合索引,怎么保证查询索引26.数据库事务隔离级别,脏读不可重复读幻读怎么解决27.有观点ai取代初级程序员,作为将成为初级程序员的你,有哪些考虑28“超级个体”,假如公司有要求一个全栈工程师,你有哪些想法29自我感觉有哪些缺点,或者缩减下技术上有什么缺点30.反问技术爆炸,知识爆炸,ai发展,对求职者和在职者有什么建议
查看30道真题和解析
点赞 评论 收藏
分享
评论
8
49
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务