完美世界 AI Agent开发 一面
1. 自我介绍
2. 介绍一下你的项目
3. Coze 新旧两种编排方式的差异是什么,你在设计节点时怎么取舍
拖拽式编排适合流程稳定、路径清晰、节点边界明确的场景,比如固定审批、FAQ 问答、标准化信息抽取。Agent 化编排更适合目标不稳定、路径动态变化、需要中间决策的场景,比如多轮任务执行、复杂信息搜集、跨工具协作。节点设计时不能按功能菜单式地乱拆,而要按状态边界和失败恢复边界去拆。一个节点如果既负责理解问题、又负责查知识、又负责生成结果,那一旦出错很难定位,也很难重试。真正稳的节点应该输入清晰、输出结构化、失败可恢复。
4. 你写过哪些 MCP 工具,设计一个 MCP 工具协议时最关键的是什么
MCP 工具本质上不是“给模型暴露一个函数”,而是定义一套可发现、可约束、可观测的能力接口。设计时最关键的是参数 schema、权限边界、错误语义和幂等性。比如一个“检索品牌舆情案例”的工具,输入必须明确到品牌、时间范围、语言范围和风险等级,输出不能只是一段自然语言,而应该带证据链接、来源可信度和时间戳。否则模型虽然能调工具,但拿到的返回结果无法稳定进入下一步推理。
tool_schema = {
"name": "search_risk_case",
"description": "检索相似品牌风险案例",
"input_schema": {
"type": "object",
"properties": {
"brand": {"type": "string"},
"query": {"type": "string"},
"days": {"type": "integer"}
},
"required": ["brand", "query"]
}
}
print(tool_schema)
5. 上下文管理是怎么做的,为什么不能只保留最近几轮对话
只保留最近几轮对话的前提是任务足够短,而且历史信息的价值随轮次快速衰减,但真实 Agent 场景通常不是这样。很多任务会跨多轮、多工具、多阶段执行,真正重要的是状态而不是原始聊天记录。比较稳的做法是把上下文拆成系统约束、当前目标、最近交互、长期记忆、工具结果和状态摘要六类,最近几轮只负责保留局部语义,状态摘要负责保留任务连续性。否则对话一长,模型就会把早期关键约束忘掉,或者把中间结果误认为最终结论。
6. ReAct 的几种模式差异是什么,为什么很多实现最后都要做成显式状态机
最原始的 ReAct 是 Thought、Action、Observation 交替,让模型边想边做,但这种方式在 demo 里很好看,到了生产环境就会遇到不可控问题,比如无限思考、乱调工具、观察结果污染后续推理。后面很多实现都在往显式状态机方向收敛,也就是把计划、执行、观察、重试、回退和终止条件写成系统运行时的一部分。这样模型负责局部决策,系统负责全局约束。真正工业可用的 ReAct,重点不是让模型“会思考”,而是让它每一步都在受控状态里思考。
7. 设计一个全自动 AI 漫剧创作 Agent,你会怎么搭
可以拆成世界观设定 Agent、剧情规划 Agent、角色一致性 Agent、分镜生成 Agent、对白润色 Agent 和评审 Agent。输入不是一句“帮我写个故事”就完了,而是题材、时长、角色设定、禁用内容、风格参考和目标受众。中间要维护一份显式 story state,包括角色关系、时间线、关键伏笔、已用设定和未回收线索。最难的是人物前后一致和长剧情闭环,系统不能只靠每轮 prompt 临时记忆,必须把角色卡和剧情状态外置,否则越写越飘。
8. 在这种创作型 Agent 里,人物前后一致怎么保证
人物一致性不能靠一句“请保持人物设定一致”解决。更有效的办法是把角色拆成不可变属性、弱可变属性和动态状态。不可变属性如年龄区间、世界观身份、说话风格底色;弱可变属性如好恶、互动方式、冲突偏好;动态状态则是当前情绪、目标和已知信息。每一轮生成前都先读取角色状态,再对输出做一致性校验。创作场景里最容易出问题的不是文采,而是角色知道了不该知道的东西,或者语言风格突然变人设。
9. 如果你觉得一个 Agent 流程设计里最大的问题有三个,通常会是哪三个
通常是状态不清、工具不稳、评测缺失。状态不清会导致模型忘记目标、重复做事或者把临时中间态当成长期事实;工具不稳会导致调用成功率低、错误语义混乱、参数填充不完整;评测缺失会让团队只看 demo 效果,根本不知道线上失败发生在哪一步。真正复杂的 Agent 项目,难点往往不是模型答得不漂亮,而是链路一长之后每一步的不确定性叠加起来,把最终成功率打穿。
10. 如果只发第一版,你会保留哪些最重要的功能
第一版不能追求“什么都能做”,而应该保留最能形成闭环的能力。对于复杂 Agent,通常最值得保留的是任务入口、状态管理、一个高价值主流程、少量稳定工具、审计日志和人工接管。像多角色风格细化、自反思、多轮自动重写、复杂记忆检索这类增强能力,第一版可以延后。因为真正决定系统能不能上线的,不是花样多不多,而是主链路是否可控、可追踪、可回滚。
11. 你用过
剩余60%内容,订阅专栏后可继续查看/也可单篇购买
本专栏聚焦 AI-Agent 面试高频考点,内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线,提供高频题解析、标准答题思路与工程落地方法,帮助你高效查漏补缺.
查看7道真题和解析