完美世界 AI Agent开发一面

1. 自我介绍

2. 介绍一下你的项目

3. Coze 新旧两种编排方式的差异是什么，你在设计节点时怎么取舍

拖拽式编排适合流程稳定、路径清晰、节点边界明确的场景，比如固定审批、FAQ 问答、标准化信息抽取。Agent 化编排更适合目标不稳定、路径动态变化、需要中间决策的场景，比如多轮任务执行、复杂信息搜集、跨工具协作。节点设计时不能按功能菜单式地乱拆，而要按状态边界和失败恢复边界去拆。一个节点如果既负责理解问题、又负责查知识、又负责生成结果，那一旦出错很难定位，也很难重试。真正稳的节点应该输入清晰、输出结构化、失败可恢复。

4. 你写过哪些 MCP 工具，设计一个 MCP 工具协议时最关键的是什么

MCP 工具本质上不是“给模型暴露一个函数”，而是定义一套可发现、可约束、可观测的能力接口。设计时最关键的是参数 schema、权限边界、错误语义和幂等性。比如一个“检索品牌舆情案例”的工具，输入必须明确到品牌、时间范围、语言范围和风险等级，输出不能只是一段自然语言，而应该带证据链接、来源可信度和时间戳。否则模型虽然能调工具，但拿到的返回结果无法稳定进入下一步推理。

tool_schema = {
    "name": "search_risk_case",
    "description": "检索相似品牌风险案例",
    "input_schema": {
        "type": "object",
        "properties": {
            "brand": {"type": "string"},
            "query": {"type": "string"},
            "days": {"type": "integer"}
        },
        "required": ["brand", "query"]
    }
}

print(tool_schema)

5. 上下文管理是怎么做的，为什么不能只保留最近几轮对话

只保留最近几轮对话的前提是任务足够短，而且历史信息的价值随轮次快速衰减，但真实 Agent 场景通常不是这样。很多任务会跨多轮、多工具、多阶段执行，真正重要的是状态而不是原始聊天记录。比较稳的做法是把上下文拆成系统约束、当前目标、最近交互、长期记忆、工具结果和状态摘要六类，最近几轮只负责保留局部语义，状态摘要负责保留任务连续性。否则对话一长，模型就会把早期关键约束忘掉，或者把中间结果误认为最终结论。

6. ReAct 的几种模式差异是什么，为什么很多实现最后都要做成显式状态机

最原始的 ReAct 是 Thought、Action、Observation 交替，让模型边想边做，但这种方式在 demo 里很好看，到了生产环境就会遇到不可控问题，比如无限思考、乱调工具、观察结果污染后续推理。后面很多实现都在往显式状态机方向收敛，也就是把计划、执行、观察、重试、回退和终止条件写成系统运行时的一部分。这样模型负责局部决策，系统负责全局约束。真正工业可用的 ReAct，重点不是让模型“会思考”，而是让它每一步都在受控状态里思考。

7. 设计一个全自动 AI 漫剧创作 Agent，你会怎么搭

可以拆成世界观设定 Agent、剧情规划 Agent、角色一致性 Agent、分镜生成 Agent、对白润色 Agent 和评审 Agent。输入不是一句“帮我写个故事”就完了，而是题材、时长、角色设定、禁用内容、风格参考和目标受众。中间要维护一份显式 story state，包括角色关系、时间线、关键伏笔、已用设定和未回收线索。最难的是人物前后一致和长剧情闭环，系统不能只靠每轮 prompt 临时记忆，必须把角色卡和剧情状态外置，否则越写越飘。

8. 在这种创作型 Agent 里，人物前后一致怎么保证

人物一致性不能靠一句“请保持人物设定一致”解决。更有效的办法是把角色拆成不可变属性、弱可变属性和动态状态。不可变属性如年龄区间、世界观身份、说话风格底色；弱可变属性如好恶、互动方式、冲突偏好；动态状态则是当前情绪、目标和已知信息。每一轮生成前都先读取角色状态，再对输出做一致性校验。创作场景里最容易出问题的不是文采，而是角色知道了不该知道的东西，或者语言风格突然变人设。

9. 如果你觉得一个 Agent 流程设计里最大的问题有三个，通常会是哪三个

通常是状态不清、工具不稳、评测缺失。状态不清会导致模型忘记目标、重复做事或者把临时中间态当成长期事实；工具不稳会导致调用成功率低、错误语义混乱、参数填充不完整；评测缺失会让团队只看 demo 效果，根本不知道线上失败发生在哪一步。真正复杂的 Agent 项目，难点往往不是模型答得不漂亮，而是链路一长之后每一步的不确定性叠加起来，把最终成功率打穿。

10. 如果只发第一版，你会保留哪些最重要的功能

第一版不能追求“什么都能做”，而应该保留最能形成闭环的能力。对于复杂 Agent，通常最值得保留的是任务入口、状态管理、一个高价值主流程、少量稳定工具、审计日志和人工接管。像多角色风格细化、自反思、多轮自动重写、复杂记忆检索这类增强能力，第一版可以延后。因为真正决定系统能不能上线的，不是花样多不多，而是主链路是否可控、可追踪、可回滚。