1. 如果让你设计一个 Agent 的规划器,怎么避免它每一步都重新规划,导致路径震荡?规划器不能每拿到一个 observation 就整体重算,不然很容易出现前一步刚决定检索,后一步又改成总结,再下一步又回去检索,整个执行路径会来回抖动。更稳的做法是把规划分成“全局计划”和“局部调整”两层。全局计划只定义阶段目标,比如信息收集、证据校验、结果生成;局部调整只允许在当前阶段内微调具体动作。另外要给 planner 一个明确的状态表示,比如当前子目标、已完成步骤、失败原因、剩余预算。如果没有状态约束,模型会把每次新 observation 当成全新任务来理解。线上一般还会加“重规划阈值”,只有在...