1. 自我介绍2. 介绍下项目,重点讲架构、关键设计和线上问题3. Agent 的上下文窗口不够时,长短期记忆应该怎么分层设计长短期记忆不能简单理解成“最近消息”和“很久以前的消息”。更合理的设计是把状态拆成三层:工作记忆负责当前回合执行所需的最小上下文,摘要记忆负责阶段性中间结论,长期记忆负责稳定事实、偏好、任务状态和关键证据索引。这样做的好处是短链路推理不会被旧噪声拖死,而长任务又能在需要时按状态检索历史事实。真正难的不是分层本身,而是写入和召回策略。不是每条消息都值得进长期记忆,通常只把高价值、可复用、低歧义的信息写进去,比如用户偏好、外部工具执行结果、关键约束、任务完成状态。否则记忆库...