1. 讲一下你做过的一个 Agent 项目,重点说业务背景、流程和你负责的部分2. 如果你的系统里也有高并发场景,你会怎么设计限流、降级和幂等高并发下最怕的不是平均请求慢,而是少数慢请求把整条链路拖死。Agent 系统一般调用链长,请求里既有模型推理,也有工具 I/O 和数据库操作,所以不能只靠一个网关限流就完事。我会把限流拆成几层:入口做用户级和租户级限流,任务编排层做任务队列隔离,工具层做并发池控制,模型层再做 token 预算和超时回收。这样某一个工具服务出问题时,不至于把整个系统打爆。幂等也很关键,尤其是有写操作的时候。像发通知、写审批、更新状态、创建工单这种动作,必须给每次执行一个 ...