1. 你们线上大模型应用的整体架构是怎样的?常见架构就是这几层:用户请求先进入 API 网关,再到业务服务层。业务服务层负责鉴权、限流、Prompt 拼装、会话管理、工具编排。如果有知识库,就先走检索链路;如果要调外部能力,就走工具调用;最后把上下文交给大模型生成结果。生成结果出来后,再做内容过滤、格式化、日志落库、监控上报。核心链路一般是:用户请求 -> 业务编排 -> 检索/工具 -> 模型推理 -> 后处理 -> 返回结果2. 你们怎么做 Prompt 工程?Prompt 不是简单写一句提示词,而是模板化管理。常见做法是把 Prompt 拆成几部分:syst...