路过的牛爷爷们来试着答一下吧你理解的 Agent 架构是什么?一个 Agent 系统一般由哪些模块组成?Tool 是怎么设计的?什么样的功能应该做成 Tool?Memory 分几种?Short-term / Long-term memory 怎么实现?Agent 是怎么做任务规划的?是 ReAct 还是 Plan-Execute?多 Agent 协作是怎么做的?你做 RAG 的完整流程是什么?(数据 → 切分 → embedding → 向量库 → 检索 → 重排 → 生成)Chunk 大小怎么确定?为什么?向量召回不准怎么办?如何做 rerank?用什么模型?如何评估 RAG 效果?指标是什么?RAG 和微调怎么取舍?多路召回怎么做?如何降低 RAG 的延迟?如何解决幻觉问题?如何降低模型幻觉?如何让模型输出稳定格式?如何做自动化 Prompt 优化(A/B test / eval)?如果一个 Agent 系统 QPS 很高,你怎么设计架构?向量检索很慢怎么办?LLM 调用很慢怎么办?如何做缓存?如何做降级?如何控制成本?(LLM 很贵)如何设计一个高并发的 RAG 系统架构?业务场景(电商):让你做一个类似 TikTok Shop / 淘宝 的 AI 导购助手,用户可以对话买东西,你会怎么设计这个系统?在电商 Agent 里,你觉得有哪些工具(Tool)需要提供给 Agent?电商 Agent 的 Memory 应该存什么?如果要做一个“自动运营 Agent”(自动生成活动、改价、发券),怎么设计?电商商品库做 RAG,embedding 用什么字段?用户问“适合送男朋友的礼物”,RAG 怎么做?如何把“推荐系统”和“RAG”结合?如何做个性化 RAG?设计一个电商 AI 导购 Agent,支持:“商品推荐、对话购物、查询订单、售后问题、个性化推荐、高并发”