1. 个人介绍2. 实习拷打3. RAG 的优化,项目中 Agent 的流程RAG 的核心链路是:文档处理 -> 建索引 -> 检索召回 -> 重排筛选 -> 上下文拼接 -> 大模型生成。它的优化也主要围绕这几步展开。先说文档处理。原始文档不能直接粗暴切块,要先做清洗,比如去掉无效页眉页脚、目录、乱码、重复段落。然后做合理切分。切分太大,会带入噪声;切分太小,上下文会断。常见做法是按段落、标题层级、语义边界切 chunk,并适当设置 overlap。再说检索阶段。RAG 不一定只用向量检索,通常会把 BM25、向量召回、关键词召回混合起来。向量召回解决语义相似,...