1.RAG 的工作流程一般分为两步:第一步是检索,系统把用户的问题转成向量,然后在向量数据库中找到语义最相近的文档片段;第二步是生成,把这些相关片段和问题一起放进 prompt,让 LLM 根据上下文组织答案。 2.如果直接微调大模型,知识会被压缩进参数里,后续要改动或删除都比较麻烦。而 RAG 把知识放在外部知识库里,模型只是调用这些知识。因此 RAG 主要解决的是知识管理问题:知识可更新、可追踪、可替换,也更适合做企业问答、客服、文档助手这类场景。
点赞 评论

相关推荐

牛客网
牛客网在线编程
牛客网题解
牛客企业服务