RAG 工作原理:“先检索,后生成”。 存储:将私域文档切片并转化为向量存入数据库。 查询:用户提问时,先在库中匹配最相关的知识片段。 回答:将参考资料+问题交给大模型,让其基于上下文作答。 相比微调,RAG 解决了 知识过时的问题。无需重训模型,更新文档即可同步最新信息。

相关推荐

牛客网
牛客网在线编程
牛客网题解
牛客企业服务