关注
1.RAG 的工作流程一般分为两步:第一步是检索,系统把用户的问题转成向量,然后在向量数据库中找到语义最相近的文档片段;第二步是生成,把这些相关片段和问题一起放进 prompt,让 LLM 根据上下文组织答案。
2.如果直接微调大模型,知识会被压缩进参数里,后续要改动或删除都比较麻烦。而 RAG 把知识放在外部知识库里,模型只是调用这些知识。因此 RAG 主要解决的是知识管理问题:知识可更新、可追踪、可替换,也更适合做企业问答、客服、文档助手这类场景。
查看原帖
点赞 评论
相关推荐
点赞 评论 收藏
分享
牛客热帖
更多
正在热议
更多
# 你以为的实习VS真实的实习 #
169325次浏览 946人参与
# 妈妈治愈了你哪些脆皮时刻 #
52680次浏览 420人参与
# 我的实习日记 #
4206944次浏览 33449人参与
# 从mentor身上学到了__ #
69808次浏览 959人参与
# 第一次找实习,我建议__ #
92931次浏览 941人参与
# 硬件/芯片校招攻略 #
22801次浏览 310人参与
# 文远知行求职进展汇总 #
7687次浏览 43人参与
# 你觉得mentor喜欢什么样的实习生 #
66141次浏览 1100人参与
# 跳槽时有那些注意事项 #
146584次浏览 607人参与
# 工作两年想退休了 #
288165次浏览 2096人参与
# 拼多多工作体验 #
70689次浏览 468人参与
# 非技术岗是怎么找实习的 #
354530次浏览 2673人参与
# 面试等了一周没回复,还有戏吗 #
258952次浏览 1877人参与
# 牛客AI文生图 #
31936次浏览 321人参与
# 机械笔面试考察这些知识点 #
24237次浏览 172人参与
# 你遇到过哪些神仙同事 #
151096次浏览 782人参与
# 选择和努力,哪个更重要? #
223670次浏览 1608人参与
# 如果人间有后悔药 #
32205次浏览 531人参与
# 面试线索爆料 #
139265次浏览 718人参与
# 数字马力求职进展汇总 #
364798次浏览 2433人参与
查看17道真题和解析