04-28 10:00 燕山大学人工智能发布于河北

关注

rag已经死了吗？

大二玩了半年RAG，我发现最靠谱的解法，居然是百年图书馆逻辑

本人大二，接触Agent开发从RAG入门，摸过GraphRAG、RAGFlow这些热门项目，也啃过LlamaIndex、LangChain框架，踩了不少坑，也有了些不一样的想法，纯分享思路，不做落地。

先说说我看到的核心问题：
RAGFlow的溯源功能能标清信息出处，解决了模型胡编的问题，却缺了LangChain那样的隐私数据守卫——检索时只过滤正文，溯源链接还留着，等于给隐私泄露、外网信息跳转留了后门。
同时现在的RAG大多是文档乱塞一锅炖，海量数据根本管不住，开源框架要么太笨重新手难维护，要么功能太简陋撑不起场景。

想通这些的时候我正在学校图书馆，突然发现：我们卷破头的RAG问题，现代图书馆这套人类用了上百年的「信息管理系统」，早就完美解决了。

核心思路完全对标图书馆逻辑，分三点：

1. 先分级管控，从根源堵隐私漏洞
像图书馆分普通阅览区、内部资料室、涉密档案室一样，给文档做分级。敏感内容直接拦在库外，内部文档没权限连检索都搜不到，自然不会有溯源链接泄露的问题，只有合规公开内容才开放完整溯源。
2. 先分类入库，解决海量数据混乱
图书馆新书不会直接堆书架，会先验收、查重、按标准分类标引再上架。对应到RAG里，就是文档先自动清洗、去重、分类打标，再分到独立向量库物理隔离，再多文档也井井有条，不会越用越臃肿。
3. 统一规范做开源生态，解决「各玩各的」的痛点
图书馆能跨馆互通，核心是有统一的编目规则。我们也可以定一套极简统一的开源RAG库规范，实现两个核心：一是人人都能按规范分享自己的RAG库，开箱即用不用二次处理；二是符合规范的任意两个RAG库，都能无缝拼接，自动对齐分类、去重、更新索引，不用手动改配置。

现在RAG圈总在卷框架、卷算法，却忘了做RAG的初衷，是让普通人用最低成本让AI落地。这套图书馆逻辑的思路，不用高算力不堆复杂技术，刚好能让本地小模型配上标准化RAG库，真正变得可用。

纯思路分享，不打算自己落地做项目，玩RAG的朋友有想法，欢迎一起交流。

#RAG# 大模型 #AI开发# 开源思路 #大学生编程

全部评论

推荐最新楼层

空想天使

广州大学 Java

有的兄弟有的，rag有这些技术，第一点叫做二级权限校验，在用户输入，调向量库之前，先去用户数据库找找有没有这用户，如果没有就挡住，第二部就是调知识库之前再去用户数据库核对一下，他的读库权限和检索库名是否对应，不对应也挡住。第二点叫做分库管理+元数据过滤。核心就是用户问2024或者指定v0.1版本的文档，那检索的时候就筛选对应的文档标签。第三点我还没听说过倒是，毕竟rag这玩意做出来的主要目的就是赋能企业的知识库，而企业知识库一般都是私有的，比较讲究私有化部署，有啥需要共享内容的直接调用web search得了

20 回复分享

发布于 04-28 13:38 广东

胡夫金字塔

郑州大学 Java

12早就实现了吧，早就分级分类了，3问题是没有一个统一的标准，因为针对不太类型的数据格式目前都是不一样的

4 回复分享

发布于 04-29 19:02 河南

早餐喝豆浆

门头沟学院人工智能

佬大二就玩这么深啊

2 回复分享

发布于 04-29 16:10 广东

千悦汐

门头沟学院 Java

老，能详细谈谈你的RAG思路吗？最近面试腾讯，问了一个和你这个一样的问题。

1 回复分享

发布于 05-09 13:23 安徽

jo4

门头沟学院人工智能

1分级管控挺好的，但不是专门解决隐私问题的，解决隐私，溯源链接等也加个权限管理就行了

1 回复分享

发布于 05-08 21:42 四川

atri_

西安电子科技大学杭州研究院人工智能

3不太可行啊😦你怎么解决不同embedding模型的纬度问题，和他们的向量空间分布问题啊

1 回复分享

发布于 05-06 14:40 浙江

study_me

门头沟学院人工智能

问题不是RAG本身是工程化没跟上

1 回复分享

发布于 04-29 18:16 浙江

Akhasi

西安电子科技大学 Java

如果说rag已死那大家理解的rag都是狭义的向量检索，可是rag是叫检索增强生成，个人认为大模型固有知识之外的任何结果的检索，调用，返回都属于rag，读文件，工具调用的返回结果这都是检索增强生成，rag是一个抽象层，并不是应用层

点赞回复分享

发布于昨天 12:02 陕西

沙福林

同济大学后端工程师

不是死了，是一种选择，无论是缓存还是rag还是agent都是一种设计方案

点赞回复分享

发布于 05-14 14:58 北京

宇智波bug

华中科技大学 Java

同学拼多多【暑假实习/春招】机会考虑吗？链接见主页，团队氛围好，工作内容挑战性强，转正薪资待遇极具竞争力。可一对一帮查进度，解答过程问题。26春招：https://careers.pddglobalhr.com/campus/grad?t=GVpddkkjmz 27实习：https://careers.pddglobalhr.com/campus/intern?t=HypMxi4pJe

点赞回复分享

发布于 05-11 13:17 上海

米哈游校招进主页喵

米哈游_测试开发工程师

大佬考虑我司不考虑的话可以看我主页帖子

点赞回复分享

发布于 04-30 08:50 陕西