#

RAG

#
31901次浏览 594人互动
此刻你想和大家分享什么
热门 最新
rag已经死了吗?
大二玩了半年RAG,我发现最靠谱的解法,居然是百年图书馆逻辑本人大二,接触Agent开发从RAG入门,摸过GraphRAG、RAGFlow这些热门项目,也啃过LlamaIndex、LangChain框架,踩了不少坑,也有了些不一样的想法,纯分享思路,不做落地。先说说我看到的核心问题:RAGFlow的溯源功能能标清信息出处,解决了模型胡编的问题,却缺了LangChain那样的隐私数据守卫——检索时只过滤正文,溯源链接还留着,等于给隐私泄露、外网信息跳转留了后门。同时现在的RAG大多是文档乱塞一锅炖,海量数据根本管不住,开源框架要么太笨重新手难维护,要么功能太简陋撑不起场景。想通这些的时候我正在学校图书馆,突然发现:我们卷破头的RAG问题,现代图书馆这套人类用了上百年的「信息管理系统」,早就完美解决了。核心思路完全对标图书馆逻辑,分三点:1. 先分级管控,从根源堵隐私漏洞像图书馆分普通阅览区、内部资料室、涉密档案室一样,给文档做分级。敏感内容直接拦在库外,内部文档没权限连检索都搜不到,自然不会有溯源链接泄露的问题,只有合规公开内容才开放完整溯源。2. 先分类入库,解决海量数据混乱图书馆新书不会直接堆书架,会先验收、查重、按标准分类标引再上架。对应到RAG里,就是文档先自动清洗、去重、分类打标,再分到独立向量库物理隔离,再多文档也井井有条,不会越用越臃肿。3. 统一规范做开源生态,解决「各玩各的」的痛点图书馆能跨馆互通,核心是有统一的编目规则。我们也可以定一套极简统一的开源RAG库规范,实现两个核心:一是人人都能按规范分享自己的RAG库,开箱即用不用二次处理;二是符合规范的任意两个RAG库,都能无缝拼接,自动对齐分类、去重、更新索引,不用手动改配置。现在RAG圈总在卷框架、卷算法,却忘了做RAG的初衷,是让普通人用最低成本让AI落地。这套图书馆逻辑的思路,不用高算力不堆复杂技术,刚好能让本地小模型配上标准化RAG库,真正变得可用。纯思路分享,不打算自己落地做项目,玩RAG的朋友有想法,欢迎一起交流。大模型  开源思路 #大学生编程
空想天使:有的兄弟有的,rag有这些技术,第一点叫做二级权限校验,在用户输入,调向量库之前,先去用户数据库找找有没有这用户,如果没有就挡住,第二部就是调知识库之前再去用户数据库核对一下,他的读库权限和检索库名是否对应,不对应也挡住。第二点叫做分库管理+元数据过滤。核心就是用户问2024或者指定v0.1版本的文档,那检索的时候就筛选对应的文档标签。第三点我还没听说过倒是,毕竟rag这玩意做出来的主要目的就是赋能企业的知识库,而企业知识库一般都是私有的,比较讲究私有化部署,有啥需要共享内容的直接调用web search得了
点赞 评论 收藏
分享
2025-12-05 21:24
门头沟学院 Java
现在的AI后端项目是否还是太鸡肋了
到目前为止,个人感觉 90%以上的 AI 后端项目都是极其相似的一套:LangChain4j/Spring AI 搭个框架 + 调用大模型 API 做一下问答功能 + 搞点向量数据库做做 RAG 知识库 + 接点 MCP 调用一下外部系统的 API然后就没有然后了。最主要的问题是,这样的 AI 应用开发项目,基本不涉及什么高并发、高可用、分布式的场景,对于后端来说可以深挖的点很少,对于大模型来说又不涉及微调优化之类的。导致了一个很尴尬的局面:1.用这些“AI 后端项目”去面后端岗,候选人和面试官都不知道从哪挖项目的亮点。对于大部分中小厂来说,他们的业务都没有接入 AI 的必要,面试官一看你这什么,xxRAG知识库管理系统,不知道你这项目有什么价值,太简单了也没有什么场景题可挖。2.用这些“AI 后端项目”去面 agent 开发岗、大模型应用开发岗,后端出身的小伙伴不知道怎么扛住大模型相关问题拷打。这类岗位可能会拷打:怎么优化 RAG 召回、提示词工程怎么做的、向量检索原理……有些甚至问大模型微调怎么搞,大模型基础比如 Transformer 之类的。整体来说,这方面没有多少整理完善的八股,相关问题也偏实践,即场景题,但是此场景题与后端场景题既有共同的地方,也有不少出入,不是后端转过来做个玩具项目就能搞明白的。总结起来就是这些“AI 后端”的玩具项目难以包装,挖不深,拿来面两边都不讨好。可能最佳的解决办法(针对后端岗)是把它作为一个附加的服务模块加在已有的项目上,而不是独立拿出来。
飞花断音:知道是烂项目还往简历上写,他要是能靠rag问答那个烂项目找到工作还需要卖课赚钱吗?我是不明白ai有这么多场景去结合,为什么所有人都千篇一律的写那个rag问答。技术需要场景来体现,你光有技术没场景,面试官当然就只能想到什么问什么咯,答不上来你就等着挂吧。
点赞 评论 收藏
分享
内推|校招|27 届实习|阿里云 开放平台
阿里云开放平台 · 2027届实习生招聘 · 现已开放投递【加入阿里云开放平台,构建 Agentic Cloud】从「人调 API」到「AI 自主执行」,我们正在构建支撑这一跃迁的底层基础设施。过去十年,我们让人高效使用云;未来十年,我们让 AI 原生生长在云。投递简历见底部邮箱5+ 核心岗位方向 | 杭州/北京 Base 自由选择24h 简历响应承诺 | AI 前沿 最前沿技术栈 | TOKEN 自由※ 简历评估按投递时间排序,越早投递越靠前!面向 2026年11月—2027年10月 毕业同学──────────────────────────────────────────────我们的目标 —— 将阿里云升级为 Agentic Cloud──────────────────────────────────────────────「我们不仅是工具的提供者,更是 AI-Native 架构的探索者、Agent 生态的奠基人。在这里,你不是在「支持」AI,而是在构建 AI 落地的基石系统。」▎我们是谁?阿里云 API、MCP、CLI、SDK 等自动化工具、智能网关、开发者门户的建设者。过去十年,为全球开发者提供稳定、高效、一致的云开发体验。▎我们在做什么?面对大模型与 Agent 技术爆发,我们正站在新一轮技术变革起点——从「人写代码调 API」到「AI 自主决策并执行任务」的底层基础设施。▎技术栈前沿LLM · Agent · MCP · RAG · SKILLS · AIOps分布式系统 · 智能网关 · 亿级流量处理▎影响力量级你的代码将被数百万开发者使用,你的设计可能成为行业标准,你是 Agentic Cloud 时代的亲历者与构建者。──────────────────────────────────────────────开放岗位 —— 找到属于你的位置──────────────────────────────────────────────01 | Agent Infra 工程师          分布式 #基础设施02 | AI 应用研发工程师            AI应用 #全栈03 | 算法工程师 · AI Agent        算法 #模型04 | 基础平台研发工程师            平台架构 #高并发05 | 云平台智能运维系统工程师(A Star)大模型 API岗位不是你的工作边界。我们相信每位同学都有自己擅长的领域,加入后完全支持跨岗位、跨边界发挥你的特长。──────────────────────────────────────────────加入我们你能获得什么 —— 不止一份实习,是一段起跑──────────────────────────────────────────────[技术自由]  参与最前沿 AI + 云融合项目,亲手构建下一代开发范式。TOKEN 自由。[快速成长]  直面亿级流量、海量数据、复杂系统挑战,在实战中成长为全栈工程师/架构师。[行业影响力] 你的代码被数百万开发者使用,你的设计可能成为行业标准。[学术支持]  鼓励发表顶会论文,提供充足算力与研究资源,兼顾研究与工程。[温暖团队]  扁平管理 · 极客氛围 · 定期 Tech Sharing · 大佬亲自带教 · 一对一师兄。──────────────────────────────────────────────我们寻找什么样的你──────────────────────────────────────────────[√] 热爱技术,热爱创新,热爱 AI,对技术有内驱力[√] 对系统、工程有强烈好奇心,熟悉 Python / Java / Go 中至少一门语言,了解分布式系统基础[√] 对 LLM、Agent、SKILL、RAG、MCP、AIOps 等方向有一定实践或研究经验者优先[√] 兼具工程思维与抽象能力,能把模糊问题转化为清晰架构[√] 愿意深耕底层系统,也能跳出代码思考用户体验与行业影响──────────────────────────────────────────────常见问题 —— 大家最关心的干货问题──────────────────────────────────────────────Q1:Base 地在哪里?HC 紧张吗?北京 / 杭州随意选择,实习和转正均可,极少出差。部门不断发展壮大,真缺人,极高的转正比例!Q2:还没准备好 / 暂时无法实习 / 时间短怎么办?· 暂不想面试:可先加群,各业务 TeamLeader 都在群里,等你了解清楚再决定。· 无法实习:先关注我们,秋招再投递;也可春招面试走秋招直通车。· 实习时间短:可与 TL 协商,只需满足秋招转正要求即可。Q3:团队氛围 & 个人成长怎么样?组内研发氛围极好,师兄循序渐进给任务给指导,直到你能独立负责需求。每位新同学都有一对一师兄指导。面试通过后,由师兄 + TeamLeader 共同辅导,全力支持转正。Q4:面试流程 & 效率如何?承诺收到简历后 24小时内给出响应,及时沟通面试时间。面试内容为基础知识 + 简历项目(算法、语言、数据库…),语言不限,面试发掘你的优势。进度随时可查,不会拖着你不面。Q5:招收哪些岗位?JD 链接在哪?· Agent Infra 工程师· AI 应用研发工程师· 基于大语言模型和 API 的云平台智能运维系统(A Star)· 算法工程师 · AI Agent· 基础平台研发工程师扫海报二维码或私信接口人即可获取官方 JD 内推链接。══════════════════════════════════════════════准备好了吗?现在就迈出这一步══════════════════════════════════════════════一封邮件,可能是你参与构建 Agentic Cloud 的起点简历投递邮箱:zhenziwang.zzw@alibaba-inc.com内推码:1B6P2T面向 2026年11月 — 2027年10月 毕业同学Base 北京 / 杭州任选※ 简历评估按投递时间排序,越早投递越靠前══════════════════════════════════════════════
帮你内推|阿里巴巴集团 实习
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客网在线编程
牛客网题解
牛客企业服务