小友数研

02-03 11:16 门头沟学院大数据开发工程师发布于上海

关注

走出传统数仓范式：AI 加持下的 RAG + Workflow & Agent 如何真正落地？

在上一篇文章中，我们已经从整体架构的角度，梳理了企业级 AI 落地的一条核心链路：

数仓 / 数据库 → 搜索与 RAG → Workflow / Agent

并明确了一个前提事实：

模型能否应用，不取决于模型本身，而取决于数据是否真正进入了模型的执行链路。

这篇文章我们继续向前推进，聚焦真实落地场景：

在 AI 加持的新一代数仓体系下，RAG + Workflow / Agent 在真实企业环境中，究竟是如何跑起来的？

下图为完整运行链路：

数据在数仓中完成 AI 化处理后，通过搜索与 RAG 转译为模型可理解的上下文，再由 Workflow 编排为可执行的 Agent 流程，支撑真实业务场景运行。

一、当数据开始直接参与模型使用

当 LLM 成为新的“数据使用者”后，传统以 SQL、报表和指标为中心的数据使用方式，已经无法直接适配模型需求。

这一变化在实际工程实践中已经显现，本篇不再重复展开。

接下来更值得讨论的，是在真实系统中如何一步步把这件事做出来：

如何让数据以模型可用的方式被处理、被检索，并最终参与任务执行？

从这一刻开始，问题已经从“为什么”转向了“怎么做”。

二、AI 加持下的数仓：从分析引擎到 AI 数据底座

在真实企业环境中，RAG 和 Agent 从来不是从零开始构建的，它们往往建立在成熟的数据底座之上。

例如基于MaxCompute 的计算引擎平台，担任着企业数仓 / 数据底座的角色：

汇聚来自业务系统、日志系统、外部数据源的数据
通过 ODS / DWD / DWS 分层，统一口径与版本
在大规模数据集上提供稳定的计算与分析能力

不同的是，在 AI 场景下，数仓不再只是“分析终点”。

通过 MaxCompute AI Function 等能力，AI 开始直接参与数据处理过程：

在 SQL 流程中完成文本理解、分类、标签生成
在数据建模阶段引入语义信息与智能特征
在大规模数据集上进行智能处理，而无需离开熟悉的 SQL 环境

传统数仓的形态已经发生改变：

数仓开始从“分析引擎”演进为“AI 数据底座”，成为 AI 能力的起点，而不是终点。

三、搜索工程前移：为模型构建稳定的“数据入口”

当数仓开始演进为 AI 数据底座后，模型并不能直接使用数仓中的数据。

在真实业务场景中，无论是表结构，还是 SQL 结果集，本质上仍然都是以人理解为导向。

模型真正需要的，是一个可控、可筛选、可追溯的数据入口。

这也是为什么，在企业级 AI 架构中，搜索系统承担着连接数仓与模型的“数据入口层”角色。

在这一层，AI搜索（OpenSearch / Elasticsearch）扮演的是：

数仓数据的可检索化出口
非结构化与半结构化数据的统一入口
模型可控访问数据的第一道关口

与传统“面向用户搜索”不同，这里的搜索设计，目标不再是“搜索体验”，而是：

召回是否稳定
命中是否可解释
结果是否可追溯

也正是在这一阶段，搜索工程开始明显前移，成为 AI 系统中不可或缺的一环。

四、搜索/RAG 落地后的第一个工程瓶颈：上下文开始“失控”

当搜索与 RAG 真正进入生产环境后，很快出现系统不是“答不出来”，而是“越来越不稳定”的问题。

这并不是模型能力问题，而是 RAG 在工程层面开始暴露出新的瓶颈：

同一个问题，不同时间命中不同上下文
上下文内容逐渐变长，token 成本不可控
数据来源混杂，结果难以复核

这意味着，RAG 在生产环境中面对的，已经不再是“能不能检索到数据”，而是：如何长期、稳定、可控地构建模型上下文。

因此，在这一阶段，RAG 的工程重心自然发生转移：

从“拼接检索结果”
转向“上下文生命周期管理”

包括但不限于：

上下文长度控制与裁剪策略
多来源数据的合并与优先级
版本与来源的显式约束
不同业务场景的上下文模板化

这一层的复杂度，已经明显高于单纯的检索工程，也直接决定了系统是否具备长期运行能力。

五、从 RAG 失控到流程化治理：Workflow/ Agent 是如何被“逼”出来的？

当 RAG 在生产环境中开始暴露出上下文不稳定、结果不可复核等问题时，一个现实情况出现：

单次调用层面的优化，已经不足以解决系统级的不稳定。

在初期实践中，尝试通过以下方式解决问题：

调整检索参数（BM25权重等）
优化 prompt
增加过滤条件（位置/行业等过滤项）

但无法从根本上解决多步骤调用之间的上下文失控、不同阶段使用不同数据口径以及中间结果无法被复用或审计等问题。

也正是在这一阶段，Workflow 的价值开始显现。Workflow 并不是为了“多跑几步”，而是为了把原本隐式的模型调用过程，显式拆解为一组可控的执行步骤：

第一步做什么检索
使用哪一类数据
中间结果是否需要固化
是否基于结果决定下一步

在工程实践中，这意味着：

RAG 不再是一次性行为，而是被嵌入到流程节点中
上下文不再自由增长，而是受流程边界约束
模型调用开始具备明确的输入、输出与阶段划分

也正是通过这种方式，Agent 才真正“跑”了起来——不是作为一个“更聪明的模型”，而是作为一个遵循流程约束的执行体。

五、Workflow / Agent 跑起来之后，数据系统被“反向要求”什么？

当 Workflow / Agent 真正开始跑业务任务时，会出现另一个变化：数据系统开始被执行链路反向约束。

在 Agent 场景中，数据不再只是“被查一次”，而是：

在同一任务中被多次调用
作为条件判断的依据
决定任务是否继续或终止

这对数据系统提出了一些过去并不显性的要求：

数据接口是否具备幂等性
同一查询在任务周期内是否结果一致
数据版本是否明确、可冻结
数据调用是否具备权限与范围控制

也正是在这一阶段，Workflow 才真正显现出它的工程价值：它不是让模型“更聪明”，而是让数据调用变得可控。

从业务视角看，Agent 并不是替代原有数据系统，而是将原本“隐式”的数据使用方式，显式地组织为可审计、可复现的执行流程。

这些被 Agent 多次调用、参与决策的数据，是否还适合和分析型数据放在同一套数仓模型中？

当数据开始服务于执行而非仅用于分析，传统数仓的使用方式，以及传统数据开发的工程范式，或许都需要重新审视。

下一篇文章，我会就从这个问题出发，继续展开讨论～

欢迎点赞、关注、转发，大家的支持是我更新的最大动力。

另外感兴趣的小伙伴可关注我的微信公众号：小友数研，将为大家分享更多 Data + AI 的实战。

#AI时代，哪些岗位最容易被淘汰##数仓开发##数据开发工程师##数据处理##数据人的面试交流地#

全部评论

推荐最新楼层

03-25 09:52

广西大学算法工程师

滴滴 AI Agent开发一面

1. 自我介绍2. 项目拷打3. 什么是 AI Agent？AI Agent 是一种以目标驱动的智能系统，不只是根据输入生成文本，而是能够围绕任务目标进行理解、规划、调用工具、获取外部信息、根据反馈调整行为并完成任务。它的核心组成一般包括大模型、记忆、规划、工具系统和执行控制。和普通聊天模型相比，普通模型更偏向一问一答，Agent 更强调任务闭环。比如查询订单、生成报表、分析异常、调用接口、触发流程，这些都更接近 Agent 的典型工作方式。4. Agent 和普通 RAG 的区别是什么？RAG 的核心是检索增强生成，重点解决模型知识不足、知识过时和领域知识缺失的问题。流程一般是先检索，再把检...

AI-Agent面试实战...

点赞评论收藏

03-20 13:35

中国科学技术大学前端开发其它

最爱问是幻觉吧

顺便分享一下当时想转AI全栈被拷打的这几个问题：如果要开发美团智能客服Agent，如何设计多轮对话流程？-你会使用哪些对话状态跟踪方法？-如何处理用户意图模糊的情况？描述一次使用 LLM 开发智能助手的经历，遇到过哪些幻觉问题？解释 AI Agent 的规划能力，如何实现多任务协同（如点餐、支付、售后）？在设计 Agent 的工具调用能力时，你的技术方案是什么？-如何选择合适的工具 API？-会使用哪些函数调用框架？分享一次通过用户反馈优化 Agent 能力的经历，关键改进是什么？

查看9道真题和解析

点赞评论收藏

03-29 00:21

江南大学算法工程师

AI 真能替代人类吗

xdm，我今天突然乐观了。 前两天一哥们私聊我，问要不要加入他的初创团队，做兼职。哥们对自己的项目非常的自信。大意是他做产品，负责调研市场，出方案，我干其中一部分活，做完项目之后挂平台卖，按成交量分成。画了一张非常大的饼：现在有完善的方案，我们只需要每天3-5小时，大概5天就做成一个项目，卖出一单后分成至少1w。 算日薪很高，对不对？ 在我看到他的方案之前一切都正常。方案是邮件发给我的，字数还挺多，分工和步骤都挺明确的——好了，这就是全部的优点了。 他熬夜写出来的这个方案的可行性几乎为0。他想要训练一个模型，但市面上根本没数据，他的星期项目团队也当然是没有实验室来获取数据；他想验证模型鲁棒性，...

AI求职实录

点赞评论收藏

03-21 22:04

中山大学算法工程师

Agent 开发，用哪个框架？

🌟首先提升Agent 质量：1️⃣Prompt Engineering 是被低估的核心技能。 Agent 的 system prompt 和 tool description 的写法直接决定了 LLM 的决策质量。一个精心设计的 tool description，可以让 LLM 在 90% 的情况下正确选择工具；一个随手写的，可能只有 60%。这个差距不是换框架能弥补的。2️⃣Evaluation 是最容易被忽视的环节。 Agent 的行为具有不确定性，同样的输入可能产生不同的执行路径和结果。你需要一套 evaluation 体系来衡量 Agent 在什么条件下表现好、什么条件下会翻车。没有 eval 的 Agent 开发就是在盲人摸象。3️⃣上下文工程（Context Engineering）正在取代 Prompt Engineering 成为新的关键词。 它关注的是一个更大的问题：在 Agent 的每一步决策中，如何精准地组装出最有利于 LLM 做出正确判断的上下文？哪些信息该放进去，哪些该丢掉，以什么格式组织，这些决策比你选哪个框架重要一百倍。4️⃣用户体验设计不可忽略。 Agent 不是对每个任务都能完美完成的。如何让用户理解 Agent 在做什么、如何设置合理的预期、如何在 Agent 失败时优雅地降级——这些产品层面的思考往往比技术实现更难。🌟分阶段的选型策略1️⃣入门期：拿框架快速上手。选最流行的框架，跑通第一个 demo。目标不是做出好产品，而是理解 Agent 的基本工作原理。用框架的好处是屏蔽底层细节，专注于理解&quot;ReAct 循环&quot;这个核心概念。2️⃣进阶期：脱离框架理解本质。自己用纯 API 调用手写一个最小的 Agent。用 openai 或 anthropic 的官方 SDK，50 行代码写一个能调工具的 ReAct 循环。这个练习会让你彻底明白框架帮你做了什么、没做什么。3️⃣生产期：用框架的方式要利于拆除。如果你继续用框架，把它当作一个 LLM 调用的便利层来用，不要在它的 Agent 抽象上构建核心逻辑。如果你选择不用框架，直接用官方 SDK + 自己封装的薄层，也完全可行。代码量不会比用框架多太多，但可控性高出几个量级。⭕最后框架选型是一个&quot;入口问题&quot;——刚入门时你会觉得它很重要，深入之后你会意识到它只是一个起点。Agent 开发的真正挑战在于：理解 LLM 的能力边界，设计合理的任务分解策略，构建鲁棒的执行和容错机制，以及在不确定性中找到产品价值。这些事情，没有任何框架能替你想清楚。Agent 的灵魂不在框架里，在你对问题的理解里。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

点赞评论收藏

03-23 09:03

广西大学算法工程师

携程 AI Agent 开发一面

1、RAG 里的幻觉怎么解决？RAG 幻觉一般来自三种情况：没有召回到正确证据、召回到了但排序不对、证据足够但模型还是自己补。解决也要对应分层。第一层是提高文档质量和召回质量，比如切片更合理、用混合检索、做 query rewrite、加 metadata 过滤。第二层是重排层，用 rerank 模型让最相关证据排前面。第三层是生成层，要让模型严格基于证据回答，证据不足就拒答，不允许自由扩写。如果从更抽象的角度看，幻觉问题本质上是“系统回答倾向强于证据约束”。所以真正要解决的是：让系统在信息不足时学会克制，而不是为了流畅性硬编一个完整答案。2、LoRA 微调原理LoRA 是 Low-Rank ...

AI-Agent面试实战...

点赞评论收藏

招聘动态

OPPO

2027届寻梦实习招聘

蚂蚁集团

2026春季校园招聘

阿里巴巴集团

2027届实习生校园招聘

正浩创新EcoFlow

2026届春季校园招聘

AI网申助手

网申字段一键填写

招商银行数字金融训练营

火热报名中

新华三

2026届春季校园招聘

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

全站热榜

创作者周榜

正在热议

# 给工作过的公司写一条大众点评，你会怎么写？ #