03-23 17:13 门头沟学院大数据开发工程师发布于上海

关注

从做数仓到做 AI 数据底座，数据人到底该补什么能力？

随着AI的发展，数据人的工作边界，正在发生变化。

过去我们更熟悉的是这些词：

ETL、数仓分层、指标体系、实时链路、BI 报表。

这些能力当然依然重要。

而且直到今天，它们还是企业数据建设的基本盘。

但现在，很多企业对数据团队的期待，已经不只是：

把数据算出来。

而是开始进一步要求你去支撑：智能问答/企业搜索/RAG 检索增强/Agent 工具调用

这意味着，数据人做的事情，正在从“建数仓”，慢慢走向“建 AI 数据底座”。

未来已来，该考虑不是数仓还要不要做？

而是从做数仓到做 AI 数据底座，数据人到底该补什么能力？

一、不是数仓没用了，而是只会数仓已经不够了

先说结论：

数仓能力不会过时。

因为 AI 数据底座的很多基础能力，依然建立在传统数据工程之上。

比如：数据接入/数据清洗/分层建模/调度编排/数据质量/权限治理

没有这些基础，很多 AI 项目连稳定的数据输入都没有。

但 AI 场景比传统数仓多了一层要求。

以前我们更关注的是：

数据能不能分析。

现在还要开始关注：

数据能不能被模型持续消费。

这就是变化的本质。

所以不是数仓不重要了。

而是只会做数仓，已经不够支撑下一阶段的需求了。

二、过去交付的是“结果”，未来交付的是“能力”

过去数据团队最典型的交付物是什么？

是一张明细表。

是一张宽表。

是一套指标。

是一个看板。

是一条离线或实时任务。

这些东西，本质上都在服务“人”。

也就是说，我们过去做的大多数事情，最终都是为了让业务、运营、分析师、管理层更方便地看数、用数、分析数。

但 AI 时代不一样了。

数据不只是给人看，

还要给模型用。

所以未来更重要的交付，不只是“表”和“指标”，而是这些能力：

1. 知识组织能力

2. 检索能力

3. 更新能力

4. 服务化能力

5. 模型可消费的数据能力

这其实是一个很大的变化。

以前你交付的是一个结果。

现在你交付的是一套能力。

以前更像是在做任务开发。

现在更像是在做底座建设。

三、数据人最该补的，不是几个 AI 热词，而是这 5 项能力

很多人一聊 AI 转型，第一反应就是：

要不要去学 Prompt？

要不要赶紧补 Agent？

要不要先研究模型参数？

这些当然可以学。

但如果你本身是做数仓、做数据开发、做数据工程出身，我反而觉得，最值得补的不是这些最表层的东西，而是下面这 5 项能力。

1）多源数据组织能力

过去我们主要处理的是结构化数据。

比如业务库、日志、埋点、指标表。

但 AI 数据底座面对的数据会复杂得多，它不只有表，还会有：PDF/Word/Markdown/Wiki/FAQ/邮件/API 文档等等。

所以你要开始思考的，不再只是：

表和表怎么 join。

而是：

结构化和非结构化数据，怎么进入同一套知识体系。

这一步，很多传统数据人其实还没真正开始补。

2）统一语义建模能力

传统数仓很强调分层，这没有问题。

但做 AI 数据底座时，光有分层还不够，还要补一层很关键的能力：

统一语义建模。

因为模型不像人。

它不会自动理解：

“客户”和“用户”是不是一个对象，

“商品名”和“产品名”是不是一个概念，

“文档里的定义”和“表里的字段”是不是同一套口径。

如果这些东西没有统一起来，后面的检索、问答、推理，都会很不稳定。

所以数据人接下来要补的，不只是建表能力，而是：

围绕客户、商品、流程、规则、指标、知识文档这些核心对象，建立统一语义锚点的能力。

3）知识加工能力

过去我们擅长的是加工明细表、宽表、汇总表。

但 AI 系统真正需要消费的，很多时候不是这些表本身，而是：

可检索、可引用、可更新的知识单元。

这意味着你要开始具备另一种加工能力，比如：文档清洗/结构解析/分段切块/标签补充/元信息增强/向量化

本质上，就是从“数据加工”走向“知识加工”。

以前你加工的是结果数据。

现在你加工的是模型要消费的知识对象。

这两者的思维方式，其实差别很大。

4）检索与服务化能力

过去很多时候，表建好，任务跑通，工作基本就结束了。

但 AI 时代，下游要的往往不是一张表，而是：

1. 搜索接口

2. 知识检索接口

3. 问答服务

4. 数据查询服务

5. Agent Tool

这时候，数据人就不能只停留在“表建好了，下游自己查”。

而是要开始考虑：

怎么把底层数据能力服务化。

你要开始理解的，也不只是 SQL 了，还包括：

1. 关键词检索

2. 向量检索

3. 混合召回

4. 排序过滤

5. API 化输出

也就是说，你面对的对象，开始从“人查表”变成“系统调能力”。

5）持续更新与治理能力

这是我觉得最容易被低估、但最决定上限的一项能力。

很多 AI 项目第一版其实都不难。

真正难的是：

数据持续变化后，系统还能不能长期可用。

因为企业知识一直都在变：新文档不断进入/老文档持续修改/指标口径不断调整/规则版本不断切换等等

如果还停留在“一次性交付”的思维里，系统很快就会变旧、变乱、变得不可维护。

所以数据人必须补上的一项关键能力就是：

更新与治理能力。

包括：增量更新/版本管理/生命周期管理/质量监控/权限控制/结果追溯

这一块，往往才是真正拉开项目差距的地方。

四、对数据人来说，这其实是一条很自然的升级路径

我一直觉得，数据人转向 AI，并不一定非要把自己变成算法工程师。

因为数据人天然就有很多非常稀缺的优势：懂数据来源/懂业务口径/懂建模/懂治理/懂工程落地/懂稳定性和可维护性

这些能力，在“做 Demo”的阶段看起来没那么显眼。

但只要进入企业级落地阶段，你就会发现：

真正难的不是把模型接上，而是把底层数据组织好。

而这，恰恰就是数据人的主场。

所以对数据人来说，最自然、也最有竞争力的一条升级路径，不是完全抛开原来的能力体系重来一遍，而是：

把原本的数仓能力，升级成建设 AI 数据底座的能力。

五、总结

从做数仓到做 AI 数据底座，数据人到底该补什么能力？

我的理解是，至少要补这 5 项：

1. 多源数据组织能力

2. 统一语义建模能力

3. 知识加工能力

4. 检索与服务化能力

5. 持续更新与治理能力

说到底，AI 时代并不是不要数仓了。

而是数仓能力，需要继续往前延伸。

以前数据人更多是在交付：

数据结果。

而未来更重要的是交付：

智能应用可持续消费的数据能力。

所以未来真正拉开差距的，不只是 ETL 能力，也不是会不会几个 AI 热门名词。

而是：

能不能把传统数仓能力，升级成建设 AI 数据底座的能力。

另外，如果感兴趣的话，欢迎关注微信公众号：小友数研，会持续分享 Data + AI 相关内容～

#大数据##AI了，我在打一种很新的工##聊聊我眼中的AI##数据人的面试交流地#

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

应该开始玩湖仓呢

点赞回复分享

发布于昨天 23:15 北京

昨天 16:28

已编辑

湖南工商大学 Java

实习第二周被抓了

辅导员突然一个个来查，没招了。

为了实习付出一切：那你就和她说明天你也要面试，没空

点赞评论收藏

分享

03-23 07:58

中国科学技术大学 C++

【笔试刷题】滴滴-2026.03.22-改编真题

✅ 春招备战指南 ✅ 💡 学习建议：  先尝试独立解题 对照解析查漏补缺   🧸 题面描述背景等均已深度改编，做法和题目本质基本保持一致。 🍹 感谢各位朋友们的订阅，你们的支持是我们创作的最大动力 🌸 目前本专栏已经上线200+套真题改编解析，后续会持续更新的  春秋招笔试机考招合集 -> 互联网必备刷题宝典🔗 滴滴-2026.03.22 题目一：小基 的中转出行计划 这题核心是把“取消哪些班次”压缩成前缀删除。第一段删掉前  班后，小基 的出发时刻就被唯一确定；第二段再用二分找到最早赶得上的班次，继续跳过剩余被取消的车即可。最容易漏掉的是：只要存在一种分配方式能让整段中转断掉...

互联网刷题笔试宝典

点赞评论收藏

分享

03-22 23:35

铜陵学院数据分析师

双非二本大数据专业可以走哪个方向

投票

很迷茫  不知道自己可以做什么自学了很多 大模型 数据开发 数据分析不知道怎么办了

双非本科求职如何逆袭

点赞评论收藏

分享

03-02 16:12

已编辑

曲阜师范大学产品经理

实习landing，看这一篇就够了

前司各种体系非常完备，而现在的公司无周报周会，无文档管理系统，实习生无文档数据权限。巨大的反差让我备受煎熬，但一个月后我在这家三无的公司成功landing，并且愈发地喜欢这家二次元浓度极高的公司。为了较为客观地梳理内容，我把内容拆分为以下两部分:1..实习生如何快速landing（业务）2.实习生如何快速landing（人际）前2章以互联网产品实习举例，介绍实习生如何快速上手新业务；后2章介绍实习生如何快速搞定人际关系，超级适合i人实践。本文3.9k字，阅读需要约10min。1.带着问题去实习通过面试前的准备、面试过程中的沟通，实习前你会有对这个公司、业务、岗位有基本的了解。你可能会有好奇的事...

实习生的生存小技巧

点赞评论收藏

分享

03-09 21:00

门头沟学院大数据开发工程师

有没有数据开发的日常实习内推

沉淀了一个多月感觉良好，今天刚复投但是只有数分的岗位还有一个西宁的数开，有没有杭州上海的数开内推或者继任的，感谢！

点赞评论收藏

分享

评论

2

收藏

招聘动态

鹏芯微

2026届校园招聘

米哈游2026校园招聘

应届生春招&全年实习生专项

莉莉丝

2026春季校园招聘

招商银行·招银网络科技

2026届校园招聘

小米集团

2026届春季校园招聘

厦门银行

2026届春季校园招聘

联想

26届补录&27届暑期实习

携程集团

2026年春季校园招聘

AI网申助手

网申字段一键填写

恒生电子

2026届春季校园招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 长得好看会提高面试通过率吗？ #

8475次浏览 85人参与

# 面试被问第一学历差时该怎么回答 #

273946次浏览 2223人参与

# 巨人网络春招 #

11784次浏览 235人参与

# 沪漂/北漂你觉得哪个更苦？ #

3134次浏览 65人参与

# 百度工作体验 #

316674次浏览 2233人参与

# 你的实习产出是真实的还是包装的？ #

5428次浏览 94人参与

# MiniMax求职进展汇总 #

26656次浏览 327人参与

# 离家近房租贵VS离家远但房租低，怎么选 #

17115次浏览 138人参与

# 学历or实习经历，哪个更重要 #

242873次浏览 1259人参与

# AI面会问哪些问题？ #

1915次浏览 55人参与

# 从事AI岗需要掌握哪些技术栈？ #

1170次浏览 39人参与

# 你做过最难的笔试是哪家公司 #

2540次浏览 33人参与

# HR最不可信的一句话是__ #

1569次浏览 42人参与

# 春招至今，你的战绩如何？ #

20652次浏览 198人参与

# 找AI工作可以去哪些公司？ #

1179次浏览 21人参与

# 校招生月薪1W算什么水平 #

134643次浏览 456人参与

# AI时代，哪个岗位还有“活路” #

4094次浏览 95人参与

# XX请雇我工作 #

51224次浏览 172人参与

# 简历第一个项目做什么 #

33007次浏览 425人参与

# 你最满意的offer薪资是哪家公司？ #

77214次浏览 377人参与

# 不考虑薪资和职业，你最想做什么工作呢？ #

153260次浏览 893人参与

# 秋招白月光 #

734254次浏览 5454人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务