大模型与数据开发如何结合

1. 前言

大多数公司都在做大模型应用+大模型工具去提升自己业务效率(可能也是因为大老板想做出一些价值,因此在各业务投入agent去使用),我们这期讲一下大模型与数据开发如何去结合去落地,大模型和数据开发是如何相辅相成,以及解释为什么到今天语兴也觉得数据最为重要的原因,感兴趣同学想了解更多细节可以加下星球,星球有5套不同业务的大模型项目,并提供完整代码、业务逻辑、产品方案、简历模板,皆可用于面试。

2. 工作流

agent解释:ai agent也叫人工智能代理,是一种能够感知环境、进行决策和执行动作的智能实体。智能体像人一样,它有记忆、有逻辑分析能力、有任务拆解能力、问题的拆解能力和最后综合回来统一解决问题的能力,例如自动回复邮件的程序,自动驾驶都叫agent。

dify:是一个集成开发环境,提供低代码工具帮助开发者构建、部署和管理AI应用,如聊天机器人、智能助手等。

2.1 dify平台功能

探索

工作室

知识库

工具

可查看和使用定义好的Chat bot、chatflow、workflow、agent

可查看、编辑和创建Chatbot、chatflow、workflow、agent

可查看、维护知识库(知识库可作为上下文被其他智能体中的大模型引用),目前仅自己创建可用

全部

ai

2.2 workflow工作流

基于workflow工作流可以获取大模型执行的信息,同时还会根据每个节点执行情况,节点包括(input输入数据,output输出数据,预处理(python对数据二次加工),调用大模型,条件分支等),可以将节点看作离线任务链路中加工的节点,最后根据大模型对数据识别后将识别的数据output输出到大模型工作流表中。

3. 数据与大模型配合类型

谈到大模型+数仓组合,通常大家都会想到通过开发底层数据完成大模型训练,从而提供数据支撑,这个观点是对的,通常大模型+数仓组合一般呈现为2种,即(1)清洗数据保障数据质量后将明细投放到大模型中,(2)通过大模型的工作流执行及识别精准程度进行数据分析。

3.1数据前置生成投入大模型进行打标

数据前置生成投入即清洗好原始宽表数据信息,选择更贴合场景的内容数据,例如今天我们要做模拟抖音进行内容生成,那需要提前爬取抖音优质/劣质内容(具体看你用在什么场景,风控就用擦边/涉政类,优质就爬优质的),接入数仓ODS->DWD->ADS(ODS接入原始逆向也叫爬虫的数据,DWD进行json解析即数据清洗维度下沉,ADS进行内容打标,标记内容优质情况,当然打标可以走算法模型,最终封装json推送大模型平台)

因此数开在前置通常是接入研发/逆向研发数据从而给大模型推送

暂时无法在飞书文档外展示此内容

3.2大模型后置产出数据进行测算评估

当经过workflow工作流识别、产出后的数据可以用于评估业务召唤/准确率,结合各种维度属性进行大模型生成内容调整,从而调整工作流,因此数据开发在大模型后置则是基于workflow返回数据及业务数据构建ods到ads链路,建设指标搭建报表。

暂时无法在飞书文档外展示此内容

完整链路图

暂时无法在飞书文档外展示此内容

3.3大模型在数仓中使用

大模型在数仓中投入可分为几个方向,这里别说什么网易chat bi、SQL copilot这种,已经不是数仓方向能干出来的,我们就以chat bi为例,

(1)企业内部chatbi难落地:依赖数据开发、数据产品、数据平台等各方配合,开发周期长,人力投入,还需要长期调整精度,roi较低(正儿八经使用的人甚至不如取数据平台),平台价值远不如做业务价值,同时也很考验数据开发的资产完善情况,当前大部分数仓表较为分散,资产烟囱式建设太多。

(2)购买三方平台:购买3方(quick bi,网易有数较为成熟),价格太贵,带来的收益也低,即使有用户在用也很难用明白(最后变成数据表查询智能问答工具,还不如做个agent),如果只是为了套壳满足一些混子高层汇报吹牛逼那还是够的。

因此,我们只说数仓一个组能做的事

(1)根据数据表元数据,数据资产自动化评估有效资产、核心资产、是否可下线及优化等,并可以做一个简单问答助手

(2)根据任务执行元数据(消耗cpu、内存、近15日执行时间、执行sql语句等)识别不良任务进行自动化推送诊断,结合血缘对于无效任务进行推荐冻结/下线

#数据开发工程师##数据人offer决赛圈怎么选##数据分析##聊聊我眼中的AI##大模型#
全部评论

相关推荐

头像
10-23 14:59
已编辑
湖南大学 安卓
那是我成年之后最黑暗的一段时间,无人问津,无处宣泄,一个人在外地租房,租了一个自习室,一边考研,一边找工作,一边看各大招聘平台,每找到一家就面试一家,需要去其他城市面试就跑去面试。独来独往,冷暖自知,没有一个认识的人,无聊的时候不知道想做什么也不知道能做什么,做什么都是一个人,一个人散步,一个人打球,一个人走夜路回租房……经常一天下来一句话都没说,渐渐地我都沉默了,只是觉得窗外的树绿了又黄了又掉了,然后一年就过去了,这一年没有认识新朋友,基本上没有和人来往,和家里都是每个月联系一次,家里不支持我考研,一定是要我去考公,我说,我想试一下,求得了一个机会。我从7月份开始跑步一直跑到10月份,每天晚上都大汗淋漓,那段时间失眠很严重,每天晚上躺下都很精神,早上又起不来,反反复复,恶性循环,再加上连个说话的人都没有,也不知道自己究竟是怎么了,人有的时候身在局中看不到自己的状况。以前我是一个特别宅又内向的人,基本上朋友不叫,我就不出门,而且我喜欢待在家里,喜欢一个人,非常享受独处的时光,打打游戏,看看动漫,真的很爽,但是经历那一年无人问津之后,感觉所有的东西都变了,变的更加的麻木了,更加的讨厌一个人待着,讨厌孤独,爱好消失了,生活的动力越来越少,有时候漫无目的的走着,没有方向,没有人陪同,不知道要走多远,不知道何时回家,自言自语,但无人理会……我好像疯了一样,无限接近抑郁症?慢慢的我开始从i人变成e人,路上逮到一个人就说几句话,尤其是小孩子,和他们说话毫无压力,如果面对一个成年人真的怕对方以为我是一个傻子。经常去一家小饭店吃饭,渐渐地和老板熟悉了,老板成为了我那段时间唯一的“朋友”,有时候老板不忙的时候坐在外面,我就和他拉起家常,我什么都问,什么都说,因为我太孤独了,迫切的想要有人说说话,我显的很亢奋,好像迫切的要抓住什么一样……所以现在的我更加大胆,会大胆的社交,大胆的做一些以前没做过的事情,塞翁失马,焉知非福?有一次吃饭走在路上,看到一张路边的椅子就躺下去,睡不着,就这样闭着眼睛,听着来往车辆的嘈杂声,突然感觉到有人在我旁边说话,我猛的做起来,原来是一对小情侣路过,这一下把他们吓着了,他们先是一惊,后面加快脚步笑着跑走了,大概率是在笑我像个疯子,像个精神病吧。后续的日子,我搬了三次家,每一次从一个地方搬到另一个地方都会有点伤感,最后一次搬家的时候,下雨了,滴滴师傅觉得我行李太多,事先没有说明,但我舍不得加钱,他就不送我进小区,但我住的地方在小区身处,所以,深夜,大雨,一人,一大包行李,像个蚂蚁一样,一件一件的搬运,每一次都搬到视野范围内,生怕东西被偷……就这样淋着雨,扛着物品来返的搬运,没搬几次,已经感觉到汗水和雨水交织,身上衣服鞋子都湿透了,就是那一晚,我奔溃了,破防了……一年多,从无人问津到无人问津,感觉生活一直停留在原地,我很早就关掉了朋友圈,看不了那些光鲜亮丽的生活。然后擦干眼泪继续搬运……当晚,我还要连夜前往火车站,去杭州参加一场重要的考试,来不及洗澡,换了身干净的衣服就动身了。最后的结果就是考研失败,找工作失败……所以我来到了这里。那些都是我来时的路。冷暖自知谁都可以说,但等你明白的那一天就真正成长了在那段东奔西走的日子里,谈了四年的感情也画上了句号……那一段时间应该是我成长最快的日子,此刻正在码字的我饱含着泪水,以往的艰辛不易只有我自己知道。
求职低谷期你是怎么度过的
点赞 评论 收藏
分享
评论
3
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务