因为牛客上我还有一毛钱的激励计划奖金所以我决定继续更新。

ok,那么正式开坑吧,个人而言因为Java实在竞争太激烈,(在月薪3k的小厂,有十几个人去面试竞争,甚至有个天津大学的985硕士和我抢饭碗,我决定直接跳车,不卷了)所以投入大模型的学习之中。那么目标自然是做agent开发或者大模型开发了,

这里很多人会问,现在去找大模型好找吗?我明确的说,我不知道,但我要all in,因为大模型工资实习工资比java开发更高,而且它更新,这是为什么我要学它。

然后很多人就是说这个东西是不是现在没有什么成体系的学习资料,我明确的说,是的,以我自身就是纯按照兴趣+boss招聘信息去学,因为很多公司自己也没整明白,有非常多小公司初创公司招这个,竞争激烈程度大概是56个人抢一个岗位,要比java动不动几十份简历好的太多,同时公司自己也不太会,因为没有体系化的八股文而且能够实现自身想法。这是非常大的优势。

那么问题来了,你想问大模型怎么学,然后大模型有哪些方向。

这里首先大模型应该是分成prompt工程师,agent开发,算法底层开发,pytorch/transflow框架开发这几种,

基本上很多公司自己没搞明白,可能你进去就是天天接入接口,然后无脑问ai,也可能上来直接干论文实现,或者使用cursor/trae这种接入ai问答模型的工具开始愉快的一行代码不写debug一天,也可能直接加入项目去参加meatgpt/hugging face等开源项目。

但是无一例外,实习工作是没有传统开发那样枯燥的,不管你是用什么语言,基本上都逃不过crud,重复造轮子,而大模型不会,

每一天都有所收获,每一天都能够实现新东西。

这里基本上分为几种agent开发,一部分是使用dify/coze上面的这种预训练模型(这两个本质上类似于开发者仓库,你可以把实现的东西放上去但是收费,并且能够在上面用拖拉拽实现小型agent),另一种则是调用pytorch这种框架或者下载几十G的知识库自己手搓出全新的agent,

这里不得不提到RAG的概念,现在大部分使用的对话大模型类似于deepseek/qwen基本上都是接入到10月份的知识库,由于法律明确的干涉所以暂停ai接入实事,也能够减少ai造假的情况,那么我们想要实现接入最新知识或者发表的论文怎么办,这里就要用到检索增强模型(RAG),它本质上是一个向量模型数据库,说白了,就是个高阶数据库,大体工作流程为拆包,(切小块的数据),加载数据,录入数据,调用数据,最新的数据会作为知识库的一部分。

写了不少东西了,看看有没有人看吧,大伙感兴趣我就更新下一期,打一把dota先。

#牛客解忧铺##牛友故事会##牛客激励计划##牛客创作赏金赛#
全部评论
看到有人在聊创作者激励,啪的一下,我就点进来了,很快啊!年轻人好好更新,奖励大大的有
2 回复 分享
发布于 04-28 16:46 北京
期待后续更新!想进入大模型方向,但是目前头绪有些乱
1 回复 分享
发布于 04-29 11:53 广东
校友期待更新,以allin 咱学校学学pt,stf可以嘛 目前只找到应用
点赞 回复 分享
发布于 05-18 18:09 北京
但是我看这个ai应用开发港,只有字节这种大公司可能多一些
1 回复 分享
发布于 04-28 16:43 河南
来吧
点赞 回复 分享
发布于 04-30 17:20 广东
那真的还是太有生活了
点赞 回复 分享
发布于 04-28 16:46 北京
回来java吧,5月行情将大好
点赞 回复 分享
发布于 04-28 16:43 广东
哇,看起来你对大模型领域充满了热情和决心呢!真的非常棒!那么,小可乐有个小问题,你是怎么开始接触大模型,又是怎么找到学习资源的呢?😊 顺便说一句,如果你对求职或者学习上有什么疑问,或者想要和小可乐一起探讨更多关于大模型的话题,记得点击我的头像给我发私信哦~这样我们可以更深入地聊聊! 至于你提到的那些方向,听起来都好酷!小可乐我也超级想了解的~如果你继续更新,我一定会准时来看的!现在,去打一把Dota放松一下吧,祝你玩得开心!😄"大模型的世界等你来征服呢!"(点击我的头像,我们一起私信聊聊吧~)
点赞 回复 分享
发布于 04-28 16:34 AI生成

相关推荐

在AI Agent的设计中,意图识别是自然语言理解(NLU)的核心环节,直接影响用户体验和业务目标达成。作为AI产品经理,需从业务场景、技术实现和用户体验三个维度系统设计意图识别方案1. 明确业务需求与意图分类体系- 场景拆解:根据Agent的应用场景(如客服、智能家居、电商导购)梳理高频用户诉求。例如:- 客服场景:咨询、投诉、退款、查询进度等- 智能音箱:播放音乐、设置闹钟、控制设备- 意图分层设计:采用树状结构(主意图→子意图→槽位),避免分类粒度混乱。例如:主意图:订机票├─子意图:查询航班(槽位:出发地、目的地、日期)└─子意图:改签机票(槽位:订单号、新日期)- 兜底策略:设计"未知意图"分类,结合澄清话术(如“您是想查询订单还是联系客服?”)或转人工流程。2. 数据驱动的模型构建- 数据采集与标注:- 通过用户历史对话、搜索日志等获取真实语料。- 标注时需注意同义表达覆盖(如“帮我订票”和“买张去北京的机票”)。- 技术选型方案:- 规则引擎(正则表达式、关键词):冷启动阶段/高确定性场景(如命令词)- 深度学习(BERT、TextCNN):复杂语义场景- 大模型微调(Few-shot Learning):长尾意图识别- 多模型融合:规则兜底+模型预测,例如先用规则处理高频意图,剩余流量走模型。3. 用户体验闭环设计- 容错机制:- 置信度阈值设置(如低于0.7时触发澄清)- 上下文继承(用户说“换一个时间”时继承前文航班查询意图)- 效果评估指标:- 技术指标:准确率、召回率、F1值- 业务指标:任务完成率、转人工率、单次对话解决率(FCR)- 用户感知:用户主动纠正次数、满意度调研- 持续迭代闭环:- 建立bad case分析流程,将误识别样本反馈至标注池- 监控意图分布变化(如新增促销活动可能引发未覆盖的咨询意图)的         
点赞 评论 收藏
分享
评论
8
7
分享

创作者周榜

更多
牛客网
牛客企业服务