我是软件开发,想搞大模型

先抛个问题,像恒生、金蝶这类细分领域内的软件厂商龙头或者中小型的软件&互联网公司,他们想使用大模型时,要怎么办?
其实如果往深处挖一挖,这个问题就把大模型产业链中的各种角色都炸了出来,这篇文章整理梳理一遍,并聊一下软件技术人员在里面的就业机会。
整个大模型产业链中的参与者可以被分为4种角色,分别是:应用开发商、大模型厂商、云计算厂商、GPU厂商。
这4种角色呈现倒金字塔结构,即,从应用开发商到GPU厂商,离具体的应用场景和终端客户越来越远,越来越远离业务更像纯技术人员,入门的壁垒越来越高,就业岗位越来越少。


举个例子,恒生电子这种软件企业,如果想在他的产品中增加一个投资理财智能对话机器人,只需要向大模型厂商买一个私有化的产品解决方案,再把自己积累的投资理财领域数据导进去做微调,最后包装成一个微服务供对话机器人的开发工程师调用就可以了。
同样的例子还有很多,市场上绝大多数企业都是这个玩法,区别就在于某些特殊行业,金融、政府、能源、运营商等因为监管、数据安全的考虑,有自己的私有云,需要私有化部署,而大量中小企业使用公有云服务。
假如哪天我去创业,你们可能就会看到一个以我自己这个IP"屋顶的闪闪星光"命名的聊天机器人,向大家提供软件技术领域的职业发展和就业选择的服务,到时大家把自己的offer和个人情况发给它,它就会告诉大家它的建议和背后的逻辑。
上面这些都算是大模型的应用开发商。

当然了,大模型的微调是个很重的活,不是技术壁垒高,而是要做的事情很多很琐碎并且影响到最终的产品能力。
比如,首先要选择合适的数据,数据的采集、清洗、选择都需要做大量的工作,其次微调也需要成本虽然不大,再次模型需要不断迭代,因为有新的数据在不断产生。
随着大模型的应用越来越多,promotion工程师应该会成为企业的智能服务产品的标配,毕竟,想依靠用户端输入靠谱的promotion有点难。
想一想你是医生,给一个病人在看病时其实只有短短1、2分钟的时间在做决策,大部分时间其实是在跟病人交流"套话",而碰上一个逻辑清晰、沟通顺畅的病人,对医生来说就是最大的幸运了,绝对不是常态。

站在软件技术人员就业角度来看,在这类企业里面的人就是以应用为主,研究好在自己的业务场景下,用自己所在业务线的数据如何使用好大模型是最关键的,只要找好切入点,搞出来标杆应用场景,就能刷绩效、晋升了。
如果考虑到给自己简历增加些亮点方便跳槽、涨工资的话,网上找些入门级的教程来看,基本了解大模型是怎么运作,各个环节的工具如何使用,如何调用大模型服务就好了,去知名的大模型厂商那里开个账号充点钱,用它做几次微调就会有比较深刻的体会,找到一些感觉了,整体比较简单。
上半年面试时碰到一个互联网中厂的软件开发,他们团队投了一个实习生进去搞了2个月就在一个创新的业务场景下把基于微软大模型的对话给跑通了,整体的门槛也不高。
上周跟一个大厂的朋友聊,前段时间他在做晋升评委时就碰到一个毕业一年多的工程师,大厂内部发布大模型内测之后,这个人就借助大模型把自己的一部分工作改造了下,效果未知,但过程很顺利,成本不高。
说到底,毕竟这都是应用大模型。
学习方面,国外看Hugging Face,国内可以看下阿里云推出的魔搭社区,是"中国版的Hugging Face"。

跟应用开发商相比,大模型厂商才是重活,技术门槛、资金门槛都很高。
中国市场上的大模型厂商主要分成几类:
草根创业,清华系的智谱、MiniMax等
名星创业,王小川的百川智能、李开复的零一万物、王慧文的光年之外等
知名企业,昆仑万维、科大讯飞、VIVO等
科研机构,复旦大学的MOSS、清华大学的GLM等。
大厂自建,阿里云的千问、百度的文心一言、腾讯的混元、华为的盘古、字节的云雀等。

这里的玩家看起来挺多,其实相比其它风口上的创业都来说,真的极少了,派系也不算特别复杂,原因就是开发、训练大模型的成本太高了。
要么是王小川、李开复、王慧文这种大佬起步就自己先带着几亿入场,要么就是大厂自己重金投入的战略方向,要么就是复旦、清华这种有科研平台支持的。
而那些背后没有资本大佬支持的创业企业,都是ChatGPT这波爆发之前就在做的,像智谱AI这种真正的草根创业早在2020年就借助清华的技术成果搞大模型探索,而MiniMax的创始人作为商汤的技术副总,也是在21年预判到技术发展之后才进场。
因为如果是22年底ChatGPU爆发之后才进场的话,跟那些自带着光环入场的玩家相比,草根创业者绝对融不到钱、挖不到人、买不起GPU。

这类企业核心就做几件事:搞数据、挖市场上分布在各个领域的成熟算法人才、搞GPU、搞公有云或私有云的商业化。
从软件技术人员就业角度来说,如果你是做模型的,工程、算法,都可以无脑入,是个很好的积累,不管这个企业几年之后是不是GG,只要干过这条链路,以后就会是市场上抢手的人才。
因为从整个形势上判断,23年在卷模型,24年之后大概率就会进入应用爆发期了,企业只要有自己的数据,再买一些相对成熟的大模型服务,或者直接把开源的优秀模型部署起来,就能发布一个不错的产品。而不管是哪一种,对有大模型经验的人都是极度渴望的。
从软件技术人员就业角度来看,我最喜欢百花齐放、百家争鸣了,资金火热、大大小小公司扩张,你的履历只要跟大模型沾点边,薪资就能翻着跟头往上涨。

不过这里要小心一些套壳的公司,比如做微调、做工具的,他们不会自己做大模型,而是服务一些开发能力弱或者自己开发性价比低的应用开发商,市场上来说有存在价值,但这类企业都是以中小企业为主,属于典型的蹭风口创业公司。
企业本身没有好坏,只要市场有需求,就会有人做,从软件技术人员就业角度来说,选择适合自己的就OK了。
像这种套壳公司,如果大家是有几年工作经验的,可以根据自己实际情况判断一下,如果是应届生千万不要去。
有任何问题,欢迎私信我,互相交流。

不管是数据处理、模型训练,大模型开发商都需要大量的机器资源,这种事他们自己是干不了的,必须找云计算厂商。
前段时间阿里云的董事长蔡崇信说,全国80%的科技企业,以及超过50%的AI大模型是跑在阿里云上的,阿里云更是搞出了魔搭社区来配合。百度自己也说,千帆大模型平台有万家企业客户了。
大模型厂商与云计算厂商的关系是怎样的?
简单来说,云计算厂商提供算力(说人话就是把GPU、CPU虚化成可灵活调配的云计算资源服务)、生态能力(说人话就是做各种工具降低云计算资源服务的使用成本),而大模型厂商就是云计算资源服务的使用方。
当然了,因为国内几个真正有核心技术的云计算厂商自身都是搞软件产品服务成功之后,再把积累的技术开放出来成为云厂商的,所以不管是为了自己的业务服务,还是为了把大模型集成到自己的云计算平台上成为云服务对外售卖,他们都搞了大模型。
所以像阿里云、百度智能云、腾讯云、华为云这些玩家,既是大模型厂商又是云厂商。

当然了,云厂商这个生态本身比较复杂,除了上面这几个有核心技术的大厂之外,还有移动、联通、电信这几个电信运营商这种做市场、项目资源导入的玩家。
电信运营商虽然不像云厂商这种靠核心的产品、技术、服务起家慢慢打市场,但是央企的地位在那里摆着,叠加上在全国各省、市、区县庞大的销售网络和客户网络,趁着国家搞数字化这盘大棋,从政府、国企、事业单位手里接下了无数的数字化项目,营收涨个不停。
虽然这几个玩家搞不起大模型这种核心技术,但从项目入手,只要业务跑起来,核心技术也是可以慢慢构建的。话说回来,现在市场上哪家大厂不都是先有了业务的增长,带动了技术的投入,最后才变成真正有技术的大厂。

从软件技术人员就业来说,如果想去搞大模型这条产业链路上的技术,最好就去几家既有大模型核心技术又对外提供云服务的云厂商,可以看到真正产业链的全貌,其它云厂商也就做做配套。
当然了,大模型厂商和大模型应用开发商谁也不会绑死在一家云计算厂商,商业玩得就是一个脚踩多只船、互相博弈,不可能出现"兄弟我把后背交给你"的事,就像微软,除了支持OpenAI之外,也有自己的大模型。
所以没有大模型的云厂商给别人做做备胎、提供计算资源也是有很多机会的。

大模型越多,上层应用越多,云计算厂商的生意越好做,毕竟云计算的玩家就这么几个。
云计算厂商看起来是靠核心技术,其实商业角度上拼得是规模效应,所以争夺客户是个很重要的事,不但是营收问题,还是长期竞争力的问题。

我之前讲过一个逻辑,同样一个百人的研发团队,每年把容器调度效率提升1%,这个事情有没有价值?
如果放在阿里云、华为云这样的公司就有价值,因为他们的容器是百万级,后面是千万级,可如果放在青云、优刻得这样的中小云计算厂商呢?就会把他们公司给拖垮,因为盘子太小,没有规模效应,养不起这么贵的团队。
以上逻辑只适用于大型云计算厂商,可以撑住价格战PK,中小云计算厂商就比较危险了,比如,青云、优刻得等,持续亏损、市值几年间缩水了7、8成。
所以,从软件技术人员就业角度来说,一定要避坑,如果没有职位上的溢价,给再多待遇都不要去中小型的云厂商,

除了规模效应之外,那这些头部的云计算厂商之间还会PK什么呢?论数据,大家都是顶级业务,都不缺数据,论算法,理论是公开的、砸工程师就好了,除了技术积累、研发速度、组织能力这些我们外人看不清细节的变量之外,还有一个最大的变量是GPU。
当下,云计算厂商的算力依赖的GPU绝大多数都是美国的英伟达。
虽然中国很早就有厂商干GPU,从中美贸易战开始这个过程也加速了,但不管是设计、生产、客户、软件生态,都不是短短几年可以追平的。
对国内GPU厂商来说,不管是壁仞科技、摩尔线程、沐曦、寒武纪这些近几年看到AI和算力市场机会而成立的创业企业,还是实力派的景嘉微、华为昇腾、海光等,都需要长期抗战。
但从另外一个角度来看,这也是一个很大的机会,中美关系硬生生给中国开出一个"国产替代"的大市场。
放眼望去,车规芯片领域的地平线、黑芝麻,在一点点残食高通、Intel这类外企的市场,百度在前段时间买了一批华为的GPU,金融等敏感领域更是提出明确的国产CPU替换节奏。
从软件技术人员就业角度来讲,芯片公司除了设计芯片之外,更需要建生态,像英伟达的CUDA,就是核心竞争力,去芯片公司做工具链也是做BSP、嵌入式的一条路。
#我的求职思考##牛客在线求职答疑中心##牛客解忧铺##互联网没坑了,还能去哪里?##如果可以选,你最想从事什么工作#
全部评论
动态里全是大哥您自己写的吗?真全栈
10 回复 分享
发布于 2023-12-13 23:46 北京
把上下游、国内外市场、职场发展逻辑和短期预测都掰扯明明白白 ,光叔这篇简直了
7 回复 分享
发布于 2023-12-14 11:17 陕西
很全面啊哥
1 回复 分享
发布于 2025-05-29 17:45 河北
衔远科技属于哪一种
1 回复 分享
发布于 2024-02-11 18:31 河南
说的很好
1 回复 分享
发布于 2023-12-26 00:22 天津
太干了
1 回复 分享
发布于 2023-12-15 19:45 安徽
屋顶的闪闪星光
1 回复 分享
发布于 2023-12-14 11:28 浙江
佬,秋招拿了百度智能云基础公有云部的研发offer,推荐去吗?
点赞 回复 分享
发布于 2025-01-08 11:59 湖北
您好,请问硕士生(算法)暑期实习去月之暗面、智谱、零一万物这种大模型公司,对将来秋招从事下游大模型工作有帮助嘛
点赞 回复 分享
发布于 2024-06-18 20:45 北京
受益匪浅
点赞 回复 分享
发布于 2024-04-16 20:00 广东
去华为云搞大模型是好路子吗😂
点赞 回复 分享
发布于 2023-12-26 01:22 广东
点赞 回复 分享
发布于 2023-12-13 15:10 内蒙古

相关推荐

很多26届牛友最近都陷入集体迷茫:金三银四落幕,身边不少同学已经敲定offer,自己投递石沉大海、面试寥寥无几,忍不住怀疑春招是不是彻底结束了,补录到底还有没有必要投。网上各种说法两极分化,有人说补录全是没人要的边角岗,纯属浪费时间;也有人靠补录逆风翻盘捡到大厂优质岗。作为26届求职大军一员,结合现阶段全网真实投递数据、身边上岸案例和HR底层招聘逻辑,深度复盘春招补录真实情况,全干货无废话,帮所有还在坚守的同学摸清局势、精准捡漏。首先给所有26届同学吃一颗定心丸:26届春招远未结束,5月正是补录黄金窗口期,也是应届生最后一次低成本上岸机会。今年高校毕业生规模再创新高,求职内卷加剧,但春招主批结束后,大量候选人考研上岸、考公上岸、手握多份offer违约放弃入职,各大企业空出大量稀缺名额,开启集中补录。和主招季千人抢一岗的惨烈竞争不同,补录阶段主动停投的人超多,整体竞争强度直接减半,筛选标准放宽、流程大幅提速,是26届逆势捡漏的最佳时机。结合现阶段26届投递真实数据,目前补录市场呈现三大核心特征,也是很多人不知道的捡漏密码。第一,优质岗位并非残次品,多数为核心岗空缺。今年大厂、央国企的补录岗位,大多是候选人违约空出的正经岗位,薪资待遇、培养体系、转正权益和春招主批完全一致,并非网传的边角岗、坑岗。尤其是互联网、新能源、制造业、央国企,35%以上的补录名额都是核心业务岗,含金量极高。第二,招聘流程大幅简化,上岸效率翻倍。为了快速补齐人员缺口,超六成补录岗位直接免除笔试环节,跳过冗长的线上测评筛选,简历过关直接进入面试。面试轮次也从原本的3-4轮压缩至1-2轮,最快一周就能走完全部流程、敲定offer,不用再漫长等待,非常适合现阶段急需兜底、冲刺上岸的26届同学。第三,门槛持续放宽,包容度更高。很多企业补录阶段不再严苛卡学历、绩点、实习经历,往届卡人的硬性条件全部松动,零基础、零实习的同学也能获得面试机会。纵观26届春招全程,现阶段还没上岸的同学,大多不是能力不足,而是踩中了补录致命误区,白白浪费捡漏机会。第一个高频误区:默认春招结束,提前躺平摆烂。很多同学看到四月末春招热潮褪去,就误以为所有岗位停止招聘,直接放弃投递。实则春招真正的捡漏期就在4月末至5月中旬,国企第二批招录、企业违约补岗、业务扩容扩招全部集中在这个阶段,错过就彻底错失应届身份红利,下次求职只能内卷秋招,和27届应届生同台竞争,难度直接翻倍。第二个致命误区:盲目全网海投,毫无针对性。很多同学病急乱投医,每天疯狂投递几十份岗位,不分行业、不看匹配度,简历从不修改。补录阶段岗位少、节奏快、竞争精准,无效海投只会全部石沉大海。主招季海投或许还有概率上岸,补录海投只会彻底陪跑,精准匹配、针对性优化才是上岸核心。第三个普遍误区:嫌弃补录岗位,眼高手低挑三拣四。不少同学觉得补录都是别人剩下的岗位,薪资低、发展差,宁愿空窗观望也不投递。事实上26届很多优质补录岗位性价比远超主批,企业急缺人手,不仅放宽标准,部分岗位还会微调薪资、缩短试用期,反而更容易拿到优质offer。过度挑剔、持续观望,最后只会彻底无岗可投。结合26届最新行情,目前值得全力冲刺的补录赛道十分清晰,避开冷门坑岗,精准投递上岸率翻倍。首先是央国企补录岗,这是26届最大红利。国资委督促央企持续扩岗,全年校招25%的名额集中在春招补录阶段,岗位稳定、福利齐全、容错率高,不强制内卷,非常适合求稳的同学。其次是大厂紧急补岗,字节、满帮、涂鸦智能、春秋航空等企业持续放出运营、市场、职能、技术岗,大量岗位免笔试、流程快,是冲刺大厂的最后机会。最后是优质中小企业兜底岗,岗位缺口大、面试简单、转正率高,适合零基础同学保底上岸。补录阶段想要高效上岸,不能沿用主招季的求职方法,必须掌握专属捡漏策略,这也是我实测有效的上岸干货。首先是分批次阶梯式投递,拒绝盲目乱投。现阶段优先冲大厂、国企核心补录岗,中期锁定中型企业优质岗,最后兜底中小企业稳定岗,分层投递、不慌不忙,兼顾冲刺与保底。其次是锁定精准渠道,告别无效刷屏。重点关注企业官方招聘公众号、校内就业网、专属补录社群,这些渠道的岗位最新、最真,第三方平台滞后岗位多、虚假岗位多,极易浪费时间。最关键的核心步骤:简历精准适配补录岗位。补录HR筛选速度极快,通用流水账简历秒被淘汰。我前期补录投递屡屡零反馈,后来我第一次用了好用的简历优化工具,针对补录岗位的核心需求、JD关键词精准优化简历,剔除无关经历,突出匹配技能和实操能力,让简历简洁精准、直击岗位需求,投递反馈率直接提升一倍。补录节奏极快,简历无需花哨,但必须高度匹配,才能在短时间抓住HR眼球。除此之外,面试要秉持“诚意优先、落地为王”。补录阶段企业最看重稳定性和适配度,HR最怕候选人再次违约、临时放弃。面试中不用过度吹嘘能力,重点展现自己稳定入职、长期深耕的态度,结合岗位需求梳理工作思路,证明自己可以快速上手工作、适配团队节奏,大幅提升上岸概率。很多26届同学纠结,补录的offer值不值得去?这里明确给出答案:正规企业的补录岗,完全值得去,性价比远超秋招普通岗。补录岗和主批岗薪资结构、晋升体系、福利待遇完全一致,唯一区别是招聘时间靠后,不存在歧视、缩水等问题。反而企业急缺人手,新人入职更容易接触核心业务、获得带教资源,不会沦为纯打杂人员,对于应届生来说,是稳赚不赔的选择。现阶段求职最忌讳的就是内耗焦虑,没上岸不代表能力不行,只是求职节奏和机遇不同。26届春招整体缩招、竞争激烈,很多优秀同学暂时没有offer都是常态。不用看着别人上岸自我否定,不用盲目焦虑摆烂,抓住最后补录窗口期,精准发力、稳步冲刺,完全可以逆风翻盘。为了抓住最后上岸机会,我持续打磨自身履历,适配不同补录岗位的需求,我第二次用了好用的简历优化工具,迭代优化简历内容,量化工作成果、突出岗位适配性,让每一次投递都精准有效,不浪费来之不易的补录机会。同时坚持每日复盘面试问题、积累答题思路,稳步提升面试通过率,全力冲刺上岸。距离26届应届身份过期仅剩最后窗口期,补录是我们不用和往届社招人员竞争、不用内卷下一届应届生的最后红利。现在的每一次投递、每一次面试,都是在为自己争取专属的校招福利。哪怕进度缓慢,也不要轻易放弃,稳住心态、精准发力、持续沉淀,机会永远留给坚持到底的人。不管最终是冲刺大厂、锁定国企,还是选择优质中小企业兜底,持续打磨自身能力和履历,才能永远掌握求职主动权。我第三次用了好用的简历优化工具,持续沉淀求职竞争力,让自己在补录阶段脱颖而出,稳稳拿下心仪offer。
26届春招投递记录
点赞 评论 收藏
分享
评论
85
244
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务