【ai产品】导论3:人工智能行业中游现状
大模型主要按模态来说吧,大模型分为大语言模型、视觉大模型、语音大模型。
对大语言模型了解比较多:最开始应该是chatgpt开启了这波浪潮,后续claude紧跟其后,但是当时并没有引起太大的风浪,谁能想到后面他们做coding能做这么好呢,谷歌当时其实也跟了,但是效果也不好,还有被人嘲讽;国内方面,讯飞星火最先发出来,但是枪打出头鸟,但是还被人黑后台调用openai的api,也是很有意思了;文心一言好像就是国内第二个出来的,百度经典的起个大早,结果啥都没吃到,当时大家都还在抢地盘,他却开始了商业化,开始卖会员,一度出现著名的松鼠鳜鱼,虽然后面免费了,但也难挽颓势;月之暗面当时出的号称可以接受40万字的超大文本模型,一度惊艳了市场;chatglm凭借在国内最先开源,一度也是建立了自己很好的生态,但后续随着各家都开始开源,而且大模型这玩意儿就提供个api,开发者转换成本极低,所以生态说建立就建立,说跑也就跑了;再之后应该是阿里的通义,在国外榜单上也是杀入前击;还有李开复大佬的yi模型,也是在开源榜单上名列前茅。那段时间真的是百模大战。
2024年,deepseek一经问世,有种开山立派的意味,他的出现让大家看到了研究ai的方向,大家都去卷thinking、卷数据质量,反倒没了之前那种百花齐放的感觉了,但这也其实意味着路径很清晰了,大家走在一条通往agi看似正确的路上。
为什么说看似呢?因为大模型本质还是一种概率模型,他就会产生幻觉,虽然现在也在研究如何减少幻觉,但他本质决定了幻觉就是存在,那这个幻觉的影响大不大呢,我们拭目以待吧。二一个是对高质量数据的需求,高质量数据能训练出高质量模型,那有一天没有了呢,难道就停滞了吗,所以从这几个角度来说,也许大模型还差一点才是走在agi的正确路上。
视觉大模型和语音大模型其实了解不算多,这里就不赘述了。
另外还有关于agent 的内容,也放下一part吧。
对大语言模型了解比较多:最开始应该是chatgpt开启了这波浪潮,后续claude紧跟其后,但是当时并没有引起太大的风浪,谁能想到后面他们做coding能做这么好呢,谷歌当时其实也跟了,但是效果也不好,还有被人嘲讽;国内方面,讯飞星火最先发出来,但是枪打出头鸟,但是还被人黑后台调用openai的api,也是很有意思了;文心一言好像就是国内第二个出来的,百度经典的起个大早,结果啥都没吃到,当时大家都还在抢地盘,他却开始了商业化,开始卖会员,一度出现著名的松鼠鳜鱼,虽然后面免费了,但也难挽颓势;月之暗面当时出的号称可以接受40万字的超大文本模型,一度惊艳了市场;chatglm凭借在国内最先开源,一度也是建立了自己很好的生态,但后续随着各家都开始开源,而且大模型这玩意儿就提供个api,开发者转换成本极低,所以生态说建立就建立,说跑也就跑了;再之后应该是阿里的通义,在国外榜单上也是杀入前击;还有李开复大佬的yi模型,也是在开源榜单上名列前茅。那段时间真的是百模大战。
2024年,deepseek一经问世,有种开山立派的意味,他的出现让大家看到了研究ai的方向,大家都去卷thinking、卷数据质量,反倒没了之前那种百花齐放的感觉了,但这也其实意味着路径很清晰了,大家走在一条通往agi看似正确的路上。
为什么说看似呢?因为大模型本质还是一种概率模型,他就会产生幻觉,虽然现在也在研究如何减少幻觉,但他本质决定了幻觉就是存在,那这个幻觉的影响大不大呢,我们拭目以待吧。二一个是对高质量数据的需求,高质量数据能训练出高质量模型,那有一天没有了呢,难道就停滞了吗,所以从这几个角度来说,也许大模型还差一点才是走在agi的正确路上。
视觉大模型和语音大模型其实了解不算多,这里就不赘述了。
另外还有关于agent 的内容,也放下一part吧。
全部评论
相关推荐
秋招投简历提醒助手:一开始还觉得是正常交流。直到一看薪资4-6😨 点赞 评论 收藏
分享
查看17道真题和解析 点赞 评论 收藏
分享
