wudangwangye level
获赞
551
粉丝
348
关注
3
看过 TA
2551
门头沟学院
2026
人工智能
IP属地:四川
暂未填写个人简介
私信
关注
04-11 16:10
已编辑
门头沟学院 人工智能
0 点赞 评论 收藏
分享
说实话,我不是什么顶尖专家,但跟着几个亚洲领域都比较权威的博士(也不算最顶尖的,就是很靠谱的那种)一起搞东西,慢慢就发现了一条全流程的路线:世界模型其实从根子上就是为具身智能服务的。它不是独立漂着的“聪明脑子”,而是给机器人、无人机这些“身体”提供物理常识、空间理解和因果预判的底层框架。没这个,具身智能就是空中楼阁;有了它,机器人才可能从“听话的玩具”变成真正能干活的“通用劳动力。我把这条路线拆开来讲,先说主流是怎么玩的,再说传统流派,最后聊聊我自己的看法——包括为什么我觉得人形机器人有点像当年的磁悬浮列车,华而不实、昂贵又不一定实用。整个过程都是我的真实观察欢迎大伙指正讨论。一、世界模型的目前发展路线具身智能的世界模型这个概念,其实最早是让AI“懂世界”——不是光懂文字、懂逻辑,而是懂物理现实、懂空间、懂物体怎么互动、怎么随时间变化。暂时的话主流路线现在已经很清晰了:都是以马斯克的思路:从真实数据采集 → 云端上传与合成 → 仿真环境强化学习 → Sim-to-Real迁移到真实机器人。这套东西不是凭空冒出来的,它就是为了解决具身智能的痛点设计的。以最经典的例子来说:机器人去端一杯水。传统编程告诉你“摩擦系数0.3,推力10牛顿”,结果杯子是透明的、下面有水渍、光影晃动,或者形状古怪——公式没有办法处理这些的没法设计这么多参数的。世界模型就不一样,它学的是“隐式物理规律”。通过海量视频或传感器数据,模型学会预测:杯子滑动时不会穿桌、松手后会停、水面会晃动。这就是从“像素预测”到“世界理解”的跃迁。最典型的就是马斯克的Tesla Optimus(擎天柱)。基本上马斯克直接把自动驾驶(FSD)的海量真实车端数据拿来用。这些数据本来是训练车怎么开的,现在直接转成训练机器人怎么走的“基础养料”。为什么?因为自动驾驶数据里全是真实世界的物理交互:车怎么避障、怎么判断距离、怎么处理光影和动态物体。而机器人端杯子、捡东西、走路,这些动作的本质逻辑其实是一样的。然后就是合成数据这一步。为什么必须合成?因为真实机器人数据太贵、太少、太危险。真实世界里,杯子高度不确定、表面滑不滑不确定、下面有没有水不确定、光线昏暗不确定……纯靠真机采集,太贵还覆盖不了所有“长尾场景。所以用合成数据:在虚拟环境里生成100万种变体——透明杯子、带水渍的、艺术异形杯、在不同光影下的——全扔进去训练。最后一步,放进仿真环境(比如NVIDIA的Isaac Lab或者Tesla自己的模拟器)里狂刷强化学习。在通过几千次、几万次、几十万次、甚至几百万次“试错”。机器人一次次失败、调整、成功,模型就学会了“如果我这样推,会不会洒;如果这样抓,会不会滑”。训练好了,再通过Sim-to-Real技术迁移到真实机器人身上——直接上手干活,不用从零再学。这就是2026年最经典、最基本的世界模型思路。马斯克和华为其实都在走这条路:华为的ADS智驾数据也直接喂给他们的具身智能项目,而且盘古大模型正往具身方向演进,用世界模型+强化学习的路线做端到端决策。二、具身智能的主要方向:低空经济、人形机器人、扫地/机械狗具身智能不是空谈,它有几个大流派,都是资本现在最爱砸钱的。第一个是低空经济(无人机),无人机本质上也是具身智能——它得感知气流、预判障碍、实时决策路径。比人形机器人简单多了,因为它不用非得“像人”,飞行器形态更灵活,场景也更确定(物流、巡检、应急)。2026年低空经济已经从示范跑到规模化了,在此基础之上我们会发现无人机有固定的使用场景而且会越来越多。第二个就是人形机器人,资本追得最疯。为什么?因为它看起来最“万能”——双腿走路、双手操作,能进人类所有场景。第三个是扫地机器人、机械狗这些“窄体”具身,成熟最早,但市场天花板低,大家还是觉得“不够酷”。然后就是资本为什么全押人形?因为全世界都在追马斯克的眼光。不知道大伙看过没有这个Tesla Optimus没有,现在基本上已经很优秀了,从工厂轻装配到家用,演示视频刷屏。而且大概就在夏季就投产大概一台是两万美金有条件可以拿来倒卖其实。三、传统流派和世界模型的区别主流世界模型之前,还有两种老派训练方式。一种是遥控操作,就像玩电动玩具遥控车一样,人在后面手柄操作,机器人模仿。主要是贵!需要大量人力实时操控,一天只能训几小时,还容易疲劳出错。另一种是数字采集,人戴数据手套、穿动作捕捉服,传感器记录每一丝关节角度、力反馈。数据质量高,但设备贵、场景受限,只能固定路数训练——往左走、往右抓,遇到没见过的情况就寄了。两者共同问题:成本高、扩展性差、没法覆盖长尾场景,所以世界模型路线一出来,大家就觉得“终于有 scalable 的办法了”。其实还是李飞飞出来的,她提出的空间模型给了世界模型的是思路就是生成周边所有的内容。四、我的现实思考:这条路可能走不通?人形机器人很像磁悬浮列车我得说实话,我个人觉得主流世界模型+人形机器人的这条路,可能不是最好的,甚至有点走不通。首先,人形机器人太像当年的磁悬浮列车了——技术炫酷、资本追捧,但华而不实、昂贵且无用。2026年了,智元机器人的主流机型还50万出头(早期百万级,现在降了一半),便携款才刚压到万元内,有很大的问题是电机旋钮,电机扭矩,材料,电池能耗之类的,我玩的基本上都是远征或者a2w这种工厂款式的,这种基本上都是旁边带电的,基本上一两个小时就没了,然后就是真机训练了,再加仿真RL,算力、功耗、发热都是天坑。这些机器人基本上内存都很小的。我的搞金融、私募的朋友们告诉我另一个故事:他们说机器人是个“足够大的饼”,所有场景都能用,所有事情都能代替人类。你只需要躺在床上,机器人就帮你搞定一切——做饭、打扫、陪护、甚至情感交互。这就是资本为什么疯狂涌入的原因:想象空间无限,估值可以讲故事讲到天上去。大量公司扎堆做,就是因为“所有人、所有场景”这个叙事太诱人了。所以这两年有很多割韭菜的公司会倒闭的。但仔细想呢?机器人不一定非得是人形的啊!手部操作只是“方便”,不是必须。低空经济里的无人机,就证明了具身智能完全可以“非人形”却更实用。它适配性强、成本低、场景明确(物流巡检远比“端杯子”确定),数据闭环也更容易。所有商用的话肯定先实现无人机的,像很多表演的机器人都是没有什么实在的,都是预设的命令就是固定的,基本上都是抄人家的这些公司的机器人都做不了或者都没法军用。而如今我们其实已经来到机器人的变革前夜了,我也在做roboclaw之类的项目,像这种代理agent是可以操作机器人的解决能源和延迟的问题就可以投产的再次基础之上降低损耗和成本就可以让机器人送外卖或者做饭之类的,不过最近的话ai大概至少领先机器人五年的,要不了多久我们就可以看到街头遍地机器人了,最后还是说些题外话,其实大伙没必要焦虑什么,行动起来,在大幅通货膨胀之前,建立自己的壁垒。然后就是加油了大伙,我相信未来属于拥抱未来的人。(全文约8000字,纯属个人观察与思考,基于2026年4月行业现状整理。)
0 点赞 评论 收藏
分享
多智能体系统(Multi-Agent Systems)让一群AI Agent分工协作,看起来效率很高,但实际落地时,单个Agent的问题会被成倍放大:流程容易卡死、幻觉连锁传播、Token成本失控。以下是2026年生产环境中最常见的6个坑,以及对应的避开方法。1. 所有Agent都用同一个大模型现象:规划层、执行层、审计层统一用同一个强模型(比如全用Claude 3.5或Grok 4)。为什么坑大:思考能力强的模型被用来跑简单工具调用,Token成本直接拉高;同时不同Agent的输出风格互相干扰,幻觉更容易在链路中放大。避法:分层选模型。规划层(Supervisor)用思考强的模型,执行层Worker换更快、更便宜的专用模型(Qwen3、DeepSeek等)。混合使用能把整体Token成本降低约70%,每个Agent也更专注自己的角色。2. 只靠Prompt记录历史,不做状态管理现象:Agent之间的对话历史直接塞进Prompt,让它们“自己记住就行”。为什么坑大:任务稍长或出现分支,上下文就混乱,前面的决策后面被遗忘,或者重复执行无效步骤。避法:必须采用有状态的图结构(Stateful Graph)或Checkpoint机制。LangGraph在这方面做得成熟,每一步状态都能持久化、回溯和调试。不要把全部记忆压在Prompt上,那不是生产级做法。3. 缺少Verifier和人工干预节点现象:Agent数量增多后,一个Worker的幻觉直接传给后面的分析和写作Agent,最终输出看着合理,实际使用就出问题。为什么坑大:错误在链路中快速传导,生产环境风险极高。避法:在关键节点强制加入Verifier Agent,专门负责事实检查和一致性校验。同时在高风险步骤保留Human-in-the-Loop(人工审核点)。2026年成熟系统几乎都会在全自动链路中加把关机制。4. 工具集成和Agent间通信全靠自定义胶水代码现象:自己手写代码去连接工具、传递消息。为什么坑大:维护成本高,换框架或需要扩展时要重写大量代码。避法:优先采用标准协议。MCP(Model Context Protocol)让Agent以统一方式发现和使用工具,像插统一的“USB接口”一样接入浏览器、API、数据库。A2A(Agent-to-Agent Protocol)负责Agent之间标准发现和委托任务。2026年主流框架都在支持这两个协议,用它们能大幅减少自定义代码,系统也更容易跨框架扩展。5. 一上来就用完全去中心化的Swarm模式现象:所有Agent平等协作,追求“涌现智能”。为什么坑大:复杂任务容易出现死锁、互相等待或输出冲突,调试难度极大。避法:大多数生产场景先从分层结构(Hierarchical)入手——上方Supervisor负责拆任务、分配和汇总,下方是专注的Worker。系统跑稳后再在局部引入Swarm式的并行协作。分层结构控制力强、审计方便,是2026年企业落地最广泛的模式。6. 忽略整体成本和监控现象:集群跑起来后,Token消耗、延迟、错误率失控,尤其是多个Worker并行执行时。为什么坑大:账单和系统稳定性同时出问题。避法:从一开始就接入可观测性工具(LangSmith、Langfuse等),实时监控每个Agent的调用次数、Token用量和成功率。定期压缩记忆,避免历史越积越多。同时设置预算阈值和自动降级机制(复杂任务失败时切换到更简单的流程)。搭AI Agent集群,本质上是搭建一个“数字员工团队”。团队越大,分工必须越清晰,协作协议必须越标准,检查机制必须越严格。避开以上6个坑,系统才能从“看起来能跑”变成“真正稳定、好维护、成本可控”。原文:https://x.com/dss_ws14043/status/2038804249669411229,个人推特。
大厂实习和小厂实习最大的...
0 点赞 评论 收藏
分享
02-10 14:41
已编辑
门头沟学院 人工智能
事实上,人的创造力和灵光乍现都是在无聊的时候出现,就是因为没事可干才让世界变得这样精彩绝伦,天啊,有太多可玩,可想,有太多值得尝试的内容啦,光是我泱泱华夏都有这么多地方可以去:你可以春天前往西南地带看看春暖花开,你可以夏天去海南享受日光浴,又或者秋天去往新疆体验异域风情,更何况可以冬天上东北看看真正的严寒是什么样的。或者说你喜欢游戏,农药,lol,cs,星露谷,女神异闻录,怪物猎人,黑猴,街霸,我数不清啦,还可以去电竞比赛看看,或者三五好友成群痛痛快快的打游戏,真的,天底下有太多好玩的了,我还没讲完呢,走出门能干什么,想要好的身材可以健身,游泳,滑雪,徒步,露营,玩滑板,想要好的才学可以弹琴,学吉他,去图书馆,去电影院,去音乐会,去漫展,去博物馆,甚至可以养一些动物,猫猫狗狗,有那么多品种,我甚至想养狐獴和白貂,你也可以,去办证书就行了,甚至可以养一些猫头鹰之类的,又或者遇到一个喜欢的漂亮妹妹或者薄肌小帅,与她/他轰轰烈烈的谈一场恋爱,你可能说,我以前遇人不淑,是的,我也这样,这很糟糕,对吧,但是没什么的,你的过往组成了今日的你,你会遇到更好的人的,你会去更大的地方的,我只是一个教学博主,我只能讲一部分内容,这些文字承载着力量,它们涵盖着我想说的,去好好享受此生吧,去享受每一分钟,去往曾经只敢想象的地方,你们需要保持好奇心,我只能告诉你们海的那边是什么样子的,或者山的那头是什么样子的,但是要坐船,还是做飞机过去,这个是由你定的,大胆前行吧,忘却过去那些不愉快的,去做那勇敢而热烈之人,去追求你的快乐吧,最后:欢迎来到,地球online!
0 点赞 评论 收藏
分享
也到了马年年关了我作为从业者从写教程,到开多平台创作,包括x,油管,小红书,公众号,之类的多平台。已经基本上离不开使用ai了,生成文稿,让他转翻译,做过搬运,口播,还有写过无数的代码项目,包含量化,刷交易返佣,个人博客,去提示词,大小无数脚本,起码这半年给不下数十个老板服务过。每天都在高强度使用ai,另一部分,到底要不要去理解ai是如何工作的?我可以告诉你,很有必要,我见过无数prompt小子,让我感到惊讶的是,他们根本不理解微调和infra,更加别提双塔模型和高斯噪声拟合之类的,每次反问他,他们只会说我更偏向工程方向,但是实际上的工程项目和传统开发一样啊,你都不懂,你怎么去改好呢?但是涉及到ai方面的,基本上你都要会一点算法,可以说搞算法的基本上都要会大模型,搞开发的懂算法就乱杀这里其实涉及到一个很经典的问题,就是降维打击,当清华都要和你抢饭碗了,那么直接意味着这个行业就不景气了,这也就是为什么清华北大被视为行业冥灯的原因。这里没有调侃的意思。我可以说我神州华夏之大,每年寥寥数千清北毕业生可以去高就的地方可以是挑都挑不过来的。这个叫做社会共识,也就是类似你结婚要出彩礼钱一样,在求职方面,在学历方面,在中国清北的学历就是天花板,然后就是涉及到行业不景气的问题了,假如计算机行业失去薪资和技术优势,那么我们应该去做什么工作呢?我应该是从去年5月份开始写这方面的题材,不知道有多少人看到我的文字,我可以说,我写的基本上是没有什么废话的,对你们不管男孩女孩都是为人处世,在社会上生活有用的,第一点:不要陷入力工思维,什么是力工思维呢?(详情参考峰哥,去b站可以搜到),涉及政治和社会敏感问题,因为我是全平台发布,所以很多东西不能说。就是铁人三项,这三项是很典型的吃人口红利的职业,但是没有任何成长空间或者上限太低以至于三年工作经验和两个月上手没太大区别。第二点:有复利,有成长曲线的职业。这里有很明显的一些,比如自媒体,主播或者职业金融人:涉及基金,证券之类的,自己开个户去玩会,现在a股和黄鱼甚至加密货币都将来到低点。这种基本上门槛很低,但是前期投入很大,可能一直没人看,但是突然来了流量突然赚个大几百万是没什么问题,从命理学角度而言,这个叫做横财,你命中注定要发财。大部分是火贪格,不过容易败财而且不长久。还有其他十六种富贵命格这些天我web3项目不怎么忙,可以有空讲讲,不过还是看大伙感不感兴趣,可以私信专门写,也可以收费算命,主要测算的是紫薇斗数方面。第三点:有技术门槛也就是护城河也就是我会你不会。可以说计算机的算法和开发是存在这个的,类似的还有石雕,沙画之类的工艺者,基本上可以说,我会你不会,我有你没有,也可以说或者干脆你很难去有和学会,我不知道你们去过博物馆或者漫展没有,在博物馆里面,基本上就是漫天要价的,你爱买不买,因为东西就那么几个,你不买有的是人买,漫展呢,有很多化妆的,手法好的一次就是收费大几千,不过有毒,还有摄影的,也是排期都排不过来,半小时赚到大几百上千随便很轻松的时期,类似还有初中没毕业的灯光师月入几十万的,这种行业很多,多去体会,多出去转转,实际上社会是由人与人联系来组建和构成的,而不是机器,电脑只占比很小的一部分。大概10%?也许更少,我刚才所言,举了一些例子,是让你们有信心,去选取一些有价值的职业或者有效果的,那么也聊了一些东西了,最后呢,还是点点关注吧,我写博客不为别的,单纯是喜欢,读了很多书,又有表达欲,所以写一些东西,写文字都没有什么稿子,单纯一下就出来了,也就是所谓心流这种事情是让我很自在的,大伙也要一定要做一下让自己觉得时间很快的事情,去做自己热爱的,这样才不算耽搁此生。
AI求职实录
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务