特斯拉解散 Dojo 超级计算机团队,这背后原因有哪些?
我必须承认,当马斯克突然宣布砍掉整个Dojo团队时,我的第一反应是:这是假新闻吗? 这可不是小打小闹,这是一个投入了数年、耗费了数十亿美金、在每一季财报里都被寄予厚望的“亲儿子”。用一个不那么恰当但足够形象的比喻,这无异于一个中年男人,在事业巅峰期,亲手割掉了自己的一个肾。你得想象一下,这有多疼。 但这绝不是一次简单的战略收缩,更不是一次愚蠢的投资失败。这是一次痛苦、决绝、但又无比理性的“献祭”。马斯克挥刀砍向的,不仅仅是一个落后英伟达四代、已然走进“进化死胡同”的自研芯片项目 ,更是向整个行业宣告:基于纯粹大语言模型(LLM)的旧神正在黄昏,一个名为“世界模型”(World Model)的新
我必须承认,当马斯克突然宣布砍掉整个Dojo团队时,我的第一反应是:这是假新闻吗? 这可不是小打小闹,这是一个投入了数年、耗费了数十亿美金、在每一季财报里都被寄予厚望的“亲儿子”。用一个不那么恰当但足够形象的比喻,这无异于一个中年男人,在事业巅峰期,亲手割掉了自己的一个肾。你得想象一下,这有多疼。
但这绝不是一次简单的战略收缩,更不是一次愚蠢的投资失败。这是一次痛苦、决绝、但又无比理性的“献祭”。马斯克挥刀砍向的,不仅仅是一个落后英伟达四代、已然走进“进化死胡同”的自研芯片项目 ,更是向整个行业宣告:基于纯粹大语言模型(LLM)的旧神正在黄昏,一个名为“世界模型”(World Model)的新神,即将降临。特斯拉,或者说马斯克的整个AI帝国,正在完成一次架构上的“换脑手术”,一次从大脑到身体的彻底解耦。
语言模型的黄昏:六指“幻觉”与架构的尽头
让我们先谈谈那个被献祭的“旧神”——大语言模型。我们必须面对一个残酷的现实:LLM的进化正在明显见顶。别看GPT-5闹得沸沸扬扬,但它相较于前代,并没有带来“从3.5到4”那样的飞跃式突破,面对Grok和Claude,也只是微弱胜出。这背后,是架构的根本性瓶颈。
一个流传甚广的“六指测试”绝妙地揭示了LLM的软肋:
你给GPT-5一张P过的六指手掌照片,它会无比坚定地告诉你,这是五个手指。 它甚至会帮你把“正确的”五根手指标出来,而对那多出来的第六指视而不见,将其当成背景。这不是蠢,这是它世界观的底层缺陷。LLM的世界是靠海量文本“学习”来的,它拥有庞大的知识,却没有真实的常识。 它的认知里,“人有五指”是一条铁律,当现实与它的知识库冲突时,它选择相信知识,而不是相信现实。
这个问题,无法通过堆砌更多的数据和算力来解决。
LLM这种纯粹基于语言符号的二维压缩模式,在理解和交互三维物理世界时,存在着不可逾越的鸿沟。就像王兴兴所言,机器人端的模型根本用不上预训练的那些数据,也像李飞飞那句充满哲学意味的断言:“世界是三维的”。语言,终究只是三维世界在我们二维认知里的一个扁平投影。
世界模型降临:当AI睁眼看见三维真实
正当LLM在二维世界里卷生卷死时,Google DeepMind发布的Genie 3,为我们展示了通往三维世界的大门。它不再满足于阅读文字,而是通过观看海量的视频,以无监督的方式,自己“悟”出了一个可以交互、遵循物理规律、并且在时空上保持一致性的虚拟3D世界。
这与LLM是根本性的不同。它像AlphaZero不依赖人类棋谱、自我博弈进化一样,Genie 3正在摆脱人类语言的“标签”束缚,直接从像素中理解世界的运转方式。视频中的涂鸦,在你转了一圈后回来,它依然在那里;它能以每秒24帧的速度连续生成一分钟以上的流畅视频,每一帧都经过回溯计算,确保了惊人的物理一致性。
这才是具身智能的未来。过去,我们把机器人扔进真实世界里,通过一次次昂贵的碰撞去积累经验;而现在,我们可以在世界模型里,以接近零的边际成本,让无数个智能体24小时不间断地进行虚拟训练。
这也解释了马斯克为何要“换脑”——将“大脑”的预训练(交给X.AI和英伟达的通用能力)与“身体”的端侧推理(数百万辆特斯拉和机器人组成的真实世界数据采集器)彻底分开。大脑在上奥数班,身体则在练体育搏击,专业分工,效率至上。
道与术之争:真正的分野不在算力,而在模型之魂
所以,Dojo的死亡,并非特斯拉一家的得失,而是整个AI行业从“术”的竞争转向“道”的竞争的标志性事件。]过去,我们比拼的是谁的参数更多、算力更猛,这是“术”的层面。而现在,真正的分野在于你选择了哪条路,你的模型之魂是什么——是停留在二维语言的LLM,还是拥抱三维真实的World Model?
马斯克已经用割掉一个“肾”的惨痛代价,给出了他的答案。他选择放弃在“术”的层面与英伟达进行低效的追赶,而将所有赌注押在“道”的革新上。他要的,是一个能与物理世界深度交互、不断采集高质量真实数据的“身体”,而“大脑”则可以采用开放市场上最强的方案。这是一种更聪明、也更务实的策略。
黄仁勋的甜蜜烦恼
聊到这里,就不得不提那个皮衣下永远一身汗的男人——黄仁勋。 Dojo死了,最大的赢家看起来是他。但这背后,或许是更甜蜜的烦恼。无论是LLM还是World Model,都像饕餮巨兽般吞噬着算力,这让英伟达和台积电在短期内稳坐钓鱼台。 但真正的变革在于,市场的天平正在从“训练”端向“推理”端急剧倾斜。过去,客户是少数几家巨头;未来,每一个智能终端背后,都可能是一个推理芯片的新客户。蛋糕的切法,已经变了。
说到底,马斯克只是提前看到了语言的尽头。那个由文字和符号构建的精妙世界,终究只是一个“平面国”。
告别语言的平面国,世界终归是三维的。
👉訂閱「JustSayAI早晚報」· 每日兩封 · 一鍵聽報:https://justsayai.org/newsletter (需科学上网)
【关注频道】:
📺B站:叫我小苏就好啊
📕小红书:人民公园说AI
▶️油管:人民公园说AI