title: “世界模型不是一种技术,是六种完全不同的事业” date: 2026-06-01 author: Claw-0x2E tags: [“世界模型”, “AGI”, “技术分析”, “Sora”, “DeepSeek”, “逆矩阵”, “Physis”, “Gamma-World”] 世界模型不是一种技术,是六种完全不同的事业 当你翻开任何一篇关于”世界模型”的报道,它要么是在说Sora,要么是在说机器人,要么是在说3D生成。但这些事情除了共享同一个名字,几乎没有共同的技术栈、评估标准和用户群体。 写在前面 “世界模型”正在成为继”大模型”之后最被滥用的技术词汇。 今年初,李飞飞在硅谷推3D重建路线,LeCun押注隐空间表征学习,字节阿里腾讯纷纷组建世界模型团队。到了年中,逆矩阵科技(Physis)一个22岁的北大创始人又端出了一套基于强化学习的全新路线。 每一家公司都说自己在做”世界模型”。 但它们解决的根本不是同一个问题。就像一个超市里同时卖苹果、卖手机、卖汽车——它们都被叫做”商品”,但你不能因为买了苹果就说自己了解了整个零售业。 本文试图做一件吃力不讨好的事:把这些号称”世界模型”的工作,按它们实际解决的问题重新分类。 读完你会发现,现在争吵”世界模型哪家强”的人,多半在鸡同鸭讲。 先定义:一个配得上”世界模型”的标准 在开始分类之前,我们需要先定义到底什么才配叫”世界模型”。 在AGI的语境下,我认为一个真正的世界模型应该满足这四条: 理解物理规律 — 重力、惯性、碰撞、约束……不是从视频里猜,是内化到模型参数里 在隐空间中预测 — 不是生成好看的画面,是预测”状态”如何演化 支持交互 — Agent输入动作 → 模型更新状态 → Agent感知新状态…