这篇文章将 AI 世界模型赛道划分为六大流派,各流派核心思路、代表方和产品各有侧重,均由大厂或顶尖学者团队主导,赛道已获巨额投资且 2026 年值得期待,具体如下:
- 联合嵌入预测架构 (JEPA):代表为 Yann LeCun 的 AMI Labs、Meta V-JEPA 2,核心是在抽象表示空间预测而非像素空间,Meta 产品能理解陌生物体动态,AMI Labs 聚焦医疗等领域商业落地。
- 空间智能 (3DWorldModel):李飞飞的 WorldLabs 为代表,推出成熟商业化产品 Marble,主打重建生成三维世界,让 AI 理解三维空间结构与关系。
- 生成式视频 (交互仿真派):Google DeepMind(Genie3)、Runway(GWM-1)为代表,通过生成物理自洽的可交互世界让 AI 习得世界规律,前者可实时生成 3D 环境,后者侧重多模态通用性,适用于机器人、医疗领域。
- 物理 AI 基础设施 (仿真平台派):NVIDIA Cosmos 为代表,不做模型本身,打造覆盖数据处理、训练、评估的全流程基础设施,含预测、迁移、推理三大模型系列,解决仿真到现实的技术难题。
- 潜空间强化学习:DeepMind + 学术界为代表,代表产品 Dreamer V3/4、MuZero,让 AI 在想象的潜空间世界模型中训练,再将策略应用到现实,降低物理世界学习和数据收集成本。
- 主动推断:Karl Friston 的 VERSES AI 为代表,基于神经科学和贝叶斯认知理论的自由能原理,推出 AXIOM 系统,让 AI 主动建构、验证和迭代世界模型,目前学术关注度高,距商业落地较远。
我可以帮你把这六大流派的核心差异做成对比表,方便你快速对比查看,需要吗?