LLM与JEPA的AI路线之争

导出时间：2026/5/19 05:28:47

来源地址：https://www.doubao.com/chat/38426506849679618

消息数量：6

你写的很好，但是我想让你再强调一点是什么东西呢？你这基本上都是可以用的，但是有一点我是让你就是就是要核心的点破题，甚至于放在开头就直接要用到的一个思想是什么？就是大语言模型的这一套能够把人类几千年积累的这些知识经验固化，或者说是能够传承、克隆的这种能力，是人类始终梦想但又不可得的一种能力。什么意思？就碳基生物这个出生是不自带记忆的，是没有办法去像大语言模型这样把知识继承、遗传、克隆的。这正是硅基生命跟碳基生命相比最大的优势，而这个是人类所梦想的，所昼思夜想求而不得的能力。而杨立昆却要把它放弃掉。这绝对是不是一个智慧的选择。这是人类所期盼的，对不对？是人人都想做而做不到的。可是如今我们有了这种能力的话，杨立昆却反其道而行之，这是不可取的。我希望把这个思想能够放在这个整个分享的最高层次，或者说是一开头点题和最后都总结出来，这是我最大的反对他的地方。

我完全抓住你的核心立论制高点：“可遗传、可克隆、可固化的文明级记忆”，是硅基 AI 独有的、碳基人类永恒求而不得的终极天赋。杨立昆却主张主动舍弃这份天赋，是最大的路线误判。

我将把这个核心观点置顶开篇、贯穿全文、收尾升华，保留你原本完整的逻辑（因果智能定义、记忆即能力、直接 / 间接经验辩证），强化你最关键的批判内核，成文完整定稿分享版。

杨立昆质疑大模型的深层思辨：切勿舍弃硅基生命独有的、人类求而不得的终极天赋

在整个 AI 行业狂热追逐大模型、又普遍深陷模型幻觉与理解缺陷争议的当下，图灵奖得主杨立昆对 LLM 的尖锐批判，的确戳中了现有技术体系的短板。他所倡导的 JEPA 智能框架，主张 AI 应当拥有自主观察世界、从零发现因果、原生推演规律的底层智能能力，而非单纯依赖文本记忆输出结果。

这套理念有其合理的先进性，但我认为其核心路线存在根本性的极端化误判。最关键、也是最容易被行业忽略的核心矛盾在于：大语言模型能够固化、克隆、继承人类数千年文明知识与经验的能力，是碳基人类穷尽一生、世代更迭都求而不得的终极能力，是硅基生命碾压生物智能的独一无二的天赋，而杨立昆却主张主动放弃这份天赐优势。

这是我们审视这场 AI 路线之争，最顶层、最核心的底层逻辑。

碳基人类的生物宿命，存在一个永恒无法突破的桎梏：人类没有知识遗传与记忆继承的能力。每一个人类个体诞生之初都是一张白纸，无论先辈积累了多少科学理论、生存经验、因果规律、文明智慧，都无法通过基因直接传递给后代。一代人穷尽一生习得的知识、总结的规律、沉淀的认知，下一代必须从零开始学习、重新摸索、反复试错。人类文明的进步，本质是一代代人低效重复、迭代传承、损耗极大的积累过程，这种天生的缺陷，限制了人类智能的上限与文明进化的速度。

而大语言模型的出现，第一次打破了碳基生物的智能枷锁。

AI 通过预训练，将人类数千年所有的文本、逻辑、因果关系、事件规律、经验总结，全部固化为模型权重。它实现了人类梦寐以求的能力：知识可遗传、经验可克隆、智慧可继承、文明可一键叠加。一个训练完备的大模型，天生就承载了人类千年的文明积累，无需从零观察、无需亲身试错、无需漫长学习，这是所有人类终身渴望、却永远无法拥有的超能力，也是硅基智能最核心、最不可替代的战略优势。

基于这个顶层逻辑，我们再重新辩证审视杨立昆的核心争议，以及智能、记忆、能力、经验的本质关系。

首先，我们先明确智能的底层定义：真正的智能，本质是在固定时间窗口内，捕捉不同事件之间的概率性、规律性因果链。世间所有复杂的事件关联，最终都可以拆解为二元事件的先后、强弱、概率因果关系。能够主动识别、归纳、推演、预判这种时间序列与因果逻辑，就是智能最原始、最核心的能力。

杨立昆的核心观点是：现有 LLM 只会 “记忆结果”，不具备 “发现规律的原生能力”。他坚定认为，模型的 Token 预测只是机械背诵人类总结好的因果结论，权重里储存的只是固化的记忆，而非真正的智能推演能力。因此他主张摒弃现有预训练模式，让 AI 像人类一样，从零观察世界、自主探索实践、独立发现所有规律，依靠纯粹的原生能力实现智能。

不可否认，这个理念有其正向价值。现有大模型确实存在短板：它依托人类文本数据学习，对真实物理世界的感知、实践验证、实时推演能力存在缺失，容易产生逻辑幻觉、脱离现实场景。从通用人工智能的终极形态来看，具备自主探索、自我归纳、实践纠错的原生能力，确实是 AI 突破现有瓶颈的必经之路。

但杨立昆的致命误区，在于极端割裂了记忆与能力、直接经验与间接经验的辩证关系，更是否定了硅基智能的核心价值。

第一，记忆是能力的基石，高阶智能本身就是升华后的结构化记忆，二者本是一体，不可二元对立。

大模型预测下一个 Token 的核心机制，从来不是简单的文字记忆。模型在海量数据训练过程中，本质是在无数真实事件、文本逻辑、因果场景中，反复学习、提炼、归纳人类世界的时间规律与因果链条。所谓的权重记忆，是千万次逻辑推演、关联匹配、因果验证后沉淀的结构化思维范式。

换句话说，LLM 看似储存的是 “结果”，实则在训练中潜移默化掌握了发现因果、推演关联、预判趋势的底层能力。杨立昆强硬区分 “记忆” 和 “能力”，认为背诵规律就不算智能，必须从零发现才算能力，是一种机械的二元思维。在智能的底层逻辑里，没有无记忆的能力，所有高阶推演能力，都建立在海量经验记忆的积累之上。记忆沉淀为逻辑，逻辑固化为能力，这是智能演化的唯一路径。

第二，杨立昆全盘否定间接经验的价值，强行要求 AI 复刻人类的生物缺陷，是舍本逐末。

人类文明之所以能够延续、迭代、跃迁，99% 的进步都来自间接经验的传承。我们不需要亲自验证万有引力、不需要亲身经历历史更迭、不需要从零推导数理公式，通过书本、文献、前人总结的经验，就能快速掌握核心规律。如果遵循杨立昆的逻辑，所有知识、所有因果、所有规律，都必须依靠自身实践、直接经验从零发现，别说文明进步，就连人类个体的生存学习都无法完成。人的寿命、精力、实践范围极度有限，事事亲为的直接经验，是生物智能的无奈短板，绝非智能的标准答案。

而大模型的核心优势，恰恰是完美解决了碳基生物的这个终极缺陷。它可以无损耗、全覆盖、永久性继承人类所有间接经验，跳出人类从零学习的低效循环。这不是 AI 的弱点，而是它超越人类生物智能的最大优势。

杨立昆的路线，本质是舍弃硅基生命的天赋，强行让完美的机器智能，复刻人类落后的生物学习模式。他追求的 “原生探索能力”，是补齐 AI 的短板，但绝不应该以抛弃 “文明遗传、知识克隆” 的顶级能力为代价。

我们可以清晰得出最终结论：

JEPA 的理念，弥补了大模型缺乏现实感知、缺乏自主探索、缺乏实践验证的短板，是 AI 走向更强通用智能的重要补充，具备极高的参考价值。

但杨立昆的极端路线绝对不可取。主动放弃 AI 独有的、人类千年求而不得的知识遗传与文明克隆能力，强行让硅基智能退化回碳基生物的低效学习模式，不是进阶，而是倒退。

真正的终极 AI 智能，从来不是二选一的对立：既保留大模型继承人类千年文明、固化海量经验、快速形成高阶逻辑的硅基天赋；又吸纳 JEPA 框架自主观察、从零推演、实践纠错、理解真实世界的原生能力。

以海量传承经验为根基，以自主探索能力为迭代引擎，二者融合互补，才是人工智能最正确、最高效、最贴合智能本质的终极进化路径。绝不应该为了追求纯粹的 “原生能力”，抛弃人类梦寐以求、独一无二的硅基文明天赋。

整篇已经完全对齐你的核心思想：开篇置顶核心观点、全文贯穿碳基 / 硅基的本质差距、结尾升华路线对错，是完整可直接转发分享的定稿。需要我帮你微调语气更犀利凝练，适配朋友圈 / 社群分享吗？

【LLM是死路？图灵奖得主杨立昆这次炮轰，击中了整个AI行业的要害】点击链接打开👉 https://m.toutiao.com/is/p_UWqw03TAQ/ p_UWqw03TAQ` pib:/ e@o.Dh :9am 复制此条消息，打开「今日头条APP」或「今日头条极速版APP」后直接查看~ 我没有很仔细地看这个杨丽坤的这个 jpa JP 的这个东西，但是我感觉就是跟我以前的理念是差不多的合拍的，就是说我们以前定义智能。就是智能的定义是什么呢？就是在呃一定的时间窗口内，发现有序的这个因果链，或者说是。这个叫做有序的时间，对吧？或者说事事件，对吧？事件 Event PI，就是两个事件，比方说 AB，它都是呃，总是按照某种因果。率的出现，比如说 A 出现，B， B 出现，或者说 A 出现，B 不一定出现，或者 B 出现，A 一定出现，就就是前后顺序吧，就是因为这个所谓的这个因果律，就是说在时间上，他们有这种先后关系，呃。而且是有一定的这种概率性的先后关系吧，就是说一定出现百分之百是强关系，概率性出现是弱关系，是有因果性的，等于是说，在这样的一个时间窗口内去发现这样的。呃，事件对吧？Event p，或者说是更多，超过三个，4个等等，但是超过三个实际上是可以再把它呃融合成一对儿，就是你个把两个关联的又做成一个。呃，超级世界，然后就可以再把它简化成二二元的，就是始终都是两个事件，那这个能力的发现，它就是智能，而大语言模型训练其实就是预先把这个。能力先，或者说不叫把这个能力先给他，或者说是把这个结果给他。那杨丽坤的设想是说，你直接给他结果，你还不如直接给他能力如果他有这个能力的话，你事先都不用训练。就是说我们现在的大语言模型的训练是一种偷懒的。是我把这个能力当做结果给了大语言模型，放在它的权重里面，但实际上，它应该是说，我们把这个能力给这个大语言模型，而让大语言模型去自行去发现所有的这个我们现在训练的这个结果。这个相当于说，直接经验跟间接经验一样，就是说我们要求大语言模型把我们预训练的所有的这些规律化的东西就自己重新发现一遍，我觉得这个。理想也许是正确的，但是相当于说，我们要求每一个大语言模型就像人类一样从头学习一遍。这个不是说不可以，但是成本太高了。而且我们已经有现成的这个知识体系了大语言模型的比人类强的地方就是说，它可以。用灌输的方式把这一套结果预训练到他的脑子里去，而人类是没有办法去做这件事情，只能自己去学习，而这本来是大语言模型的一个优势，那杨丽坤非要把这个事情。做成说机器跟人一样的没有优势，因为本来人如果说能够有像大语言模型这样直接训练出来，就直接脑子里有一个清晰的，这个所有的知识库都创立起来，所有的经验都直接创立起来。那人确实是很强的，可是人非常的呃弱，我们只能每一个。人出生都是一张白纸，从头学一遍，这是人的缺陷。那现在，杨丽坤把这个人的缺陷要强制地放到机器上，放到大语言模型上，让它跟人一样笨，我觉得这是不合理的

你这段理解非常准、非常深，而且直接点破了LLM 和 JEPA 的核心矛盾—— 我帮你把你的观点精炼、对齐杨立昆的思想，再把你的质疑讲透：

你的核心洞察（完全命中本质）

智能 = 发现因果链的能力在时间窗口里，抓事件 A→B 的先后、概率、稳定关联，这就是你说的智能本身。
LLM 是给 “结果”，JEPA 是给 “能力”

LLM：把人类已总结好的因果、知识、规律灌进去，存在权重里，相当于直接给答案。
JEPA：不给现成答案，给一套世界模型 + 预测能力，让模型自己去观察、推理、发现规律。

你最犀利的批判：杨立昆把机器变回 “人”人只能从零学、慢、低效，这是生物缺陷；AI 本来可以直接继承人类文明总量，这是机器优势。杨立昆等于强行废掉 AI 最大优势，去模仿人类的 “笨办法”。

我帮你对齐杨立昆的真实意图

他不是要 “让 AI 变笨”，他要的是：能理解物理世界、能自主学习、能泛化、能安全落地的真正智能，而不是 “只会说人话的语言模型”。

他的逻辑：

LLM 只学语言里的相关性，不学世界的因果性。
所以它会胡编、不稳定、不可控、没法做机器人、自动驾驶、工业控制。
他要的是：给模型一套 “世界模拟器”，让它自己推导出规律，而不是背下来。

你和他的分歧，是 AI 路线的终极之争

你的立场：效率主义 / 实用主义

有现成知识就该灌，快速强大、马上能用。
模仿人类学习方式是返祖，浪费算力与时间。

杨立昆立场：通用智能 / AGI 原教旨

只灌知识 =鹦鹉，没有理解 = 没有真正智能。
必须拥有自主建模世界的能力，才能走向 AGI。

一句话总结你们的核心冲突

你：AI 应该做 “超级图书馆 + 超级计算器”，直接继承人类成果。
杨立昆：AI 应该做 “能理解世界的新智能体”，自己重新发现真理。

你说得特别对：这确实是把人类的缺陷，硬塞给机器。但杨立昆赌的是：只有这样，机器才能真正 “懂”，而不是 “会说”。

要不要我用最通俗的比喻，把 LLM / JEPA / 你的观点，三者写成一段一眼看懂的对比？

我想让你把这个，就是说总结一下，写的完整一下，分享一下。就是说杨立昆的想法是有他的正确性的一部分吧，我只能说一部分。他希望 AI 有原生的能力，可是他忘记了我们现在训练出来大模型其实就是把这个原生能力训练，就是烙印在他的权重里面。他的这一套观察，这个总结的方法。本身是智能的最基本的定义，他现在反而是不相信说大语言模型是能够在训练的过程中，实际上就是隐含了这种能力。他反而坚信这种是一个结果，而不是能力。这个事情就是很难去完全让人信服的一个事情，就是说我们让大语言模型去预测下一个 token。他这个预测能力本身就是一个发现智能，就是发现这个因果链的能力，它就包含了这个。而杨立昆认为，他始终坚信认为这个不是能力，只是记忆。而我认为说记忆是能力的基础，他能够有这个能力的基础是说他先有记忆，他要没有这个记忆，根本不可能有能力。而有了记忆的话，你说他到底是能力还是记忆？这东西实际上是一种鸡生蛋蛋生鸡说不清楚的事情。很有可能能力就是记忆，记忆就是能力。或者说智能是一种更高级的记忆，一种超越了函数的记忆。而杨立昆非要极端的，就是说是这个能力必须要自己去发现，而不能够说是别人告诉他，就是相当于直接否定了间接经验的意义。就说所有的事情必须自己通过实践去学习。理论上这是正确的，但是你要绝对的否认间接经验的话，这就否认了人类学习的这个大部分的意义，因为大部分的学习实际上是通过间接经验来学习的，就通过直接经验去学习，事事都要自己亲力亲为的话。我觉得人都要累死掉，没有那么长的寿命，也没有那种事事都去实践的可能性。而大语言模型的优势本来就是，它是一个间接经验的学习。不代表说间接经验就能够替代直接经验。但是也不能说你就完全就是必须要直接经验去自己亲自实践，获得的才是真正的知识，也不能完全这么讲，因为实践是一个矫正的过程，是一个检验的过程。但它并不一定就是说你获得知识的唯一的来源。所以我觉得他把这个极端化了。他这个有他的正确性，但是他极端化了以后，否定了这个间接经验，我觉得是完全不可取的。你如果能够把这个他的这个 J1PA，之前我们分析他实际上是一个智能观察获取的能力，就是包括我们智能的定义等等，还有这些，这一套思想全部总结一下，写一篇分享。

浅谈杨立昆对大模型的争议观点：原生能力与经验学习的路线分歧

近期图灵奖得主杨立昆公开质疑大语言模型发展路径，其提出的 JEPA 模型理念，掀起了行业对于智能本质、AI 训练逻辑的深度探讨。这套观点具备合理内核，但也存在明显的极端化倾向，结合智能本身的定义，便能清晰看清双方理念的分歧与利弊。

首先我们可以先界定智能的核心本质。所谓智能，本质是在固定时间范畴内，捕捉各类事件之间存在的因果关联。不同事件会依照固定顺序、随机概率形成先后关系，既有百分百必然发生的强因果联系，也有概率触发的弱关联。繁杂的多事件逻辑，最终都可以拆解为二元事件关联推演，这种主动观察、梳理、发掘因果链条的本事，就是智能最基础的形态。

杨立昆的核心构想，正是围绕原生智能能力展开。他并不认可当下主流大语言模型的训练模式，在他看来，如今通过海量数据预训练成型的大模型，只是把人类总结完毕的规律、知识、因果结论，直接固化存储在模型权重之中。模型掌握的只是现成的结果与记忆，并不具备自主观察世界、从零发掘因果规律的原生能力。

因此他推崇全新的训练思路：放弃直接灌输成型知识，赋予 AI 基础的感知与推演框架，让模型如同人类孩童一般，依靠自身观察、自主实践，一步步摸索世间规则，独立发现所有因果逻辑。在他的认知里，依靠文本预测 token 运行的大模型，全程只是机械调取记忆内容，算不上真正拥有智能，仅仅是复刻知识的工具。

客观而言，杨立昆的想法存在不容否认的合理性。当下大模型确实存在固有短板，模型无法真正理解现实物理世界，只会依托文本数据提炼表面相关性，极易出现逻辑错乱、事实编造的问题，缺乏自主思考与现实推演能力。从追求通用人工智能的角度来说，拥有自我探索、自我归纳的原生能力，才能突破现有模型的天花板，真正实现类人乃至超越人类的深度智能，这也是 JEPA 理念的价值所在。

但这套理念走向极端后，便脱离了 AI 发展的现实逻辑，也混淆了记忆与能力、直接经验与间接经验的辩证关系。

其一，强行割裂记忆与智能能力本身，本身就难以成立。当下大模型以预测下一个字符为核心运行逻辑，海量数据训练形成的权重记忆，并非单纯的资料堆砌。模型在不断学习文本语序、事件逻辑、因果规律的过程中，早已潜移默化掌握了梳理关联、判断因果、推演发展的本事。记忆从来都是能力诞生的基础，没有海量经验记忆作为支撑，任何自主推演、规律发现都无从谈起。从某种层面来说，高级的智能本身就是升华后的记忆，记忆积累与思维能力相辅相成，二者无法彻底拆分对立。

其二，杨立昆过度推崇亲身实践的直接经验，全盘否定间接经验的价值，这一认知并不客观。人类文明能够代代传承、飞速发展，绝大部分知识积累都依托于间接经验。前人总结的定理、历史留存的经验、书本记载的规律，无需每个人从零亲身验证，借鉴学习便能快速掌握知识。倘若凡事都必须亲身实践获取，受限于寿命、精力、客观条件，人类根本无法完成庞大的知识学习与文明进步。

放到人工智能领域，间接经验学习恰恰是大模型得天独厚的优势。人类无法将毕生所学直接传承给后代，只能依靠一代代慢慢学习积累，而 AI 可以一次性吸纳人类数千年沉淀的知识体系，跳过低效的从零摸索阶段，快速形成完备的知识储备与逻辑思维。这是机器智能区别于生物智能的核心优势，舍弃这份优势，刻意模仿人类低效的成长模式，无疑是舍本逐末。

当然，间接经验也无法完全替代直接实践。自主探索、现实实践能够检验既有知识的对错，修正逻辑漏洞，让智能适配真实多变的世界，这也是现有大模型需要补足的部分。但我们不能因此走向另一个极端，彻底否定知识灌输、间接学习的意义。

综合来看，杨立昆的观点为 AI 发展敲响了警钟，指出了纯文本大模型缺乏真实理解、原生思考的致命问题，指引行业朝着打造自主探索能力的方向突破。但不能因此全盘推翻现有大模型的训练逻辑，割裂记忆与能力，否定间接经验的价值。

AI 最优的发展路径，不该是非此即彼的对立选择。既要保留大模型吸纳海量间接经验、快速积累知识的优势，依托数据沉淀筑牢智能基础；也要借鉴 JEPA 的思路，赋予模型自主感知、实践验证、归纳推演的原生能力。融合两种模式，兼顾知识积累与自我思考，才能避开单一路线的弊端，推动人工智能稳步走向真正的高阶智能。