在上周的英伟达 GTC 2025 峰会上,Yann LeCun 与 Bill Dally 的对话引发了广泛讨论。开场不久,LeCun 就直言自己对当下主流的大型语言模型兴趣不再,随即将话题聚焦在如何让 AI 真正理解物理世界、形成持续性记忆,以及在抽象空间中进行推理与规划等更前沿的议题。他的一系列思考与当前行业普遍依赖的语言预测范式形成鲜明对比,也为未来人工智能的发展提供了新的研究方向。以下内容将围绕 LeCun 的核心观点,探讨他正在推进的研究方法及其潜在影响。
在当前生成式 AI 与大型语言模型(LLM)热潮席卷行业之际,Yann LeCun 却旗帜鲜明地将目光从「规模化语言预测」转向了更深层次的研究领域:如何让机器拥有物理世界的理解、持续性的记忆,以及真正能进行推理和规划的能力。他所主张的方向不仅关乎下一代人工智能(Advanced Machine Intelligence)的基础框架,也为行业提供了一个重新思考「智能本质」的锐利视角。本文将基于他在最近讨论中的核心观点,为技术社区的专业人士详细梳理 Yann LeCun 目前正在做的工作,以及他对于未来 AI 演进路径的判断。
聚焦世界模型:超越 LLM 的新动能
Yann LeCun 明确表示,他对当前业内盛行的 LLM 兴趣有所下降,原因在于这类模型主要靠预测离散化的文本 token,虽在对话和文字处理上收效明显,但对物理世界的理解依然浅层。「现实世界并不离散,而是连续且高维」,这是 LeCun 尤为强调的一点。他指出,凡是试图在像素级别重建视频或图像的自监督算法,都在实践中难以取得理想效果,这促使他投身于对「世界模型」(world model)的研究。
在他看来,真正强大的 AI 必须能像人类一样,学会对物理世界进行抽象建模。例如,幼儿在出生后几个月便能通过不断观察,逐渐掌握物体支撑与坠落的直觉物理规律,这意味着 AI 系统也需要类似的「持久记忆」与「自发推理」机制,而不仅是单纯在语言符号里做预测。
JEPA 架构:跳过像素级预测的自监督思路
在实现世界模型的技术路径上,Yann LeCun 提出了名为 JEPA(Joint Embedding Predictive Architecture)的方法论,核心是利用联合嵌入而非传统的像素级重建来训练模型。简单来说,就是将输入(图像、视频、文本等)先编码成高层次的抽象表征,再让模型在这个表征空间里进行预测和对齐,而不是尝试在原始像素或原句子级别精确重建后续内容。
他指出,如果仅仅依靠逐帧重建或对所有可能像素进行概率分布估计,计算量与不确定性都会变得极其庞大,且大部分努力会浪费在对不可预测细节的「臆造」上。与之相对,JEPA 只在高层抽象空间中做预测,从而显著降低资源开销,且能更好地捕捉世界的本质结构。
规划与推理:迈向能「思考」的自学习系统
LeCun 强调,现有 LLM 试图通过生成并筛选大批 token 序列来实现「推理」,但这种方法更像是蒙出正确答案,而非真正进行思维。他借助心理学中的「System 1」与「System 2」概念类比:
• System 1:自动化、经验式执行,像熟练司机开车一样,不用时刻深度思考。
• System 2:面向从未遇到的难题,需要调用内在的世界模型,进行多步想象与推演。
JEPA 之所以重要,就在于它可让系统具备「System 2」般的抽象推理能力,而不会仅停留在语言层面的简单组合。比如,通过在视频数据上进行自监督,JEPA 模型能够学习到「某些行为在物理世界不可行」,从而在遇到新情境时做出更合理的预测或操作。这无异于给 AI 增添了一份「认知」或「直觉」,而不只是文字应答的技巧。
开源生态:从 Galactica 到 Llama 的启示
在谈及如何让 AI 更快落地或「进化」时,LeCun 强调了开源的重要性。他提到,Meta 早在 2022 年就推出了「Galactica」模型,试图应用于科学文献生成,但在公开演示时因用户舆论压力而下线。在此之后,ChatGPT 意外获得了大众空前的追捧,令业界重新审视这类对话式 AI 的社会影响。
然而,在内部实践中,Meta 的另一组小型团队基于开源思路「偷偷」研发出了 Llama。这个项目最初并非公司重点,但后来反而成了真正的主力。Llama 随后演进为 Llama 2 并开放下载,引发了全球开发者的热潮,短短时间下载量就突破十亿。对 LeCun 而言,开源策略不仅能加速技术传播,也为世界各地的企业、研究人员在多语言、多领域场景中进行本地化适配铺平了道路。
硬件与未来:扩展计算规模,拥抱多方协作
在硬件层面,LeCun 直言未来会继续需要「更多、更廉价」的算力,但并不看好短期内的神经形态(neuromorphic)或量子计算。他认为,要让系统真正掌握对物理世界的建模和推理,必须在高层表征上投入大量训练,传统数字芯片依旧是核心解决方案。
展望长远,Yann LeCun 对「AI 将在某一天超出人类控制而引发灾难」的担忧并不认同。他指出,这些突破不会在一夜之间发生,而是持续、小步地迭代。随着各国、各机构不断为模型训练与数据贡献力量,开源、协作将成为主基调。他也相信,最终 AI 会成为人类工作和生活的强大助力,每个人都可能拥有「比自己还聪明」的虚拟助手,而人在其中扮演管理者与决策者的角色。