大模型正在经历一场从“语言符号”向“连续向量”的范式转移。

空中月 · 发表于 2026-4-6 23:17:08

大模型正在经历一场从“语言符号”向“连续向量”的范式转移。

长期以来，我们习惯于通过显性的 Token（令牌）生成来理解 AI，但越来越多的证据表明，大模型最核心的推理、规划和记忆过程，正逐渐迁移到人类不可直读的连续潜空间（Latent Space）中。

这不仅是技术的演进，更是一场关于智能本质的“静默革命”。

以下是关于潜空间最新综述论文《The Latent Space: Foundation, Evolution, Mechanism, Ability, and Outlook》的深度解读与思考：

1. 从“学说话”到“映射思维结构”
传统的自回归模型是“一字一顿”的思考，受限于语言的冗余、离散化的瓶颈以及序列执行的低效。而潜空间模型则是在更高维、更稠密的内部表示中直接处理概念。正如业内所言：模型并不是在学习说话，而是在学习映射人类思维的结构。

2. 潜空间的四大支柱：架构、表示、计算与优化
潜空间不再仅仅是层与层之间的中间状态，它正在成为一种原生的计算底座。
- 架构与表示：如何构建一个能够承载复杂逻辑的连续空间。
- 计算与优化：在潜空间中进行并行推理，摆脱 Token 长度对推理深度的限制。
这种转变让模型能够跨越语义损失，实现更高效的杠杆效应。

3. 潜空间带来的能力跃迁
当推理发生在潜空间而非文字轨迹中时，AI 的能力谱系得到了全面扩展：
- 推理与规划：支持更长程的逻辑预测，而非简单的概率补全。
- 全模态（Omnimodal）的终局：在潜空间中，文本、图像、音频的界限彻底消失。这解释了为什么原生支持图像输出的语言模型表现如此惊人——因为在底层，它们处理的是同一种“意义的流体”。
- 具身智能与协作：潜空间为多智能体通信提供了更高效的协议，智能体之间可以直接交换“思想向量”，而非低效的语言描述。

4. 深度思考：黑盒是物理定律还是设计选择？
目前主流观点认为潜空间计算对人类是不可透明的，但前沿探索给出了不同答案。潜空间的“不透明性”可能只是一种设计现状，而非物理定律。通过构建空间结构化、多通道的潜存储底座，我们有望在保持连续计算优势的同时，实现双向的人类可读性。这不仅解决了可解释性问题，更消除了离散化的损失。

5. 迈向下一代智能：从 JEPA 到系统级演进
Yann LeCun 提倡的 JEPA 架构正是这一趋势的代表。未来的 AI 系统将不再是简单的文本生成器，而是将模型、存储、数据、硬件和制度视为一个整体系统。潜空间就是这个系统的“原生基底”，它决定了哪些想法能演化为平台，而哪些只会沦为喧嚣的泡沫。

如果你希望理解 AI 如何从研究迈向真实系统，潜空间是那个必须掌握的“杠杆点”。

相关资源：
论文地址：arxiv.org/abs/2604.02029
项目仓库：github.com/YU-deep/Awesome-Latent-Space

大模型正在经历一场从“语言符号”向“连续向量”的范式转移。

本帖子中包含更多资源

浏览过的版块