查看: 1|回复: 0

世界模型不会取代LLM,它是LLM缺失的那一层

[复制链接]

9

主题

1

回帖

29

积分

新手上路

积分
29
发表于 昨天 10:15 | 显示全部楼层 |阅读模式
【世界模型不会取代LLM,它是LLM缺失的那一层】


快速阅读: 世界模型正从学术概念走向主流讨论,但“取代LLM”是个假命题。更准确的描述是:LLM处理语言和推理,世界模型负责物理仿真和因果接地,两者将形成分层协作的架构。目前的应用重心集中在机器人领域,非物理领域的潜力仍被严重低估。

---

在Nvidia的GTC大会上,世界模型(world model)突然成了每个严肃对话的收尾词。这种感觉像2021年所有人突然“懂了”transformer的那个时刻。

世界模型不预测下一个词。它在内部构建一个关于世界如何运转的表示,能模拟环境、向前规划、推演因果链条。这和LLM做的事情在结构上不是同一回事——LLM理解的是语言,它“知道”猪不会飞,是因为文本里这么写;世界模型则要直接编码重力、质量、无翼这些约束本身。一个是通过描述世界来理解世界,一个是直接对世界的规律建模。

但说“再见,LLM”是彻底搞错了方向。

有观点认为,两者根本不互斥。更接近现实的架构是:LLM作为语言接口和意图解析层,世界模型作为物理仿真和因果推理层,专用代码处理确定性执行。世界模型填的是LLM一直缺的那个空——当LLM生成一个计划,它没有内部物理引擎来验证这个计划是否在现实中成立。六年前特斯拉的车开进卡车,不是因为模型不聪明,是因为它没有“卡车几乎总是拖着挂车”这种世界级别的先验约束。

目前几乎所有的世界模型应用都流向了机器人、自动驾驶和物理操控。这让人有点不安。商业管理、药物发现、金融决策——这些领域同样需要因果推理,同样需要“如果这样做,接下来会发生什么”的模拟能力。但资源和研究还没怎么往这里走。

Yann LeCun是这个方向最值得追踪的声音。他对JEPA架构的执念和对LLM局限的批判,提供了比大多数会议演讲更诚实的坐标。

有个问题没人认真回答:在药物发现或业务仿真这类高价值非物理场景里,你怎么知道世界模型的因果信念是真实校准过的?机器人领域有sim-to-real gap研究来逼出误差,其他领域的等价检验是什么?LLM的置信度和正确性脱钩这件事,我们花了好几年才学会和它相处。世界模型面临同样的清算,而赌注会更高。

这不是反对世界模型,是说“它理解因果”和“它能生成连贯的因果仿真”是两个不同的声明。第一个没法从外部观测,第二个可以。混淆这两者,是AI每一代新技术都会重蹈的错误。

在这个问题被解决之前,真正有价值的工程工作可能不在模型本身,而在路由层——哪类任务交给LLM,哪类交给世界模型,哪类用确定性代码,怎么在它们之间传递状态。这部分目前几乎没有人在认真做。

ref: www.reddit.com/r/artificial/comm ... xt_big_thing_byebye


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注公众号

相关侵权、举报、投诉及建议等,请发 E-mail:admin@discuz.vip

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|青ICP备2025004122号-1

在本版发帖
关注公众号
返回顶部