找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 6|回复: 0

#AI科普# World Labs 最近推出了一个叫 Marble 的平台,它究竟是什么?

[复制链接]

7

主题

0

回帖

31

积分

新手上路

积分
31
发表于 昨天 21:32 来自手机 | 显示全部楼层 |阅读模式
#AI科普# World Labs 最近推出了一个叫 Marble 的平台,它究竟是什么?

在这期视频中,AI 科普达人 New Machina 将用最通俗易懂的方式介绍这个世界模型领域中的重要平台。

Marble 能够通过用户输入的一段文字描述、上传的一张照片、一段视频,生成一个完整的三维环境,让你能够像玩第一人称视角游戏那样,在里面漫游。而整个生成过程大概需要 5 到 10 分钟。

比如你输入 "工业风阁楼客厅,红砖墙,高天花板,大金属窗,旧皮沙发,混凝土地板,柔和灯光",它就会给你生成对应的 3D 场景。

World Labs 的 CEO 是李飞飞,她在计算机视觉领域的资历相当深,主导了 ImageNet 项目,这个数据集对深度学习的发展影响很大,所以她在圈子里有 "AI 教母" 的称号。

Marble 背后的核心概念叫 "空间智能"。简单说,现在大家熟悉的大语言模型,本质上就是根据用户输入的一段你文字预测下一个词。而 Marble 做的就是根据一幅画面、一段视频预测下一帧的空间结构和物理属性。从 "预测词" 变成 "预测世界"。

这件事为什么值得关注?因为很多现实场景里,光靠语言理解是不够的。城市规划、室内设计、建筑施工、景观设计,这些领域都需要对空间有直觉性的感知。如果 AI 能真正理解三维空间,不只是生成一张好看的图,而是构建一个有几何关系、有物理逻辑的可交互环境,那它能帮上忙的地方就多多了。机器人导航、自动驾驶,都需要它的帮助。

当然,Marble 现在还处于早期阶段,问题不少。用户反映生成的画面有时会出现扭曲或 "幻觉",分辨率也不如宣传材料里展示的那么清晰。这很正常,第一版能做到这个程度,行业内的反应普遍还是正面的。

李飞飞计划在后续版本里进一步完善,目前也没有公开的技术架构文档,所以 Marble 内部怎么实现的,外界还不太清楚。但"从语言模型走向世界模型"这个思路,应该是接下来几年 AI 发展的一个重要方向,值得持续关注。

# http://t.cn/AXtm8UaM
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一起港湾 ( 青ICP备2025004122号-1 )

GMT+8, 2026-2-21 07:12 , Processed in 0.096329 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表