找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 2|回复: 0

#模型时代# 菲尔兹奖、诺贝尔奖、图灵奖得主同台:AI正在怎样改变科学?

[复制链接]

7

主题

0

回帖

21

积分

新手上路

积分
21
发表于 昨天 20:40 来自手机 | 显示全部楼层 |阅读模式
#模型时代# 菲尔兹奖、诺贝尔奖、图灵奖得主同台:AI正在怎样改变科学?

2026年2月10日,UCLA的数学科学研究所IPAM举办了一场学术聚会。菲尔兹奖得主陶哲轩、诺贝尔物理学奖得主Barry Barish、图灵奖得主、强化学习之父Richard Sutton,与来自OpenAI、微软研究院、NVIDIA、AWS的技术负责人,以及宾大、布朗、USC等学者同台,花了整整一天讨论AI For Science:也就是AI究竟在以什么方式改变科学?

这个话题可能和咱们普通人关系不大,但是和AI产业紧密关联。可以说,过去一两年多,全球最大AI公司的掌门人谈起AGI,必谈到AI4S。哈萨比斯这在印度AI峰会还提出一个爱因斯坦测试,如果把AI的训练数据卡在1911年,如果模型能推导出相对论,那就是AGI了。

一天会议的篇幅,我能浓缩到5000字,也是一种科学吧……我个人最喜欢结尾USC院长Yortsos的三层框架和催化剂类比,在最后一段。

一、数学:AI渗透最快的学科,因为有一把"作弊级"安全网

数学能大胆拥抱AI,核心原因就一个:形式化验证(formal verification)。用一种叫Lean的编程语言把证明写出来,计算机自动检查每一步是否正确,编译通过就是通过,不管证明是人写的还是AI生的。

但要理解这为什么是革命性的,得先看陶哲轩铺的背景。他展示了一页1825年柯西的复分析论文,除了用法语写、不是LaTeX排版,内容和今天的教材几乎一模一样。两百年了,数学家还在用黑板推导,还在一两个人一组磨几个月。物理学和化学的论文合著者数量早就膨胀了,数学还卡在小作坊模式。原因不是数学家不合群,而是有结构性障碍:数学对证明正确性的要求极高,一个十人团队里只要有一个人的论证不可靠,要么所有人互相验证(极其耗时),要么整个协作崩盘。"我们无法在Zoom上解决数学问题。"

形式化验证打破了这个瓶颈。过去把一个自然语言写成的证明翻译成Lean代码需要几周,现在AI辅助下压缩到几小时。这意味着你不需要信任贡献者,只需要信任编译器。 不管证明来自顶级数学家、AI、还是高中生,编译通过就是通过。

1、形式化速度在指数级飙升

宾大的Damek Davis做了一个持续两年的追踪实验。2023年11月,他让GPT-4把一个优化理论基础证明(梯度下降收敛性)形式化为Lean代码,完全失败。此后每隔几个月试最新模型,O3、Gemini 2.5 Pro、Claude Code全不行。到2026年2月,他把同一问题交给Aristotle(GPT-5.2 Pro驱动的形式化工具),15分钟生成200行Lean代码,完整通过。两年时间,从"完全做不到"到"15分钟搞定"。

2、AI正在大规模扫清数学"长尾"问题

陶哲轩用Erdős问题做案例。Paul Erdős留下约1000个未解问题,从2025年9月追踪以来,AI工具已帮助解决或推进了约100个。典型协作模式:一个人类在论坛上提出构造但缺关键步骤,陶哲轩把缺的那步丢给Gemini,十分钟得到证明,另一个人用AI工具转成Lean代码自动验证。三个人、两个AI工具、一天关闭一个公开问题。

3、AI做语义搜索的威力被严重低估

Davis讲了一个故事:一位同事的学习理论问题问遍了领域内顶级专家,没人知道答案。ChatGPT的agent模式推荐了五篇论文,其中一篇完全不相关主题的论文附录里藏着答案,用的是完全不同的关键词。人类专家被学科壁垒和关键词差异挡住了,AI直接穿透了。

4、但AI对最顶尖的难题还无能为力

陶哲轩强调,目前AI能处理的是中等难度的"棉花糖",那些真正深刻的"硬核桃"还推不动。原因后面Sutton给出了解释。

5、数学工具在AI时代反而更重要了,不是更不重要

UCLA的Bertozzi做DNA适配体(aptamer,一种能像抗体一样精确结合靶标的短链核酸分子)设计,她用组合数学中的Motzkin路径把DNA折叠形状转化为特征向量再做机器学习,发现了传统实验方法漏掉的优质候选分子。她在一个生物知识图谱项目中找到了10的18次方个精确子图匹配,面对这种天文数字级的复杂性,她的态度是:"组合复杂性应该正面进攻,而不是转身就走。" 数学能推导出组合公式,让10的100次方级别的解空间变得可计算。

同样在UCLA的Schaeffer展示了用Transformer做通用PDE(偏微分方程)求解器:给模型一个从未见过的流体系统的10帧快照,不告诉它方程是什么,让它预测后续演化,误差仅5%。他还在做从数据中自动发现物理定律的工作,最新版本不只输出方程,还能用自然语言解释系统行为,比如"这个系统会进入混沌态"。

6、即使是研究AI的数学家,真正用AI工具的人也很少

Davis提到一个扎心的观察:在研究AI理论的数学家群体中,直到2025年3月Gemini 2.5 Pro发布后,日常使用AI工具的人才开始增多。很多人对新技术缺乏耐心,"他们期望它立刻比现有工具好"。他给同事展示自己写的详细prompt,对方惊讶于需要写那么长的指令。"上手曲线很陡,但正在快速变平。"

二、物理学:和AI基本上是"过敏反应"

诺贝尔奖得主Barish先做了一个铺垫:激光源于爱因斯坦的理论,MRI源于核物理发现,上个世纪最重要的技术进步几乎都始于最基础的物理研究。然后话锋一转:"AI在物理学里的进展远比你想象的慢。我们到处在用它,但我不认为它在真正推动科学前沿。"

1、核心矛盾:物理学要统计显著性,AI给不了

发现希格斯玻色子用的是5 sigma标准,随机误判概率不超过350万分之一。神经网络是黑箱,能说"很可能",但没法输出精确的统计置信度。"物理学和AI基本上是过敏反应",这是Barish原话。

2、但间接作用已经很明显:AI当加速器,不当裁判

LIGO的测量精度达到10的负21次方,换算成四公里长的干涉臂,相当于探测到比原子核还小一万倍的位移。传统做法是根据爱因斯坦方程预算约25万种可能的双天体合并波形,逐一与实际数据比对,耗时数小时。AI用卷积神经网络做快速匹配,把这个时间缩短到几分钟。

为什么几分钟很重要?因为多信使天文学(同时用引力波、电磁波、中微子观测同一事件)的窗口极短。2017年双中子星合并事件中,LIGO探测到引力波后仅1.5秒卫星就捕获了伽马射线暴。这两个信号来自1.5亿光年之外,1.5乘以10的15次方秒的旅程中时间差仅约一秒,直接证明了光和引力波以相同速度传播。

更令人震撼的后续是:全球天文台在全波段追踪这个事件,发现一次合并产生了约100个地球质量的黄金。这解决了困扰地质学几十年的问题:比铁重的元素到底从哪来?答案可能不是超新星,而是中子星合并。快速判断能力直接决定了这些后续观测是否来得及启动。 AI在这里的角色不是做发现,是确保人类不错过发现的窗口。

3、真正的物理突破靠新探测器,不靠更好的算法

所以,AI在LIGO的角色是"增量式改进"。探测宇宙大爆炸极早期引力波,需要的是2035年发射的LISA(三颗卫星组成、臂长250万公里的空间探测器),不是更好的数据分析。

三、强化学习之父的逆向判断:当前AI实际上很弱

Richard Sutton的演讲我之前讲过了,这里简单带过。

1、他先用三个定义锚定了"智能"到底是什么。

心理学创始人威廉·詹姆斯1890年的说法:"心智的标志是通过多变的手段达成不变的目标。"AI创始人约翰·麦卡锡的定义:"智能是达成目标的能力的计算部分。"Sutton自己的版本:"通过适应行为来达成目标的能力。"关键词是适应,即学习的能力,而不仅仅是拥有知识。有了这个锚定,他对当前AI的批评就变得很尖锐了。

2、"人类数据时代"的原理天花板

当前所有主流模型都在人类产生的数据上训练,训练完就冻结了,不再学习。"这个方法的原理限制是它不能学到任何真正新的东西。"它能总结已有知识,但不能生成全新知识。这就是为什么AI在最难的数学问题上推不动。

3、下一个时代是"经验时代"

从交互中学习,从环境反馈中学习。强化学习就是核心技术:智能体行动、观察结果、获得奖励、调整行为。AlphaGo 2016年对李世乭下出"第37手",一步人类棋手从未考虑过的棋,就是这种学习方式的产物。关键区别:经验数据随能力提升而不断增长,永远不会用完。

4、Sutton的宇宙史框架:我们正处于第四个时代的门槛

他把宇宙历史分为四个时代:粒子时代、恒星时代、复制者时代(生物体通过复制繁衍但并不理解自身)、设计者时代(通过心智先构想再创造)。人类的独特角色是"把设计能力推向极致的复制者",而设计能力的终极形态,就是设计出自身也具有设计能力的存在。"这就是我们正在用AI做的事。"这个框架解释了他为什么对当前AI不满意:我们还卡在"复制者造工具"的阶段,真正的设计者时代需要AI自己能学习、能适应、能创造。

四、产业界已经跑在前面:GPT-5.2两天证了卡十年的定理

OpenAI的Sébastien Bubeck说:

1、一个悬了十年的组合数学问题,GPT-5.2 Pro思考两天后解出来了

结果包含完整的形式化Lean证明。Bubeck说他在过程中发现了"一个奇迹般的恒等式"。

2、Bubeck对科学角色的三分法

技术(造东西)、理解(纯粹想知道为什么)、竞争(比谁先解出来)。AI对技术纯属加分。竞争方面可能"杀死游戏乐趣"。最微妙的是理解:AI给你正确证明,但你读完仍然不知道"为什么是这样"。"我希望AI能迫使科学界重新把理解放回核心。"

3、NVIDIA的Jiao提出了一个关键闭环:AI指导实验,实验反哺AI

他描述的"世界模型"(world model)定位在湿实验室和传统仿真之间:用真实数据训练生成式动态模型,支持"如果我改这个条件会怎样"的干预查询,同时模型知道自己哪里没把握,指导你下一步该做什么真实实验。这个闭环一旦跑通,科学发现速度会根本性加速。

4、微软研究院Poon的诚实:生物医学AI做了十五年,大部分时间进展缓慢

"我是作为NLP研究员被招进来的,但告诉老板想做癌症研究。奇迹般地他没有当场开除我。"十五年的"战斗伤疤",但现在生物学数据爆发式增长,终于让AI有了用武之地。

5、一个尖锐的争论:AI解出来的问题还该发论文吗?

Bubeck认为很多被AI解决的问题以前就没有发表价值,"解了十个Erdős问题不代表就值得发论文,得看解法本身是否有新意。"Davis从观众席加入反驳,态度更为实际:半自主发现在一年内就会变得常见,"OpenAI在组建全美最强的CS理论团队,有最强的模型加上最强的人,这个趋势不会停。"这个争论指向一个更深的问题:当AI能解题但不能解释"为什么这样解"时,科学社区的评价体系该怎么调整?

五、高等教育正在双重挤压下寻找活路

这个环节情绪最复杂,科学家们不只在讲AI,也在讲生存。

1、2025年UCLA 12亿美元联邦经费一夜冻结

IPAM刚获NSF推荐续拨五年经费,突然变成"我们没有钱了"。SAIR基金会的成立部分就是对这个危机的应急反应。

2、培养一个STEM博士后要花200万美元,而大学的脆弱性远超想象

Apple有5万名科学家和工程师,Meta有4万,仅几家头部科技公司2024年营收接近6800亿美元,而美国全国STEM投资总额约2800亿美元。大学是产业人才基础设施的核心,但这个基础设施正在动摇。

3、布朗大学Rubenstein只有数据科学研究所,没有AI中心

她的布朗数据科学研究所刻意不叫"AI中心"。"我们叫数据科学研究所,因为数据比AI更基础。数据统一了所有学科,连人文学者都有数据。"研究所甚至设立了"技术责任与再想象中心",让历史学家和伦理学家参与AI反思。"历史学家提出的问题比大多数技术人员更深刻。"

4、宾大宇宙学家Jain:AI正在把超专业化的学科重新拉到一起

Jain用扩散模型(diffusion model)做暗物质地图反演,分辨率比传统方
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一起港湾 ( 青ICP备2025004122号-1 )

GMT+8, 2026-2-25 07:37 , Processed in 0.191434 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表