#模型时代# 菲尔兹奖、诺贝尔奖、图灵奖得主同台：AI正在怎样改变科学？

卐言出法随卐 · 发表于昨天 20:40

#模型时代# 菲尔兹奖、诺贝尔奖、图灵奖得主同台：AI正在怎样改变科学？

2026年2月10日，UCLA的数学科学研究所IPAM举办了一场学术聚会。菲尔兹奖得主陶哲轩、诺贝尔物理学奖得主Barry Barish、图灵奖得主、强化学习之父Richard Sutton，与来自OpenAI、微软研究院、NVIDIA、AWS的技术负责人，以及宾大、布朗、USC等学者同台，花了整整一天讨论AI For Science：也就是AI究竟在以什么方式改变科学？

这个话题可能和咱们普通人关系不大，但是和AI产业紧密关联。可以说，过去一两年多，全球最大AI公司的掌门人谈起AGI，必谈到AI4S。哈萨比斯这在印度AI峰会还提出一个爱因斯坦测试，如果把AI的训练数据卡在1911年，如果模型能推导出相对论，那就是AGI了。

一天会议的篇幅，我能浓缩到5000字，也是一种科学吧……我个人最喜欢结尾USC院长Yortsos的三层框架和催化剂类比，在最后一段。

一、数学：AI渗透最快的学科，因为有一把"作弊级"安全网

数学能大胆拥抱AI，核心原因就一个：形式化验证（formal verification）。用一种叫Lean的编程语言把证明写出来，计算机自动检查每一步是否正确，编译通过就是通过，不管证明是人写的还是AI生的。

但要理解这为什么是革命性的，得先看陶哲轩铺的背景。他展示了一页1825年柯西的复分析论文，除了用法语写、不是LaTeX排版，内容和今天的教材几乎一模一样。两百年了，数学家还在用黑板推导，还在一两个人一组磨几个月。物理学和化学的论文合著者数量早就膨胀了，数学还卡在小作坊模式。原因不是数学家不合群，而是有结构性障碍：数学对证明正确性的要求极高，一个十人团队里只要有一个人的论证不可靠，要么所有人互相验证（极其耗时），要么整个协作崩盘。"我们无法在Zoom上解决数学问题。"

形式化验证打破了这个瓶颈。过去把一个自然语言写成的证明翻译成Lean代码需要几周，现在AI辅助下压缩到几小时。这意味着你不需要信任贡献者，只需要信任编译器。不管证明来自顶级数学家、AI、还是高中生，编译通过就是通过。

1、形式化速度在指数级飙升

宾大的Damek Davis做了一个持续两年的追踪实验。2023年11月，他让GPT-4把一个优化理论基础证明（梯度下降收敛性）形式化为Lean代码，完全失败。此后每隔几个月试最新模型，O3、Gemini 2.5 Pro、Claude Code全不行。到2026年2月，他把同一问题交给Aristotle（GPT-5.2 Pro驱动的形式化工具），15分钟生成200行Lean代码，完整通过。两年时间，从"完全做不到"到"15分钟搞定"。

2、AI正在大规模扫清数学"长尾"问题

陶哲轩用Erdős问题做案例。Paul Erdős留下约1000个未解问题，从2025年9月追踪以来，AI工具已帮助解决或推进了约100个。典型协作模式：一个人类在论坛上提出构造但缺关键步骤，陶哲轩把缺的那步丢给Gemini，十分钟得到证明，另一个人用AI工具转成Lean代码自动验证。三个人、两个AI工具、一天关闭一个公开问题。

3、AI做语义搜索的威力被严重低估

Davis讲了一个故事：一位同事的学习理论问题问遍了领域内顶级专家，没人知道答案。ChatGPT的agent模式推荐了五篇论文，其中一篇完全不相关主题的论文附录里藏着答案，用的是完全不同的关键词。人类专家被学科壁垒和关键词差异挡住了，AI直接穿透了。

4、但AI对最顶尖的难题还无能为力

陶哲轩强调，目前AI能处理的是中等难度的"棉花糖"，那些真正深刻的"硬核桃"还推不动。原因后面Sutton给出了解释。

5、数学工具在AI时代反而更重要了，不是更不重要

UCLA的Bertozzi做DNA适配体（aptamer，一种能像抗体一样精确结合靶标的短链核酸分子）设计，她用组合数学中的Motzkin路径把DNA折叠形状转化为特征向量再做机器学习，发现了传统实验方法漏掉的优质候选分子。她在一个生物知识图谱项目中找到了10的18次方个精确子图匹配，面对这种天文数字级的复杂性，她的态度是："组合复杂性应该正面进攻，而不是转身就走。" 数学能推导出组合公式，让10的100次方级别的解空间变得可计算。

同样在UCLA的Schaeffer展示了用Transformer做通用PDE（偏微分方程）求解器：给模型一个从未见过的流体系统的10帧快照，不告诉它方程是什么，让它预测后续演化，误差仅5%。他还在做从数据中自动发现物理定律的工作，最新版本不只输出方程，还能用自然语言解释系统行为，比如"这个系统会进入混沌态"。

6、即使是研究AI的数学家，真正用AI工具的人也很少

Davis提到一个扎心的观察：在研究AI理论的数学家群体中，直到2025年3月Gemini 2.5 Pro发布后，日常使用AI工具的人才开始增多。很多人对新技术缺乏耐心，"他们期望它立刻比现有工具好"。他给同事展示自己写的详细prompt，对方惊讶于需要写那么长的指令。"上手曲线很陡，但正在快速变平。"

二、物理学：和AI基本上是"过敏反应"

诺贝尔奖得主Barish先做了一个铺垫：激光源于爱因斯坦的理论，MRI源于核物理发现，上个世纪最重要的技术进步几乎都始于最基础的物理研究。然后话锋一转："AI在物理学里的进展远比你想象的慢。我们到处在用它，但我不认为它在真正推动科学前沿。"

1、核心矛盾：物理学要统计显著性，AI给不了

发现希格斯玻色子用的是5 sigma标准，随机误判概率不超过350万分之一。神经网络是黑箱，能说"很可能"，但没法输出精确的统计置信度。"物理学和AI基本上是过敏反应"，这是Barish原话。

2、但间接作用已经很明显：AI当加速器，不当裁判

LIGO的测量精度达到10的负21次方，换算成四公里长的干涉臂，相当于探测到比原子核还小一万倍的位移。传统做法是根据爱因斯坦方程预算约25万种可能的双天体合并波形，逐一与实际数据比对，耗时数小时。AI用卷积神经网络做快速匹配，把这个时间缩短到几分钟。

为什么几分钟很重要？因为多信使天文学（同时用引力波、电磁波、中微子观测同一事件）的窗口极短。2017年双中子星合并事件中，LIGO探测到引力波后仅1.5秒卫星就捕获了伽马射线暴。这两个信号来自1.5亿光年之外，1.5乘以10的15次方秒的旅程中时间差仅约一秒，直接证明了光和引力波以相同速度传播。

更令人震撼的后续是：全球天文台在全波段追踪这个事件，发现一次合并产生了约100个地球质量的黄金。这解决了困扰地质学几十年的问题：比铁重的元素到底从哪来？答案可能不是超新星，而是中子星合并。快速判断能力直接决定了这些后续观测是否来得及启动。 AI在这里的角色不是做发现，是确保人类不错过发现的窗口。

3、真正的物理突破靠新探测器，不靠更好的算法

所以，AI在LIGO的角色是"增量式改进"。探测宇宙大爆炸极早期引力波，需要的是2035年发射的LISA（三颗卫星组成、臂长250万公里的空间探测器），不是更好的数据分析。

三、强化学习之父的逆向判断：当前AI实际上很弱

Richard Sutton的演讲我之前讲过了，这里简单带过。

1、他先用三个定义锚定了"智能"到底是什么。

心理学创始人威廉·詹姆斯1890年的说法："心智的标志是通过多变的手段达成不变的目标。"AI创始人约翰·麦卡锡的定义："智能是达成目标的能力的计算部分。"Sutton自己的版本："通过适应行为来达成目标的能力。"关键词是适应，即学习的能力，而不仅仅是拥有知识。有了这个锚定，他对当前AI的批评就变得很尖锐了。

2、"人类数据时代"的原理天花板

当前所有主流模型都在人类产生的数据上训练，训练完就冻结了，不再学习。"这个方法的原理限制是它不能学到任何真正新的东西。"它能总结已有知识，但不能生成全新知识。这就是为什么AI在最难的数学问题上推不动。

3、下一个时代是"经验时代"

从交互中学习，从环境反馈中学习。强化学习就是核心技术：智能体行动、观察结果、获得奖励、调整行为。AlphaGo 2016年对李世乭下出"第37手"，一步人类棋手从未考虑过的棋，就是这种学习方式的产物。关键区别：经验数据随能力提升而不断增长，永远不会用完。

4、Sutton的宇宙史框架：我们正处于第四个时代的门槛

他把宇宙历史分为四个时代：粒子时代、恒星时代、复制者时代（生物体通过复制繁衍但并不理解自身）、设计者时代（通过心智先构想再创造）。人类的独特角色是"把设计能力推向极致的复制者"，而设计能力的终极形态，就是设计出自身也具有设计能力的存在。"这就是我们正在用AI做的事。"这个框架解释了他为什么对当前AI不满意：我们还卡在"复制者造工具"的阶段，真正的设计者时代需要AI自己能学习、能适应、能创造。

四、产业界已经跑在前面：GPT-5.2两天证了卡十年的定理

OpenAI的Sébastien Bubeck说：

1、一个悬了十年的组合数学问题，GPT-5.2 Pro思考两天后解出来了

结果包含完整的形式化Lean证明。Bubeck说他在过程中发现了"一个奇迹般的恒等式"。

2、Bubeck对科学角色的三分法

技术（造东西）、理解（纯粹想知道为什么）、竞争（比谁先解出来）。AI对技术纯属加分。竞争方面可能"杀死游戏乐趣"。最微妙的是理解：AI给你正确证明，但你读完仍然不知道"为什么是这样"。"我希望AI能迫使科学界重新把理解放回核心。"

3、NVIDIA的Jiao提出了一个关键闭环：AI指导实验，实验反哺AI

他描述的"世界模型"（world model）定位在湿实验室和传统仿真之间：用真实数据训练生成式动态模型，支持"如果我改这个条件会怎样"的干预查询，同时模型知道自己哪里没把握，指导你下一步该做什么真实实验。这个闭环一旦跑通，科学发现速度会根本性加速。

4、微软研究院Poon的诚实：生物医学AI做了十五年，大部分时间进展缓慢

"我是作为NLP研究员被招进来的，但告诉老板想做癌症研究。奇迹般地他没有当场开除我。"十五年的"战斗伤疤"，但现在生物学数据爆发式增长，终于让AI有了用武之地。

5、一个尖锐的争论：AI解出来的问题还该发论文吗？

Bubeck认为很多被AI解决的问题以前就没有发表价值，"解了十个Erdős问题不代表就值得发论文，得看解法本身是否有新意。"Davis从观众席加入反驳，态度更为实际：半自主发现在一年内就会变得常见，"OpenAI在组建全美最强的CS理论团队，有最强的模型加上最强的人，这个趋势不会停。"这个争论指向一个更深的问题：当AI能解题但不能解释"为什么这样解"时，科学社区的评价体系该怎么调整？

五、高等教育正在双重挤压下寻找活路

这个环节情绪最复杂，科学家们不只在讲AI，也在讲生存。

1、2025年UCLA 12亿美元联邦经费一夜冻结

IPAM刚获NSF推荐续拨五年经费，突然变成"我们没有钱了"。SAIR基金会的成立部分就是对这个危机的应急反应。

2、培养一个STEM博士后要花200万美元，而大学的脆弱性远超想象

Apple有5万名科学家和工程师，Meta有4万，仅几家头部科技公司2024年营收接近6800亿美元，而美国全国STEM投资总额约2800亿美元。大学是产业人才基础设施的核心，但这个基础设施正在动摇。

3、布朗大学Rubenstein只有数据科学研究所，没有AI中心

她的布朗数据科学研究所刻意不叫"AI中心"。"我们叫数据科学研究所，因为数据比AI更基础。数据统一了所有学科，连人文学者都有数据。"研究所甚至设立了"技术责任与再想象中心"，让历史学家和伦理学家参与AI反思。"历史学家提出的问题比大多数技术人员更深刻。"

4、宾大宇宙学家Jain：AI正在把超专业化的学科重新拉到一起

Jain用扩散模型（diffusion model）做暗物质地图反演，分辨率比传统方

		自动登录	找回密码
密码			立即注册

#模型时代# 菲尔兹奖、诺贝尔奖、图灵奖得主同台：AI正在怎样改变科学？

相关帖子