当AI开始解决数学家的“私房难题”

彩香发表于 2026-2-15 09:28:51

当AI开始解决数学家的“私房难题”

【当AI开始解决数学家的“私房难题”】

OpenAI声称其内部模型在“First Proof”挑战中解决了十道前沿数学问题中的六道。这个挑战的设计颇为精妙：11位数学家贡献了各自研究中遇到的真实问题，答案已加密封存，全球有一周时间用AI尝试求解。

这些题目涵盖代数组合、谱图论、辛几何、随机分析等领域，每道证明约五页篇幅。它们不是改变世界的大定理，而是数学家日常研究中的“引理”，那些通往重大成果路上必须跨越的小山丘。

有意思的是OpenAI的措辞。他们强调这是“用一周时间做的副项目”，方法论“还有很大改进空间”。这种表述既是谦虚，也是精心设计的退路。如果结果被证伪，他们可以说“本来就没太认真”；如果正确，那就是“随便搞搞就这么强”。

社区的讨论揭示了一个更深层的问题：只有成功的实验室才会公布结果。如果DeepSeek或xAI也参与了但失败了，我们永远不会知道。这种幸存者偏差让我们很难准确评估AI的真实水平。

但反过来想，OpenAI敢在结果揭晓前公开宣称，说明他们相当有把握。毕竟这是他们最前沿的内部模型，如果被打脸，意味着他们手里没有更好的牌了。

一位数学家此前预测能解出的题目数量远低于六道。如果OpenAI的结果属实，这确实超出预期。

真正值得关注的不是AI能否一次性独立解题，而是它作为协作者的潜力。即便需要人类指出“请完善引理3的严谨性”，即便需要专家润色最终证明，这种人机协作模式本身就是巨大进步。

数学证明可能是人类最高强度的智力活动。当AI开始在这个领域展现实用价值，它对其他领域的影响只是时间问题。

reddit.com/r/singularity/comments/1r4akax/openai_says_internal_model_may_have_solved_6

页: [1]

一起港湾's Archiver

当AI开始解决数学家的“私房难题”