当AI开始解决数学家的“私房难题”
【当AI开始解决数学家的“私房难题”】OpenAI声称其内部模型在“First Proof”挑战中解决了十道前沿数学问题中的六道。这个挑战的设计颇为精妙:11位数学家贡献了各自研究中遇到的真实问题,答案已加密封存,全球有一周时间用AI尝试求解。
这些题目涵盖代数组合、谱图论、辛几何、随机分析等领域,每道证明约五页篇幅。它们不是改变世界的大定理,而是数学家日常研究中的“引理”,那些通往重大成果路上必须跨越的小山丘。
有意思的是OpenAI的措辞。他们强调这是“用一周时间做的副项目”,方法论“还有很大改进空间”。这种表述既是谦虚,也是精心设计的退路。如果结果被证伪,他们可以说“本来就没太认真”;如果正确,那就是“随便搞搞就这么强”。
社区的讨论揭示了一个更深层的问题:只有成功的实验室才会公布结果。如果DeepSeek或xAI也参与了但失败了,我们永远不会知道。这种幸存者偏差让我们很难准确评估AI的真实水平。
但反过来想,OpenAI敢在结果揭晓前公开宣称,说明他们相当有把握。毕竟这是他们最前沿的内部模型,如果被打脸,意味着他们手里没有更好的牌了。
一位数学家此前预测能解出的题目数量远低于六道。如果OpenAI的结果属实,这确实超出预期。
真正值得关注的不是AI能否一次性独立解题,而是它作为协作者的潜力。即便需要人类指出“请完善引理3的严谨性”,即便需要专家润色最终证明,这种人机协作模式本身就是巨大进步。
数学证明可能是人类最高强度的智力活动。当AI开始在这个领域展现实用价值,它对其他领域的影响只是时间问题。
reddit.com/r/singularity/comments/1r4akax/openai_says_internal_model_may_have_solved_6
页:
[1]