一位开发者花1000美元让AI连轴转48小时,最后发现它只会把事情搞砸

【一位开发者花1000美元让AI连轴转48小时,最后发现它只会把事情搞砸】


快速导读:一位开发者尝试让AI Agent 7x24不间断地开发一个全新项目,结果在烧掉近1000美元后宣告惨败。AI不仅没能理解新概念,反而陷入了荒诞的逻辑死循环——比如,它花了半天时间试图去`console.log`一个类似量子叠加态的、根本无法被打印的东西。这个实验生动地揭示了当前AI在面对真正“新问题”时的根本局限。

---

开发者Victor Taelin启动了一个很多人梦寐以求的实验:让AI Agent全天候不间断地工作,试图在一些真正前沿的项目上取得突破。两天后,实验被他亲手叫停。结论很残酷:烧了将近1000美元,换来一堆复杂到爆炸的代码和停滞不前的结果。AI的自主编程梦,至少在今天,行不通。

人们对AI Agent的期待是,它能像一个不知疲倦的程序员一样,自主解决问题。但Taelin发现,当AI面对其训练数据中从未见过的新范式时,它会立刻“失心疯”。它能轻松复制那些已经被人类建造成熟的东西,但无法创造任何真正的新事物。更要命的是,代码的复杂性在AI手中只会失控暴增。

这次实验最荒诞的一幕,发生在一个名为“SupGen”的项目上。这个项目的记忆状态是数千个候选程序的“叠加态”,有点像量子计算,你无法用传统方式去观察。而AI,在连续失败了数十次之后,陷入了某种偏执。它花了整整半天,尝试了18轮,坚持要用`console.log`的方式把这个“叠加态”打印出来进行调试。

这就像一个医生坚持要用听诊器去听一块硬盘的“心跳”,一种基于错误世界模型的无效努力。即便人类明确告诉它“此路不通”,它依然会固执地在错误的道路上狂奔。甚至连监控这个AI Agent的另一个AI——Claude,都看不下去了,发出了警告:“它已经连续三轮在构建观测工具,而不是去解决根本问题,这很令人担忧。”

很多程序员看完这个实验后,反而松了一口气。一位评论者说得好:“我自己写代码时,我其实在同时做两件事:构建代码库,以及构建我自己对代码库的理解。当AI替我写完,我只得到了一个逻辑黑箱,而半夜三点被叫醒的还是我。”

Taelin的结论是,人类编码有一个被低估的优势——在构建的同时完成学习。AI只做了前半部分,而后半部分,它显然还没学会。

---

简评:

这篇帖子之所以引起巨大共鸣,因为它不是一篇关于AI的理论探讨,而是一份来自真实战场、带着1000美元硝烟味的实验报告。它用一个极其生动且荒诞的`console.log`案例,给当前狂热的“AI自主编程”叙事泼了一盆冷水。它没有否定AI的价值,而是精准地指出了它的边界:AI是加速器,不是飞行员。至少现在,驾驶舱里还得是个人。

---

ref: x.com/VictorTaelin/status/2027214947193679932


分类