快速导读:别再盲目调试AI Agent了。真正的优化突破口,不在于你写了什么提示词,而在于你是否“看见”了它的思考过程。有人仅通过观察内部日志,就一夜之间砍掉了30%的token成本。
---
你是不是也这样调试AI Agent:改改提示词,看看输出,不行,再改改……感觉就像在黑暗中开枪,能不能打中全靠运气。
大多数人下意识地认为,Agent不好用,就是提示词写得烂。于是花大量时间研究提示词工程,把系统提示词堆得越来越复杂。
但真相是,你可能一直在和空气斗智斗勇。
有人用OpenRouter配合LangFuse这类可观测性工具,只是简单看了一眼Agent运行的内部日志(traces),结果发现了惊人的浪费现场:
一个任务里,Agent会傻乎乎地把同一个文件反复读4-5遍;
执行一个简单的工具调用前,模型会先空转“思考”500个token;
还有研究发现,40%的“卡顿”和“胡言乱语”,根源是工具响应太慢,而不是提示词有问题。
一个开发者正是看到了这些,才一夜之间把token成本砍掉了30%。
这揭示了一个正在变化的现实:AI开发的核心技能,正在从“提示词魔法师”,转向“AI认知侦探”。痴迷于调整那几句自然语言,可能正在让你错过系统中真正重要的问题。
---
简评:
从“炼丹”到“手术”,AI开发终于开始进入可观测、可诊断的工程化阶段了。这篇文章就像一盆冷水,浇醒了那些还在“大力出奇迹”的提示词崇拜者。真正值钱的,永远是看到别人看不到的问题。
---
ref: x.com/nearlydaniel/status/2028567851108552862
##