简单来说,Claude 的工具调用方式从一问一答变成了写代码批量处理。
以前的流程:用户提问 → Claude 调用工具 → 拿到结果 → Claude 再决定下一步 → 再调用工具 → 循环往复
现在的流程:用户提问 → Claude 先写一段代码 → 这段代码自动调用工具、解析结果、根据条件判断下一步操作 → 最终把处理好的结果交给 Claude
核心变化是:Claude 不再每次调用工具后都要"回来想一想",而是提前用代码把各种可能的情况都规划好,一次性执行完。
实际效果有多好? 以网页搜索为例,Sonnet 4.6 在 BrowseComp 基准测试上准确率提升了 13%,同时输入 token 减少了 32%,又快又准。
以前 AI Agent 每一步都要请示大模型做决定,现在 Claude 可以预先把成百上千种决策路径写进代码里,一次性跑完。
这相当于把原来需要多轮 LLM 调用的循环压缩成了一次代码执行,效率提升的潜力非常大。
除了搜索之外,代码执行、网页抓取、记忆、程序化工具调用等功能也同步正式上线了。