这个模型是专门用来面向 OpenClaw 这种 Agent 的场景深度优化的。
输出速度非常快。它的提示遵循和工具链调用很稳定,在前端的表现上也不错。
据他们自己说,这个模型在以下核心能力上都变得非常强,并做了专项的迭代:工具调用、指令遵循、定时和持续任务、长程执行能力。具体比如说:
1. Tool Calling:强化了调用 Web 工具和 Skills 的能力
2. 复杂指令拆解能力更强
3. 定时任务和长时间的任务不中断(这个很重要)
4. 长链路高吞吐:即数据量大、链条长的任务,执行稳定性更强
我自己试了一下,做了几个任务,发现它的输出速度相当快,应该是同级别模型里面最快的。
同时我自己有个 AI 助理,需要加载非常多的上下文,因为涉及到我的日程、各种项目的完成情况,还有我好几个 memory 文档。
其实跟龙虾(Openclaw)的场景也差不多了,它很快就读到了所有相关的信息,而且没有错误,返回信息也巨快。
然后,第二个为什么说它前端强,是因为我之前不是自己做了一个 Claude 的生成式 UI 能力吗?那个其实非常考验模型对多模态前端位置的判断,以及画图时(尤其是 SVG 画图)的准确性。
还有就是这个东西具体应该用什么样的 UI 去表示,其实也非常重要。因为这类型用户通常不会告诉你用什么方式或图表去展示,你需要自己选一个合适的图表。
我先是让它生成了一个我这周的日程(通过读取我的记忆来生成)。我发现它生成的表现形式非常好:
1. 两周分的很清楚
2. 每一天都用条形图的方式去表示,让你能大概知道任务分配在哪个时间段
第二个是又试了一下让它解释大语言模型的训练过程。虽然整个画得很复杂,但所有的地方都很规整,没有出现错位的情况,这个即使是 Claude Sonnet 有时候都会出错。当然,另外它画得也很快。
他们现在还为这个模型去做了一个新的龙虾套餐,价格相当实惠。
我本来自己买了一个小的试了一下,但是看这个东西这么强,换成了那个高套餐。
而且我感觉如果你不是写代码,只是用来处理一些日常工作的话,这个东西非常合适。#how i ai#