1 到 5 个智能体
作者:Onur Solmaz
日期:2026年3月11日
作为一名软件开发人员,我的日常工作流在过去一年半里发生了彻底的变化。
以前,我必须连续数小时专注于单一任务,一次只做一个。而现在,我随时都在并行调度 1 到 5 个 AI 智能体(Agents)。我不仅是一名开发者,更成了智能体的“工程经理”。
如果你是一名尚未以这种方式使用 AI 智能体的知识工作者,那么我正生活在你的未来,并从那里为你带来了消息。
你职业生涯的剩余大部分时间都将在聊天界面上度过。
有人曾说:“AI 的未来不是聊天机器人,一定有更高级的形式。”
尽管人们渴望复杂性,但越来越多的迹象表明,所有的工作都在向聊天机器人汇聚。作为开发者,我只需在 Codex 或 Claude Code 的输入框中输入文字,就能触发需要消耗数小时 GPU 推理时间的任务;当我回到电脑前,会发现一个大多还行、偶尔很差、有时甚至惊艳的结果。
所以我很遗憾(或者说很荣幸?)地告诉大家:未来就是“聊天”。直到你职业生涯结束,它都将以某种聊天形式存在。平均而言,你将同时与 1 到 5 个 AI 智能体进行对话。这个数字可能会根据领域和工作性质有所增减,但根据我对自身、同事以及互联网用户的观察,“1 到 5”将是普通工作者处理日常事务的神奇基数。
原因显而易见:注意力。人的注意力只能分散到一定程度,超过这个限度就会失去控制并开始产生“废料”(slop)。因此,核心的知识工作技能将转变为如何分配注意力——何时深入钻研,何时放手让它自己运行,何时旁听并意识到某些地方逻辑不通,等等。
作为这类智能体的开发者,我想对这些系统的技术运作方式做一些预测。
智能体将按需创建,任务完成后即销毁。
简而言之:按需创建、用完即弃的智能体。每个智能体会话都将获得自己的虚拟机(或容器、Kubernetes Pod),其中托管着该智能体所需的文件和连接。
智能体将拥有多种持久化机制。
根据你想要保留的内容(例如 Markdown 形式的记忆、智能体自身的技能或权重变化,或者是任务本身产生的工作成果变化),智能体将使用版本控制系统(包括但不限于 git)以及各种自动文件同步协议。
谈到文件:智能体将像你一样处理文件。
而且,智能体将使用计算机和操作系统,大多是 Linux 或类似的 Unix 后裔。
就像所有 Linux 和云端事物一样:
为一家公司搭建智能体基础设施,会比配置一台 Mac 电脑复杂得多。这并不是说 DevOps 或基础设施本身很难——不,我们会用智能体来优化这些体验。
复杂的地方在于,需要有精通整套架构的人员在场(无论是内部还是外部 IT 支持),与管理层合作,设定智能体可以访问和禁止访问的数据。至少在不久的将来是这样。我从与使用 SharePoint 和商业版 OneDrive 的客户合作的个人经验中深知这一点。这方面将创造大量就业机会。
说到这里,也有人说:“OpenClaw(译注:此处指代某种智能体框架)就像 Linux,我们需要一个 Mac 版”,这完全有道理。OpenClaw 默认安装“yolo 模式”(译注:指跳过确认的激进模式),且像 Linux 一样故意设计得难以安装。这是为了防止那些不清楚自己在做什么的人安装它,从而避免隐私数据外泄。
这种个人智能体领域的“专有版 Mac 或 Windows”将会存在。但企业会使用它吗?它能赚到微软那样的大钱吗?
看着 90 年代的微软 Windows 和 Office 授权,以及现在的 M365 SaaS 服务,人们可能会认为企业智能体确实会运行在专有的、“围墙花园”式的软件上。但在这样想的时候,可能会忽略一个关键观察:
从经济学角度看,智能体(至少是用于软件开发的智能体)更接近于“云”,而不是“个人电脑(PC)”。
如果你一次只操作一个智能体,可能很难察觉到这一点。但如果你想象一下不久的未来,公司将拥有类似于“AI 版 MapReduce”的并行工作负载,且运行时间并不固定,你就能理解了。
在不久的将来,本地硬件将无法支撑大多数并行工作负载。有时,需求会超过每名员工 1 到 5 个智能体的水平;有时,智能体数量需要根据需求瞬间扩张 1000 倍。因此,公司将从数据中心购买算力。计算中最核心的部分——LLM 推理——已经在 OpenAI、Anthropic、AWS、GCP、Azure、阿里巴巴等数据中心运行了。所以我们已经走完了一半的路程。
这暗示了一个反直觉的结果。
长期以来,大多数人习惯在家里和公司使用相同的操作系统:Microsoft Windows。个人电脑和办公电脑必须拥有相同的界面,因为大多数人都有自己的生活,不想学习如何使用两套独立的操作系统。
那么,当界面简化为一个聊天机器人——一个可以跨越本地操作系统、代你驱动电脑的 AI 时,会发生什么呢?对我来说,这意味着:
将不会再有一家公司能像当年的微软(凭借 Windows)那样,同时垄断个人和企业智能体市场。
因此,虽然专有的“Mac 版 OpenClaw”可能会占领非技术大众的个人智能体市场,但企业级智能体将像企业云一样,运行在开源智能体框架上。
我甚至怀疑这种“Mac 版 OpenClaw”未来是否会以完全专有的方式存在。很多人希望与亲友的私密对话能有端到端加密,而个人智能体的信息敏感度有过之而无不及。
所以我们可以肯定,运行在本地 GPU 上的个人智能体市场将会存在。至于这个市场是被“Linux 桌面版 2.0”占领,还是由苹果或类苹果公司把持,目前尚不明朗。
此外,本地硬件是否能同时支持多个高质量模型的推理也尚不确定。人们在工作中将被迫并行化工作负载,但“1 到 5 个智能体”的模式是否会反映到他们的个人智能体使用中,我认为取决于个人。换做是我,我会用本地硬件来做,毕竟我是一名开发者……