它可能是继大模型之后,改变我们与互联网交互方式的下一个关键技术。
什么是 WebMCP?
简单来说,它是 Anthropic 提出的 MCP (Model Context Protocol) 协议在浏览器端的原生实现。目前正在作为 W3C 标准推进。
它可以让网页(Web App)直接向浏览器里的 AI Agent 主动“暴露”出可用的功能接口。
过去的问题:AI 操作网页的困境
在此之前,AI Agent 想要操作网页,主要靠视觉识别(看截图)或解析杂乱的 DOM 结构。
这种方式非常脆弱:网页稍微改个版,按钮换个位置或颜色,AI 就找不到了,任务直接失败。而且视觉分析非常消耗算力和时间。
WebMCP 的原理:从“猜”到“说”
WebMCP 的核心是让网页变成一个标准化的服务端。
开发者使用新的浏览器 API (navigator.modelContext) 注册工具,并通过结构化的 JSON Schema 建立一套严谨的“契约”。
当需要执行任务时,AI 不再去分析复杂的界面布局,而是直接发起代码级的函数调用,网页在后台迅速执行并返回结果。
WebMCP 带来的改变
1. 极高的稳定性:无论 UI 界面如何改版,只要底层的逻辑函数不变,AI 的操作就能 100% 准确执行。
2. 可控的安全性:开发者可以精确控制暴露给 AI 哪些功能(例如暴露查询接口,但不暴露敏感操作),防止越权。
3. 真正的人机协作:AI 的操作在后台完成,不再是“抢鼠标代打”,而是与用户在同一个页面状态下并行协作。
4.未来,所有的网站可能都需要两套界面:一套是给人类使用的图形界面 (GUI),另一套是给 AI 使用的标准化接口 (AUI - Agentic UI)。
互联网正在从“人类阅读的网”向“人类与 AI 共用的网”转型。建议各位开发者和产品经理提前关注这个重要趋势。