🔥Browserbase CLI:让 AI Agent 像用终端一样操控浏览器
最近很火的 Browserbase CLI,可以用一句话概括:让 AI Agent 像人一样打开网页、点击、输入、搜索,但用起来像终端一样简单。
⸻
1️⃣一、Browserbase 是什么?
Browserbase 是一个专为 AI 设计的云浏览器平台,把传统浏览器自动化里最麻烦的部分都接管了,比如反爬、验证码、代理、会话管理等。
它的核心能力包括:
•云端真实浏览器(支持隐身、住宅代理、自动处理 CAPTCHA)
•面向 AI 的 API / SDK(而不是给人用的界面)
•兼容 Playwright 风格脚本,可 serverless 运行
•支持实时查看(live view),方便调试 agent 行为
👉 本质就是:AI 不用自己“养浏览器”,直接调用即可。
⸻
2️⃣二、CLI 带来了什么?
Browserbase 新推出的 CLI,把这些能力直接搬进终端:npm install -g @ browserbasehq/cli
安装后,用一个 bb 命令就能完成常见操作:
•查看项目:bb projects list
•查看会话:bb sessions list
•调试浏览器:bb sessions debug <id>
•抓取网页:bb fetch <url>
•搜索网页:bb search "关键词"
还支持直接调用 serverless 浏览器函数。
⸻
真正 AI-native 的用法
Browserbase 提供了一份专门给 AI 看的文档(SKILL.md)。
你只需要对 Agent 说一句:“Read SKILL.md and set up Browserbase”
它就会自动完成:
1. 阅读文档
2. 安装 CLI
3. 配置 API Key
4. 初始化环境
👉 几乎实现了“AI 自己完成工具接入”。
⸻
实际使用体验
支持两种模式:
本地模式
•使用本机浏览器
•无需 API Key
•适合开发调试
远程模式
browse env remote
•使用云浏览器
•自带反检测、代理、持久会话
•适合真实业务场景(电商、SaaS 等)
配套的 browse CLI 还能直接操作页面:
browse open http://t.cn/RZyXBSs
browse snapshot
browse click @0-5
browse type "你好"
browse stop
⸻
3️⃣三、适合谁?
•在做 AI Agent(如 Claude Code、Cursor)
•需要浏览器自动化(数据采集、流程操作)
•不想维护 Puppeteer / Playwright 集群
⸻
一句话总结
Browserbase CLI = 把“浏览器能力”变成 AI Agent 的基础设施。
如果你在做“让 AI 自己上网办事”,这套组合值得一试:
Agent + Browserbase CLI + 自动配置文档(SKILL.md)
很可能会成为下一阶段的标配工具。