Browser-Use CLI 2.0 – 让 AI 自己操作浏览器
最近发现一个神器:Browser-Use CLI 2.0。
用了一段时间,感觉浏览器自动化这件事,终于变得简单了。GitHub 上已经有 78,000+ Stars,说明大家都需要这个功能。
为什么需要浏览器自动化?
之前用 AI Agent,最头疼的就是:AI 没法操作浏览器。
你想让它帮你:
- 自动填表单?
- 批量登录网站?
- 从网页抓数据?
- 自动测试网页?
- 定时访问某些页面?
都需要你手动操作,或者写复杂的脚本。但现在不一样了。
Browser-Use CLI 2.0 让 AI Agent 能直接操作浏览器,真正实现”你说话,它干活”。
核心亮点
1. 直接连接正在运行的浏览器
这个功能太香了!
不需要启动新的浏览器实例,直接连你正在用的 Chrome。你在浏览器里登录的网站、保存的密码、打开的标签页,AI 都能直接操作。
原理是使用 CDP (Chrome DevTools Protocol),通过调试端口连接浏览器。这意味着:
- 不需要重新登录
- 可以利用已有的 Cookie 和 Session
- 可以直接操作当前打开的标签页
- 省去了每次启动新浏览器的开销
这一点在实际使用中特别重要。很多时候我们需要操作的网站已经登录了,如果用传统方案,每次都要重新登录,非常麻烦。
2. Claude Code 一行配置
在 CLAUDE.md 里加一行配置,Claude Code 就能用:
使用 browser-use 时添加 --cdp-url 参数
比 MCP 简单多了,不需要配置 MCP Server,不需要修改 JSON 配置文件。
这种”开箱即用”的体验,大大降低了使用门槛。
3. 性能提升明显
官方数据:
- 2 倍更快
- 50% 更少 token
实际体验确实流畅,不卡顿。原因在于直接使用 CDP 协议,比通过 MCP Server 转发更高效。
Token 消耗减少也很重要,特别是对于按量计费的 API,能省不少钱。
4. 支持任何 CLI Agent
不光 Claude Code,Codex、Copilot CLI 都能用。这意味着不管你用哪个 AI 编程助手,都能享受到浏览器自动化的便利。
实际使用场景
场景一:自动填表单
打开一个需要填写的网页,告诉 Claude “帮我填一下这个表单”,它会自动识别输入框、下拉菜单、按钮,然后填写提交。
命令示例:
# 查看页面状态
browser-use state
# 输出示例:
# [0] link "Home"
# [1] input "Search..."
# [2] button "Sign In"
# 操作元素
browser-use click 2 # 点击 "Sign In"
browser-use input 1 "关键词" # 在搜索框输入
场景二:批量登录
需要登录多个网站?让它自动操作,省去重复输入。
比如每天早上需要登录 5 个工作系统,可以让 AI 自动完成这个流程。
场景三:网页数据抓取
想从某个网站提取数据?让它自己打开页面、点击、复制,比写爬虫简单多了。
特别是那些需要登录才能访问的页面,传统爬虫要处理 Cookie 很麻烦,用 Browser-Use 直接操作已登录的浏览器,简单多了。
场景四:自动化测试
Web 开发者可以用它来自动化测试网页功能。告诉 AI 要测试什么,它会自动操作并反馈结果。
与 MCP 的对比
| 维度 | Browser-Use CLI 2.0 | MCP (Playwright) |
|---|---|---|
| 性能 | 更快(直接 CDP) | 较慢 |
| Token 消耗 | 更少 | 更多 |
| 配置复杂度 | 简单(一行配置) | 需要配置 MCP Server |
| 连接现有浏览器 | ✅ 支持 | ❌ 需要新实例 |
| WSL2 支持 | ✅ 可操作宿主机浏览器 | ❌ 复杂 |
之前用 MCP,每次都要启动新的浏览器实例,不能复用已有的登录状态。Browser-Use CLI 2.0 可以直接连接现有浏览器,这点特别实用。
从 WSL2 使用时,还能操作宿主机的浏览器,这对 Windows + WSL 开发者来说太方便了。
安装方式
需要 Python 3.11+:
# 安装
pip install browser-use
browser-use install # 安装 Chromium
# 基本使用
browser-use open https://example.com
browser-use state # 查看当前页面状态
# 连接现有浏览器(需要先启动 Chrome 并开启调试端口)
browser-use --cdp-url http://localhost:9222
注意事项
- 需要本地有 Python 环境
- 首次使用会下载 Chromium
- 连接现有浏览器需要开启调试端口
- 从 WSL2 使用时,可以操作宿主机的浏览器
社区评价
日本开发者 @ma2shita:
“CLI 2.0 可以直接通过 CDP 操作浏览器。Claude Code 只需在 CLAUDE.md 中写一行配置就能使用,从 WSL2 也能操作宿主机浏览器。比 MCP 更流畅。这种产品真的很有价值。”
用户 @AdwaitKeshari:
“Just set up Browser Use CLI 2.0 and it works like magic. This entire quote post was written and posted by my AI agent using Claude Code + Browser Use.”
我的感受
浏览器自动化一直是个痛点。以前要么写脚本,要么用 RPA 工具,都很重。
现在 AI Agent 能直接操作浏览器了,感觉又往前迈了一步。
对于经常需要重复操作网页的人,这个工具值得试试。配置简单、性能好、支持现有浏览器,这三点就足够成为推荐理由了。
适合谁用?
- Web 开发者 – 自动化测试网页功能
- 数据分析师 – 抓取网页数据
- 运营人员 – 批量操作后台系统
- 普通用户 – 自动化重复性操作



