Browser-Use CLI 2.0 – 让 AI 自己操作浏览器

Browser-Use CLI 2.0 – 让 AI 自己操作浏览器

最近发现一个神器:Browser-Use CLI 2.0

用了一段时间,感觉浏览器自动化这件事,终于变得简单了。GitHub 上已经有 78,000+ Stars,说明大家都需要这个功能。

为什么需要浏览器自动化?

之前用 AI Agent,最头疼的就是:AI 没法操作浏览器

你想让它帮你:

  • 自动填表单?
  • 批量登录网站?
  • 从网页抓数据?
  • 自动测试网页?
  • 定时访问某些页面?

都需要你手动操作,或者写复杂的脚本。但现在不一样了。

Browser-Use CLI 2.0 让 AI Agent 能直接操作浏览器,真正实现”你说话,它干活”。

核心亮点

1. 直接连接正在运行的浏览器

这个功能太香了!

不需要启动新的浏览器实例,直接连你正在用的 Chrome。你在浏览器里登录的网站、保存的密码、打开的标签页,AI 都能直接操作。

原理是使用 CDP (Chrome DevTools Protocol),通过调试端口连接浏览器。这意味着:

  • 不需要重新登录
  • 可以利用已有的 Cookie 和 Session
  • 可以直接操作当前打开的标签页
  • 省去了每次启动新浏览器的开销

这一点在实际使用中特别重要。很多时候我们需要操作的网站已经登录了,如果用传统方案,每次都要重新登录,非常麻烦。

2. Claude Code 一行配置

在 CLAUDE.md 里加一行配置,Claude Code 就能用:

使用 browser-use 时添加 --cdp-url 参数

比 MCP 简单多了,不需要配置 MCP Server,不需要修改 JSON 配置文件。

这种”开箱即用”的体验,大大降低了使用门槛。

3. 性能提升明显

官方数据:

  • 2 倍更快
  • 50% 更少 token

实际体验确实流畅,不卡顿。原因在于直接使用 CDP 协议,比通过 MCP Server 转发更高效。

Token 消耗减少也很重要,特别是对于按量计费的 API,能省不少钱。

4. 支持任何 CLI Agent

不光 Claude Code,Codex、Copilot CLI 都能用。这意味着不管你用哪个 AI 编程助手,都能享受到浏览器自动化的便利。

实际使用场景

场景一:自动填表单

打开一个需要填写的网页,告诉 Claude “帮我填一下这个表单”,它会自动识别输入框、下拉菜单、按钮,然后填写提交。

命令示例:

# 查看页面状态
browser-use state

# 输出示例:
# [0] link "Home"
# [1] input "Search..."
# [2] button "Sign In"

# 操作元素
browser-use click 2    # 点击 "Sign In"
browser-use input 1 "关键词"  # 在搜索框输入

场景二:批量登录

需要登录多个网站?让它自动操作,省去重复输入。

比如每天早上需要登录 5 个工作系统,可以让 AI 自动完成这个流程。

场景三:网页数据抓取

想从某个网站提取数据?让它自己打开页面、点击、复制,比写爬虫简单多了。

特别是那些需要登录才能访问的页面,传统爬虫要处理 Cookie 很麻烦,用 Browser-Use 直接操作已登录的浏览器,简单多了。

场景四:自动化测试

Web 开发者可以用它来自动化测试网页功能。告诉 AI 要测试什么,它会自动操作并反馈结果。

与 MCP 的对比

维度 Browser-Use CLI 2.0 MCP (Playwright)
性能 更快(直接 CDP) 较慢
Token 消耗 更少 更多
配置复杂度 简单(一行配置) 需要配置 MCP Server
连接现有浏览器 ✅ 支持 ❌ 需要新实例
WSL2 支持 ✅ 可操作宿主机浏览器 ❌ 复杂

之前用 MCP,每次都要启动新的浏览器实例,不能复用已有的登录状态。Browser-Use CLI 2.0 可以直接连接现有浏览器,这点特别实用。

从 WSL2 使用时,还能操作宿主机的浏览器,这对 Windows + WSL 开发者来说太方便了。

安装方式

需要 Python 3.11+:

# 安装
pip install browser-use
browser-use install  # 安装 Chromium

# 基本使用
browser-use open https://example.com
browser-use state  # 查看当前页面状态

# 连接现有浏览器(需要先启动 Chrome 并开启调试端口)
browser-use --cdp-url http://localhost:9222

注意事项

  1. 需要本地有 Python 环境
  2. 首次使用会下载 Chromium
  3. 连接现有浏览器需要开启调试端口
  4. 从 WSL2 使用时,可以操作宿主机的浏览器

社区评价

日本开发者 @ma2shita:

“CLI 2.0 可以直接通过 CDP 操作浏览器。Claude Code 只需在 CLAUDE.md 中写一行配置就能使用,从 WSL2 也能操作宿主机浏览器。比 MCP 更流畅。这种产品真的很有价值。”

用户 @AdwaitKeshari:

“Just set up Browser Use CLI 2.0 and it works like magic. This entire quote post was written and posted by my AI agent using Claude Code + Browser Use.”

我的感受

浏览器自动化一直是个痛点。以前要么写脚本,要么用 RPA 工具,都很重。

现在 AI Agent 能直接操作浏览器了,感觉又往前迈了一步。

对于经常需要重复操作网页的人,这个工具值得试试。配置简单、性能好、支持现有浏览器,这三点就足够成为推荐理由了。

适合谁用?

  • Web 开发者 – 自动化测试网页功能
  • 数据分析师 – 抓取网页数据
  • 运营人员 – 批量操作后台系统
  • 普通用户 – 自动化重复性操作

相关链接

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注