深度

OpenClaw Browser Agent:让 AI 自动操作网页、填表单、抓数据的完整指南

OpenClaw Browser 工具完整指南:配置 Playwright 浏览器控制、AI 驱动的网页自动化、无头浏览器截图、表单自动填写、网页数据抓取、登录状态保持、多标签页管理,以及 Browser Agent 与 Puppeteer/Selenium 的对比优势。

2026/3/164分钟 阅读ClaudeEagle

OpenClaw 内置的 Browser 工具让 Claude 可以真正"看到并操作"网页—— 不是写 Selenium 脚本,而是像人一样理解页面结构,智能地完成各种网页任务。

核心能力

能力说明
截图分析截取网页截图,Claude 直接分析可视内容
元素操作点击按钮、填写表单、下拉选择
导航打开 URL、前进/后退、多标签页
数据提取从网页结构中提取结构化数据
等待交互等待元素加载、页面跳转完成
登录保持保存 Cookie,维持登录状态

与传统工具的区别

OpenClaw BrowserPuppeteer/Selenium
编写方式自然语言描述写代码
应对变化AI 自适应(元素移动也能找到)选择器写死,变了就挂
调试对话式调试打断点
适用场景复杂、不规则任务高频、稳定的批量任务

基础配置

bash
# 安装 Playwright 浏览器
npx playwright install chromium

# 在 OpenClaw config 启用
json
// ~/.openclaw/config.json
{
  "tools": {
    "browser": {
      "enabled": true,
      "headless": true,
      "defaultProfile": "openclaw",
      "screenshotDir": "~/.openclaw/screenshots",
      "timeout": 30000
    }
  }
}

场景 1:网页数据抓取

你:帮我抓取 Hacker News 今天排名前 10 的文章, 包括标题、链接、评论数,整理成表格 助手:[Browser 打开 news.ycombinator.com] [截图分析页面结构] [提取文章列表数据] | 排名 | 标题 | 链接 | 评论数 | |------|------|------|-------| | 1 | ... | ... | 342 | ...

场景 2:自动填写表单

你:帮我填写这个报名表单 https://example.com/register 姓名:张三,邮箱:zhangsan@example.com, 职位:工程师,公司:某科技 助手:[打开表单页面] [截图确认表单结构] [逐字段填写] 表单已填写完毕,这是截图确认,需要我点击提交吗?

场景 3:监控网页变化

bash
# 添加 Cron:每小时检查竞品价格
openclaw cron add   --schedule "0 * * * *"   --task "用浏览器打开 https://competitor.com/product/123,
         截图并提取当前价格,
         与上次价格对比,
         如果降价超过 10% 发 Telegram 通知我"

场景 4:自动化工作流

你:帮我每天早上 9 点: 1. 登录 CRM 系统(https://crm.company.com) 2. 导出昨天的销售数据(CSV) 3. 发给我的邮箱 助手:好的,我需要你先提供登录凭据, 然后我会记录操作步骤并创建 Cron 任务。

场景 5:AI 截图分析

你:截图分析一下 https://www.claudecode.xyz 的首页, 告诉我有哪些改进空间 助手:[截图] 分析如下: 1. 导航栏层级过深... 2. CTA 按钮颜色与背景对比度不足... 3. 移动端响应式有以下问题...

使用 Chrome Extension Relay(连接真实浏览器)

OpenClaw 支持连接你正在使用的 Chrome 浏览器,包括登录状态:

json
{
  "tools": {
    "browser": {
      "profile": "chrome",
      "relay": true
    }
  }
}

安装 OpenClaw Browser Relay 扩展后,点击工具栏按钮「Attach Tab」, AI 就能操作你当前打开的标签页,无需重新登录任何网站。

安全与隐私

重要原则

  • 浏览器自动化默认需要用户确认才执行(防止意外操作)
  • 不会自动提交表单(除非明确说「提交」)
  • 敏感信息(密码等)不会出现在日志里

配置确认级别:

json
{
  "tools": {
    "browser": {
      "confirmBeforeSubmit": true,
      "confirmBeforeNavigation": false,
      "logScreenshots": false
    }
  }
}

常见问题

Q:截图很慢 调整 timeoutwaitForSelector 参数,或改为 headless: false 调试时查看实际加载速度。

Q:动态加载的内容抓不到 告诉 Claude「等待页面完全加载后再截图」,它会自动等待 JavaScript 渲染完成。

Q:登录状态丢失 启用 persistCookies: true,Session Cookie 会保存到本地。


来源:OpenClaw 官方文档 - Browser Tool

相关文章推荐

深度OpenClaw 多 Gateway 架构完全指南:一台机器运行多个独立 AI 助手实例OpenClaw 多 Gateway(Multi-Gateway)架构完整教程:多实例的隔离优势、同一台机器运行多个 Gateway(不同端口/配置文件/workspace)、systemd 管理多个 Gateway 服务、Nginx 虚拟主机为每个实例分配独立域名、API Key 隔离与成本拆分、单机多实例 vs 多机方案对比,以及 Docker Compose 多容器隔离部署方案。2026/3/26深度OpenClaw Hooks 自动化进阶:消息前后的智能拦截、转换与触发机制OpenClaw Hooks(钩子)自动化系统进阶教程:Hooks 的触发时机(before-send/after-receive/on-tool-call)、用 Hooks 拦截消息并修改内容(自动翻译/过滤/格式化)、基于条件的 Hook 触发(渠道过滤/关键词匹配)、Hook 中调用外部 API(Notion 记录/Bark 通知/监控告警)、exec 工具二次确认 Hook,以及 Hooks 与 SOUL.md 和 Standing Orders 的优先级关系详解。2026/3/26深度OpenClaw 插件开发完全指南:从零构建自定义渠道和工具插件OpenClaw 插件(Plugin)开发完整教程:插件类型(渠道插件/工具插件/Provider插件)、插件的目录结构和 package.json 规范、使用 Plugin SDK 开发自定义消息渠道(实现 onMessage/sendMessage 接口)、开发自定义工具(Tool)的函数签名和参数 Schema、本地插件安装与调试(openclaw plugins install ./local-plugin)、发布到 npm 的规范要求(@openclaw/ 命名空间)、插件的权限声明(capabilities)、社区插件列表(Plugin Bundles)获取,以及常见插件开发错误和调试技巧。2026/3/25深度OpenClaw 安全威胁模型深度解析:MITRE ATLAS 框架下的 AI 助手攻防分析OpenClaw 安全架构深度分析:个人助手信任模型(单用户/单 Gateway 边界)、形式化验证的认证逻辑、基于 MITRE ATLAS 框架的 AI 系统威胁分类(直接提示注入/间接提示注入/工具滥用/数据泄露/会话劫持)、多租户共享 Gateway 的风险与安全边界说明、exec/browser/文件工具的权限最小化配置、频道白名单与沙箱配置对应的威胁缓解措施,以及 `openclaw security audit` 命令的使用方法。2026/3/24深度OpenClaw 多模型路由完全指南:30+ 模型提供商接入、智能切换与故障转移OpenClaw 多模型路由系统完整教程:支持的 30+ 模型提供商全览(Anthropic/OpenAI/Gemini/Ollama/OpenRouter/DeepSeek/Qwen/GLM 等)、provider/model 格式的模型指定方式、按渠道/Agent/任务类型设置不同默认模型、Model Failover 故障转移配置(主模型失败自动切换备用模型)、Claude Max API Proxy 接入方式、本地模型(Ollama/vLLM)与云端模型混用策略,以及 Token 限制和费用控制实践。2026/3/24深度OpenClaw 多渠道路由完全指南:同时管理 Telegram、WhatsApp、Slack 的统一 AI 助手OpenClaw 多渠道路由(Channel Routing)完整教程:如何在一个 OpenClaw 实例上同时运行 Telegram、WhatsApp、Slack 等多个渠道、每个渠道使用独立 Agent(SOUL.md)的路由配置、基于渠道类型和群组 ID 的路由规则、同一消息跨渠道广播(Broadcast Groups)、根据渠道身份动态调整 AI 人格与语言风格,以及多渠道管理的最佳实践(避免消息混淆/保持上下文独立/渠道专属配置)。2026/3/23