教程

Claude Code Computer Use:从终端直接操控 macOS 桌面的 AI 自动化

Claude Code Computer Use 让 AI 直接操控 macOS 桌面:编译应用、点击按钮、截图验证。详解启用步骤、安全机制和实际应用场景。

2026/4/74分钟 阅读ClaudeEagle

你有没有想过让 AI 不仅能写代码,还能直接操作你的电脑——编译 Swift 应用、启动它、点击每个按钮、截图验证结果?Claude Code 的 Computer Use 功能就是这个想法的实现。


这不是 Chrome 集成

别和 Chrome 集成搞混了。Chrome 集成操控的是浏览器,Computer Use 操控的是整个 macOS 桌面

功能Chrome 集成Computer Use
操控对象Chrome 浏览器macOS 桌面应用
适用范围Web 应用原生应用、模拟器、任何 GUI 工具
平台跨平台macOS 专属
计划所有直接计划Pro/Max 专属

能做什么?

1. 构建和验证原生应用

text
构建 MenuBarStats 目标,启动它,打开偏好窗口,
验证间隔滑块是否更新标签。截图偏好窗口。

Claude 编译、启动、点击、验证——一气呵成。

2. 端到端 UI 测试

text
测试这个 Electron 应用的注册流程。

Claude 打开应用,点击注册,截图每一步。不需要 Playwright、不需要测试框架。

3. 调试视觉和布局问题

text
模态框在小窗口下被裁剪了。

Claude 调整窗口大小、复现 Bug、截图、修复 CSS、验证修复效果。

4. 操控纯 GUI 工具

设计工具、硬件控制面板、iOS 模拟器——任何没有 CLI 或 API 的工具。

使用前提

  • macOS
  • Pro 或 Max 计划
  • Claude Code v2.1.85+
  • 交互式会话(不支持 -p 非交互模式)

启用步骤

1. 开启 Computer Use Server

text
/mcp

找到 computer-use → 选择 Enable。设置按项目持久化。

2. 授权 macOS 权限

首次使用时需要两个权限:

  • 辅助功能 (Accessibility):允许点击、输入、滚动
  • 屏幕录制 (Screen Recording):允许查看屏幕内容

授权后可能需要重启 Claude Code。

安全机制

逐应用审批

开启 Computer Use 不等于 Claude 能操控所有应用。每个应用需要单独批准:

权限等级应用类型
完整控制大多数应用
仅点击终端、IDE
仅查看浏览器、交易平台

高权限应用有额外警告:

警告适用于
等同于 Shell 访问Terminal, iTerm, VS Code
可读写任何文件Finder
可更改系统设置系统设置

全局紧急停止

Esc 键立即中止 Computer Use,Claude 释放锁定、恢复隐藏的应用。

其他安全措施

  • 终端不截图:Claude 永远看不到自己的终端输出
  • 独占锁:同一时间只有一个 Claude 会话可以操控屏幕
  • 每会话审批:应用权限在会话结束后失效

工具选择优先级

Claude 自动选择最精确的工具:

  1. MCP Server(如果有对应服务的 MCP)
  2. Bash 命令(如果是 Shell 操作)
  3. Chrome 集成(如果是浏览器操作)
  4. Computer Use(以上都不适用时)

Computer Use 是最后选择——覆盖面最广但速度最慢。

工作方式

当 Claude 开始操控屏幕时:

  1. 其他可见应用被隐藏(只留审批过的应用和终端)
  2. Claude 执行操作(点击、输入、截图)
  3. 操作完成后自动恢复隐藏的应用

你可以在终端中实时观看 Claude 的操作过程。

实用示例

验证 iOS 模拟器中的应用

text
在 iOS 模拟器中启动应用,测试所有导航标签,
确保数据正确加载。截图任何异常状态。

自动化 Xcode 操作

text
打开 Xcode,选择 Release scheme,Archive 项目,
然后导出 IPA 文件。

截图对比设计稿

text
打开 Figma 中的设计稿,然后打开本地运行的应用,
逐屏对比两者的差异。

原文来源:Claude Code Computer Use 文档 | 来源:Claude Code 官方文档

相关文章推荐

教程Claude Code Computer Use 使用指南:让 AI 直接操控 iOS 模拟器和 GUI 应用Claude Code Computer Use 完整使用指南:三种入口(桌面应用/CLI/macOS Desktop)的启用步骤、iOS 模拟器测试/深色模式验证/Figma 检查/无 API 专有工具等实战场景、权限和安全机制(默认关闭,每步确认)、当前研究预览阶段已知限制,以及 Computer Use + Hooks 自动保存截图的高级组合。2026/4/26教程Claude Code Computer Use 实战指南:让 AI 直接操作 GUI 应用Claude Code Computer Use 完整实战指南:5 种 Computer Use 工具(截图/点击/移动/输入/快捷键);4 个实战场景(无 API 的企业内网系统/UI 渲染验证/不支持自动化的桌面软件/结合 Shell 命令);与 MCP 工具的优先级策略;--chrome 参数(v2.1.126,Chrome 调试集成);权限控制配置(允许截图但禁止系统快捷键);Auto Mode 对 Computer Use 的处理;以及研究预览阶段的已知限制。2026/5/7教程Claude Code macOS 安装完整指南:Homebrew、原生脚本与常见问题解决Claude Code macOS 完整安装教程:原生 curl 脚本、Homebrew cask 两种方式,PATH 配置、OAuth 登录、Xcode 依赖、M1/M2/M3 芯片兼容性、dyld 报错修复,以及 VS Code 和 iTerm2 集成配置。2026/3/15教程Claude Code Dev Container 完整指南:隔离环境、持久认证、网络出口和组织策略Claude Code Dev Container 官方文档中文整理:为什么在容器内运行 Claude Code、devcontainer feature 安装、认证和 settings 持久化、组织 policy、环境变量、网络出口限制、无权限提示模式的风险,以及团队安全落地建议。2026/5/20教程Claude Code 托管 Code Review 完整指南:多 Agent PR 审查、REVIEW.md 和严重性解析Claude Code 托管 Code Review 官方文档中文整理:功能定位、适用版本、工作原理、严重性等级、GitHub check run 输出、手动触发命令、Review Behavior 三种模式、CLAUDE.md 与 REVIEW.md 的区别、成本与排障。2026/5/20教程Claude Agent SDK 官方指南:用 TypeScript 与 Python 构建生产级 AI AgentClaude Agent SDK 官方文档中文整理:SDK 与 CLI 的关系、适用场景、TypeScript/Python 基础用法、query API、流式消息、工具权限控制、MCP 集成、会话管理、生产部署边界和安全建议。2026/5/20