Claude Computer Use 是 AI 领域的重大突破—— Sonnet 4.6 带来了重大升级,Computer Use 已从实验性迈向生产可用。
工作原理
循环执行直到任务完成:
1. 截图 -> Claude 获取当前屏幕状态
2. 分析 -> 理解界面元素和任务进度
3. 决策 -> 决定下一步操作
4. 执行 -> 点击/输入/滚动/按键
5. 回到 1 -> 截图验证结果
API 调用配置
python
import anthropic, base64
from PIL import ImageGrab
client = anthropic.Anthropic()
def computer_use_task(task: str):
tools = [
{
'type': 'computer_20250124',
'name': 'computer',
'display_width_px': 1920,
'display_height_px': 1080,
'display_number': 1
}
]
messages = [{'role': 'user', 'content': task}]
while True:
response = client.beta.messages.create(
model='claude-sonnet-4-6',
max_tokens=4096,
tools=tools,
messages=messages,
betas=['computer-use-2025-01-24']
)
if response.stop_reason == 'end_turn':
break
# 执行工具调用,截图反馈给 Claude
tool_results = execute_tools(response.content)
messages.append({'role': 'assistant', 'content': response.content})
messages.append({'role': 'user', 'content': tool_results})实战场景一:自动填写网页表单
python
computer_use_task(
'打开浏览器,访问 https://example.com/register,'
'填写注册表单:姓名张三、邮箱 zhangsan@example.com、'
'公司示例科技、勾选同意服务条款,点击提交,截图返回结果。'
)实战场景二:Excel 数据录入
python
computer_use_task(
'打开 ~/Documents/sales_data.xlsx,'
'将以下数据录入 Sheet2 的 A1:'
'产品A 2026-03-01 150件 45000元;'
'产品B 2026-03-01 89件 26700元;'
'在 E1 添加合计公式,保存文件。'
)实战场景三:跨应用数据迁移
python
computer_use_task(
'从旧 CRM(Chrome 浏览器已打开)把所有待跟进客户'
'逐一录入新 CRM(另一标签页),每条录入后截图确认。'
)Sonnet 4.6 的进步
| 能力 | Sonnet 4.5 | Sonnet 4.6 |
|---|---|---|
| OSWorld 基准得分 | 基准 | 显著提升 |
| 复杂表格导航 | 部分成功 | 人类水平 |
| 多步骤表单填写 | 部分成功 | 人类水平 |
| 提示注入抵御 | 一般 | 与 Opus 4.6 持平 |
安全使用规范
1. 沙箱隔离:在虚拟机或 Docker 容器中运行,不要在生产机器直接运行
2. 权限最小化:只给必要权限,敏感操作(转账/删除)需人工确认
3. 提示注入防护:避免让 Claude 访问不信任的网站
4. 操作审计:记录所有操作日志,截图存档
与 OpenClaw Cowork 结合
OpenClaw Cowork 封装了 Computer Use,无需自己实现底层控制循环。
你(手机 Telegram):帮我把今天的销售数据更新到 Excel 月报表
OpenClaw Cowork:[调用 Computer Use] -> [打开 Excel]
-> [填写数据] -> [保存] -> [截图发给你确认]
来源:Anthropic Claude 文档 - docs.anthropic.com/en/docs/build-with-claude/computer-use