2026 年 2 月 17 日,Anthropic 发布 Claude Sonnet 4.6,定位为在编程、Agent 任务和规模化专业工作中提供前沿性能的主力模型。
Sonnet 4.6 的定位
Sonnet 4.6 是 Anthropic 当前的主力工作模型:
- 比 Opus 快得多,成本低得多
- 在大多数实际任务上接近 Opus 级别的效果
- 专为需要大量 API 调用的 Agent 工作流优化
- Claude Code 的默认推荐模型
计算机使用能力飞跃
Sonnet 4.6 的最突出进步是**计算机使用(Computer Use)**能力:
在 OSWorld(AI 计算机使用标准基准)上的成绩:
- 2024 年底(首次发布):不足 15%
- Sonnet 4.6(2026 年 2 月):72.5%
接近人类水平的具体表现包括:
- 在复杂电子表格中导航
- 跨浏览器标签完成 Web 表单
- 操作真实桌面应用完成多步骤工作流
这正是 Anthropic 收购 Vercept 团队所要增强的核心能力——让 AI 真正「坐在键盘前」操作软件。
编程能力提升
Sonnet 4.6 在编程任务上的提升体现在:
大规模代码库理解:200K token 上下文窗口,可以一次性加载整个大型项目
跨文件重构:理解组件间依赖关系,执行涉及数十个文件的重构任务
测试生成:更准确地理解代码意图,生成覆盖边界条件的测试用例
调试推理:追踪复杂的执行路径,定位难以发现的 Bug
Claude Code 集成优化
Sonnet 4.6 是专为 Claude Code 工作流优化的模型:
Plan Mode:在规划阶段使用只读工具分析代码库,生成准确的修改计划
子代理委派:作为 Explore 和通用子代理的底层模型,平衡速度和效果
长会话稳定性:在数小时的编程会话中保持指令遵从性和代码质量
Agent 任务优化
Sonnet 4.6 的 Agent 能力提升体现在:
工具调用精准度:更少的冗余工具调用,更准确的参数传递
任务分解:更有效地将复杂任务拆分为可执行的子任务
错误恢复:遇到工具调用失败时,能更智能地调整策略
上下文利用:在长任务中更有效地利用历史上下文,避免重复操作
专业工作表现
除了编程,Sonnet 4.6 在专业工作场景中也有显著提升:
研究综合:同时处理多个来源的信息,生成连贯的研究报告
文档生成:理解代码库后生成准确的技术文档
数据分析:结合代码执行和推理,完成复杂的数据分析任务
邮件和沟通:在理解业务上下文的基础上撰写专业沟通内容
定价和访问方式
Sonnet 4.6 通过多个渠道访问:
- claude.ai:Claude Pro/Team/Enterprise 订阅用户直接使用
- Anthropic API:按 token 计费,模型 ID
claude-sonnet-4-6-20260217 - Amazon Bedrock:
anthropic.claude-sonnet-4-6-v1:0 - Google Vertex AI:
claude-sonnet-4-6@20260217 - OpenClaw:
anthropic/claude-sonnet-4-6作为默认模型推荐
与 Opus 4.6 的分工
- Sonnet 4.6:日常工作主力,Agent 工作流,Claude Code 核心场景
- Opus 4.6:最复杂的推理任务,科研级分析,不在乎速度和成本的场景
对于大多数开发者来说,Sonnet 4.6 是最佳选择:在成本和效果之间取得了最好的平衡。
原文:Introducing Claude Sonnet 4.6 | 来源:Anthropic 官方新闻 | 2026-02-17