2026 年 6 月 30 日,Anthropic 正式推出 Claude Sonnet 5,这是 Sonnet 系列迄今最强的版本。新模型在 Agentic 能力、编程表现和知识推理方面全面升级,性能接近旗舰级 Opus 4.8,但价格更具竞争力。
核心定位
Claude Sonnet 5 能够自主制定计划、使用浏览器和终端等工具,并以几个月前只有大型昂贵模型才能达到的水平独立运行。
Sonnet 5 的目标很明确:缩小 Sonnet 与 Opus 之间的差距,让开发者以更低成本获得接近旗舰级的 Agentic 能力。
性能表现
基准测试对比
| 评测 | Sonnet 4.6 | Sonnet 5 | Opus 4.8 |
|---|---|---|---|
| Agentic 编程(SWE-bench 类) | 58.1% | 63.2% | 69.2% |
| 知识型工作 | — | 略超 Opus 4.8 | — |
| BrowseComp(网络搜索) | — | 大幅提升 | — |
| OSWorld(计算机操作) | — | 大幅提升 | — |
实测亮点
根据早期合作伙伴反馈:
- 完成复杂任务不中途停止:之前 Sonnet 模型跑到一半就放弃的任务,Sonnet 5 能跑完全程
- 主动自检输出:不需要明确要求,模型会自动验证自己的结果
- 多步骤工具协作:浏览器、终端、代码执行无缝串联
Zapier 高级工程师 Daniel Shepard 表示:
我们给 Claude Sonnet 5 分配了一个两步任务——更新 Salesforce 客户等级并发送上线公告——它从头到尾完成了整个流程。这在以前总会卡在中途。对于日常自动化来说,这是显而易见的选择。
定价
| 阶段 | 输入 Token | 输出 Token |
|---|---|---|
| 优惠期(至 2026 年 8 月 31 日) | $2 / 百万 | $10 / 百万 |
| 正式价格(2026 年 9 月起) | $3 / 百万 | $15 / 百万 |
优惠期内比 Sonnet 4.6 便宜约 33%,同时性能更强。比 OpenAI GPT-5.5 和 Google Gemini 3.1 Pro 更便宜。
安全性提升
Anthropic 安全评估显示,Sonnet 5 相比 Sonnet 4.6:
- 整体误行为率 ↓ 下降
- 幻觉率 ↓ 下降
- 讨好行为(sycophancy)↓ 下降
- 拒绝恶意请求能力 ↑ 提升
- 抗 Prompt Injection 攻击 ↑ 明显加强
可用渠道
从 2026 年 6 月 30 日起:
- Claude.ai:成为免费版和 Pro 版的默认模型
- Claude Code:已支持,模型 ID
claude-sonnet-5 - Max / Team / Enterprise:全部可用
- API:
claude-sonnet-5,优惠期至 8 月 31 日
总结
Claude Sonnet 5 代表了 Anthropic 中端模型策略的重要突破:用接近旗舰级的能力,提供 Sonnet 级别的定价。对于构建 Agent 工作流的开发者来说,这是目前性价比最高的选择。
原文来源:Introducing Claude Sonnet 5 — Anthropic 官方博客,2026-06-30