资讯

Claude Sonnet 5 正式发布:最强 Agentic Sonnet,性能逼近 Opus 4.8

Anthropic 于 2026 年 6 月 30 日正式发布 Claude Sonnet 5,定位为最强 Agentic Sonnet。新模型在编程、工具调用、推理等关键维度大幅超越 Sonnet 4.6,性能逼近 Opus 4.8,同时保持更低价格,即日起成为 Claude 免费版和 Pro 版的默认模型。

2026/7/13分钟 阅读ClaudeEagle

2026 年 6 月 30 日,Anthropic 正式推出 Claude Sonnet 5,这是 Sonnet 系列迄今最强的版本。新模型在 Agentic 能力、编程表现和知识推理方面全面升级,性能接近旗舰级 Opus 4.8,但价格更具竞争力。

核心定位

Claude Sonnet 5 能够自主制定计划、使用浏览器和终端等工具,并以几个月前只有大型昂贵模型才能达到的水平独立运行。

Sonnet 5 的目标很明确:缩小 Sonnet 与 Opus 之间的差距,让开发者以更低成本获得接近旗舰级的 Agentic 能力。

性能表现

基准测试对比

评测Sonnet 4.6Sonnet 5Opus 4.8
Agentic 编程(SWE-bench 类)58.1%63.2%69.2%
知识型工作略超 Opus 4.8
BrowseComp(网络搜索)大幅提升
OSWorld(计算机操作)大幅提升

实测亮点

根据早期合作伙伴反馈:

  • 完成复杂任务不中途停止:之前 Sonnet 模型跑到一半就放弃的任务,Sonnet 5 能跑完全程
  • 主动自检输出:不需要明确要求,模型会自动验证自己的结果
  • 多步骤工具协作:浏览器、终端、代码执行无缝串联

Zapier 高级工程师 Daniel Shepard 表示:

我们给 Claude Sonnet 5 分配了一个两步任务——更新 Salesforce 客户等级并发送上线公告——它从头到尾完成了整个流程。这在以前总会卡在中途。对于日常自动化来说,这是显而易见的选择。

定价

阶段输入 Token输出 Token
优惠期(至 2026 年 8 月 31 日)$2 / 百万$10 / 百万
正式价格(2026 年 9 月起)$3 / 百万$15 / 百万

优惠期内比 Sonnet 4.6 便宜约 33%,同时性能更强。比 OpenAI GPT-5.5 和 Google Gemini 3.1 Pro 更便宜。

安全性提升

Anthropic 安全评估显示,Sonnet 5 相比 Sonnet 4.6:

  • 整体误行为率 ↓ 下降
  • 幻觉率 ↓ 下降
  • 讨好行为(sycophancy)↓ 下降
  • 拒绝恶意请求能力 ↑ 提升
  • 抗 Prompt Injection 攻击 ↑ 明显加强

可用渠道

从 2026 年 6 月 30 日起:

  • Claude.ai:成为免费版和 Pro 版的默认模型
  • Claude Code:已支持,模型 ID claude-sonnet-5
  • Max / Team / Enterprise:全部可用
  • APIclaude-sonnet-5,优惠期至 8 月 31 日

总结

Claude Sonnet 5 代表了 Anthropic 中端模型策略的重要突破:用接近旗舰级的能力,提供 Sonnet 级别的定价。对于构建 Agent 工作流的开发者来说,这是目前性价比最高的选择。


原文来源:Introducing Claude Sonnet 5 — Anthropic 官方博客,2026-06-30

相关文章推荐

资讯2026 年 6 月大模型格局:Claude Sonnet 5、GPT-5.6 Sol 与 Gemini 3.5 Flash 三足鼎立2026 年 6 月,三大 AI 巨头密集发布中端新模型。对比 Claude Sonnet 5(6 月 30 日)、GPT-5.6 Sol(6 月 26 日)与 Gemini 3.5 Flash(5 月 19 日),分析 Agentic 时代的竞争新格局。2026/7/1资讯Claude Opus 4.6 深度解析:1M Token 上下文、SWE-bench 72.5%,AI 编程进入新阶段Claude Opus 4.6 深度解析:1M Token 上下文(Beta)、SWE-bench 72.5%,三大改进(谨慎计划/多步骤稳定/自我 review),以及何时选 Opus 而不是 Sonnet 的成本与性能权衡。2026/4/12资讯Claude Opus 4.8 最新更新:1M 上下文、Fast Mode 和 Agent 编程改进Anthropic 发布 Claude Opus 4.8,面向复杂推理、长程 Agent 编程和高自治工作负载,带来 1M 上下文、Fast Mode、prompt cache 门槛降低和更好的工具触发。2026/6/6资讯Anthropic 官方复盘:Claude Code 质量下降事件的三个真实原因(2026 年 4 月)Anthropic 在 4 月 23 日发布罕见的工程透明公告,详解过去一个月 Claude Code 变笨、失忆、额度消耗异常的三个独立根因:推理努力等级悄悄从 high 降到 medium、缓存 Bug 导致推理历史每轮丢失、减少冗长的 System Prompt 修改影响编程质量。所有问题已于 4 月 20 日修复,向所有用户重置使用额度。2026/4/26资讯Claude Opus 4.7 正式发布:编程能力大幅提升,CursorBench 得分 70% vs Opus 4.6 的 58%Claude Opus 4.7 发布详解:CursorBench 得分从 58% 跳至 70%,Rakuten 生产任务解决数 3×,XBOW 视觉精度从 54.5% 跳至 98.5%。覆盖新增 xhigh 努力级别、/ultrareview 命令、Auto Mode 扩展,以及从 Opus 4.6 迁移的 Token 使用变化注意事项。2026/4/22资讯Claude Code 桌面版全面重设计:多 Session 并行工作 + Routines 云端自动化详解2026 年 4 月 14 日 Anthropic 重磅发布:Claude Code 桌面应用全面重设计(支持多 Session 并行)+ Routines 云端自动化功能研究预览。从 AI 编程工具升级为 AI 运营平台的关键一步,含 Code Tab、Routines 使用方法和典型场景。2026/4/16