资讯

Claude Sonnet 4.6 深度解析:更强编程能力、1M 上下文与 Computer Use 重大升级

Claude Sonnet 4.6 完整解析:编程能力接近 Opus 级别(Claude Code 内测 70% 用户更偏好 Sonnet 4.6)、1M Token 超长上下文 Beta、Computer Use 大幅升级(OSWorld 基准持续领跑)、OfficeQA 与 Opus 4.6 持平、定价与 Sonnet 4.5 相同($3/$15 每百万 Token),附 Claude Code 使用配置与各模型价格对比表。

2026/3/284分钟 阅读ClaudeEagle

2026 年 2 月 17 日,Anthropic 正式发布 Claude Sonnet 4.6。 这是迄今为止最强的 Sonnet 模型—— 不仅在编程上接近 Opus 级别,还带来了 1M Token 超长上下文, 以及大幅提升的 Computer Use 操作能力。

Sonnet 4.6 核心亮点

编程能力:Opus 级别,Sonnet 价格

这是 Sonnet 4.6 最重磅的升级。

Claude Code 内部测试数据

  • 用户对比 Sonnet 4.6 vs Sonnet 4.5:70% 更偏好 Sonnet 4.6
  • 用户对比 Sonnet 4.6 vs Opus 4.5(上一代旗舰):59% 更偏好 Sonnet 4.6

为什么用户更喜欢 Sonnet 4.6?

用户反馈: ✅ 修改代码前会先充分阅读上下文 ✅ 会合并共用逻辑而非重复代码 ✅ 更少"过度工程化"和"偷懒" ✅ 更少虚报完成(说做完了但没做) ✅ 更少幻觉,指令跟随更准确 ✅ 多步任务的连贯性显著提升

定价不变:$3 / $15(输入/输出,每百万 Token)——和 Sonnet 4.5 相同。

1M Token 超长上下文(Beta)

Sonnet 4.6 将上下文窗口扩展到 100 万 Token(Beta 阶段)。

1M Token 能装多少内容?

内容类型大约容量
代码行数~75 万行代码
英文单词~75 万词(约 1500 页书)
PDF 文件~400 份标准研究论文
中文字数~50 万汉字

实际价值:整个中型代码库一次性放入上下文, Claude 能跨文件理解架构,做出更准确的改动建议。

重要的是,Sonnet 4.6 不只是"装得下", 而是能有效推理整个 1M 上下文——在 Vending-Bench Arena(长期规划评测)上, Sonnet 4.6 制定了跨 10 个月的投资策略,最终领先竞争对手。

Computer Use 重大升级

Anthropic 2024 年 10 月首推 Computer Use(让 AI 操控电脑), 当时评价是"还在实验阶段,有时会出错"。

Sonnet 4.6 带来了大幅进步:

OSWorld 基准分数(AI 操控真实软件的标准测试)

Claude Sonnet 3.5 (2024.10) → 基准分 Claude Sonnet 4.0 → 显著提升 Claude Sonnet 4.5 → 继续提升 Claude Sonnet 4.6 → 再次大幅提升 ←── 当前版本

早期用户反馈:Sonnet 4.6 在以下任务达到人类水准:

  • 在复杂电子表格中导航
  • 填写多步骤网页表单
  • 跨多个浏览器标签页整合信息

安全性改进:提示注入(Prompt Injection)攻击抵御能力大幅提升, 与 Opus 4.6 相当——这对 Computer Use 的生产部署至关重要。

综合基准测试

Sonnet 4.6 全面超越 Sonnet 4.5,并在多项测试中接近或超过旧 Opus 模型:

编程(SWE-bench Verified) Sonnet 4.6 > Sonnet 4.5 显著 长文档理解(OfficeQA) Sonnet 4.6 ≈ Opus 4.6(持平旗舰) 前端代码生成 Sonnet 4.6 视觉输出更精美 金融分析(GDPval-AA) Sonnet 4.6 > Sonnet 4.5

Databricks 评价:

"Sonnet 4.6 在 OfficeQA 上的得分与 Opus 4.6 持平, 对企业文档处理(图表/PDF/表格分析)来说是真正的升级。"

Claude Code 中使用 Sonnet 4.6

Sonnet 4.6 是 Claude Code 的默认推荐模型

bash
# Claude Code 默认即使用 Sonnet 4.6
claude

# 如需明确指定
claude --model claude-sonnet-4-6

# API 调用
model: "claude-sonnet-4-6"

推荐场景

  • 日常编程辅助(性价比最优)
  • 大型代码库重构(1M 上下文优势)
  • Computer Use 自动化任务
  • 长期多步骤 Agent 任务

API 价格参考(2026 年 2 月)

模型输入 / 百万 Token输出 / 百万 Token
Claude Sonnet 4.6$3.00$15.00
Claude Opus 4.6$5.00$25.00
Claude Haiku 4.5$0.80$4.00

Sonnet 4.6 是绝大多数应用场景的最优选择—— 它用 Sonnet 的价格提供接近 Opus 的编程能力。


来源:Anthropic 官方博客 - anthropic.com/news/claude-sonnet-4-6

相关文章推荐

资讯Claude Cowork 完全使用指南:把繁琐知识工作交给 AI 代理自主执行(2026)Claude Cowork 完整使用指南:Cowork 与 Claude.ai 对话/Claude Code 的定位对比、核心功能详解(自主任务执行/Computer Use操控电脑/Dispatch手机远程分配/跨会话持久记忆)、三大典型场景(竞品分析/财务报表/邮件批量处理)、访问方式与计划要求,基于 2026 年 3 月 Anthropic 最新发布。2026/3/30资讯Claude Opus 4.6 深度解析:Anthropic 最强旗舰、Agent Teams 与 Adaptive ThinkingClaude Opus 4.6 完整解析:Terminal-Bench 2.0 全球第一、Humanity's Last Exam 第一、GDPval-AA 超 GPT-5.2 144 Elo、首个 Opus 1M Token 上下文、Claude Code Agent Teams(并行子任务团队)、Adaptive Thinking 自适应思考、Effort 参数控制、Context Compaction,附 Sonnet 4.6 vs Opus 4.6 选型对比表。2026/3/28资讯Claude Sonnet 4.6 正式发布:编程能力大幅提升,1M 上下文窗口上线Anthropic 发布 Claude Sonnet 4.6,编程能力全面跃升,在 Claude Code 中 70% 的用户更偏好它而非 Sonnet 4.5,OSWorld 计算机使用得分从 15% 飙升至 72.5%,同时带来 1M Token 上下文窗口、自适应思考和上下文压缩等新功能。2026/2/28资讯Claude Code Week 13-14 功能详解:Auto Mode、Computer Use CLI、/powerup 交互课程全解析2026 年 3 月下旬到 4 月初两周的重磅功能解析:Auto Mode 自动权限管理、Computer Use 桌面版和 CLI 版、PR Auto-fix 自动让 CI 变绿、/powerup 终端内交互教程、无闪烁渲染、MCP 工具结果大小覆盖到 50 万字符、Plugin 可执行文件加入 PATH,以及条件 Hooks 配置。每个功能含完整使用命令。2026/4/26资讯Anthropic 官方复盘:Claude Code 质量下降事件的三个真实原因(2026 年 4 月)Anthropic 在 4 月 23 日发布罕见的工程透明公告,详解过去一个月 Claude Code 变笨、失忆、额度消耗异常的三个独立根因:推理努力等级悄悄从 high 降到 medium、缓存 Bug 导致推理历史每轮丢失、减少冗长的 System Prompt 修改影响编程质量。所有问题已于 4 月 20 日修复,向所有用户重置使用额度。2026/4/26资讯Claude Opus 4.7 正式发布:编程能力大幅提升,CursorBench 得分 70% vs Opus 4.6 的 58%Claude Opus 4.7 发布详解:CursorBench 得分从 58% 跳至 70%,Rakuten 生产任务解决数 3×,XBOW 视觉精度从 54.5% 跳至 98.5%。覆盖新增 xhigh 努力级别、/ultrareview 命令、Auto Mode 扩展,以及从 Opus 4.6 迁移的 Token 使用变化注意事项。2026/4/22