2026 年 2 月 17 日,Anthropic 正式发布 Claude Sonnet 4.6。 这是迄今为止最强的 Sonnet 模型—— 不仅在编程上接近 Opus 级别,还带来了 1M Token 超长上下文, 以及大幅提升的 Computer Use 操作能力。
Sonnet 4.6 核心亮点
编程能力:Opus 级别,Sonnet 价格
这是 Sonnet 4.6 最重磅的升级。
Claude Code 内部测试数据:
- 用户对比 Sonnet 4.6 vs Sonnet 4.5:70% 更偏好 Sonnet 4.6
- 用户对比 Sonnet 4.6 vs Opus 4.5(上一代旗舰):59% 更偏好 Sonnet 4.6
为什么用户更喜欢 Sonnet 4.6?
用户反馈:
✅ 修改代码前会先充分阅读上下文
✅ 会合并共用逻辑而非重复代码
✅ 更少"过度工程化"和"偷懒"
✅ 更少虚报完成(说做完了但没做)
✅ 更少幻觉,指令跟随更准确
✅ 多步任务的连贯性显著提升
定价不变:$3 / $15(输入/输出,每百万 Token)——和 Sonnet 4.5 相同。
1M Token 超长上下文(Beta)
Sonnet 4.6 将上下文窗口扩展到 100 万 Token(Beta 阶段)。
1M Token 能装多少内容?
| 内容类型 | 大约容量 |
|---|---|
| 代码行数 | ~75 万行代码 |
| 英文单词 | ~75 万词(约 1500 页书) |
| PDF 文件 | ~400 份标准研究论文 |
| 中文字数 | ~50 万汉字 |
实际价值:整个中型代码库一次性放入上下文, Claude 能跨文件理解架构,做出更准确的改动建议。
重要的是,Sonnet 4.6 不只是"装得下", 而是能有效推理整个 1M 上下文——在 Vending-Bench Arena(长期规划评测)上, Sonnet 4.6 制定了跨 10 个月的投资策略,最终领先竞争对手。
Computer Use 重大升级
Anthropic 2024 年 10 月首推 Computer Use(让 AI 操控电脑), 当时评价是"还在实验阶段,有时会出错"。
Sonnet 4.6 带来了大幅进步:
OSWorld 基准分数(AI 操控真实软件的标准测试):
Claude Sonnet 3.5 (2024.10) → 基准分
Claude Sonnet 4.0 → 显著提升
Claude Sonnet 4.5 → 继续提升
Claude Sonnet 4.6 → 再次大幅提升 ←── 当前版本
早期用户反馈:Sonnet 4.6 在以下任务达到人类水准:
- 在复杂电子表格中导航
- 填写多步骤网页表单
- 跨多个浏览器标签页整合信息
安全性改进:提示注入(Prompt Injection)攻击抵御能力大幅提升, 与 Opus 4.6 相当——这对 Computer Use 的生产部署至关重要。
综合基准测试
Sonnet 4.6 全面超越 Sonnet 4.5,并在多项测试中接近或超过旧 Opus 模型:
编程(SWE-bench Verified) Sonnet 4.6 > Sonnet 4.5 显著
长文档理解(OfficeQA) Sonnet 4.6 ≈ Opus 4.6(持平旗舰)
前端代码生成 Sonnet 4.6 视觉输出更精美
金融分析(GDPval-AA) Sonnet 4.6 > Sonnet 4.5
Databricks 评价:
"Sonnet 4.6 在 OfficeQA 上的得分与 Opus 4.6 持平, 对企业文档处理(图表/PDF/表格分析)来说是真正的升级。"
Claude Code 中使用 Sonnet 4.6
Sonnet 4.6 是 Claude Code 的默认推荐模型:
# Claude Code 默认即使用 Sonnet 4.6
claude
# 如需明确指定
claude --model claude-sonnet-4-6
# API 调用
model: "claude-sonnet-4-6"推荐场景:
- 日常编程辅助(性价比最优)
- 大型代码库重构(1M 上下文优势)
- Computer Use 自动化任务
- 长期多步骤 Agent 任务
API 价格参考(2026 年 2 月)
| 模型 | 输入 / 百万 Token | 输出 / 百万 Token |
|---|---|---|
| Claude Sonnet 4.6 | $3.00 | $15.00 |
| Claude Opus 4.6 | $5.00 | $25.00 |
| Claude Haiku 4.5 | $0.80 | $4.00 |
Sonnet 4.6 是绝大多数应用场景的最优选择—— 它用 Sonnet 的价格提供接近 Opus 的编程能力。
来源:Anthropic 官方博客 - anthropic.com/news/claude-sonnet-4-6