资讯

Claude Sonnet 4.6 深度解析:更强编程能力、1M 上下文与 Computer Use 重大升级

Claude Sonnet 4.6 完整解析:编程能力接近 Opus 级别(Claude Code 内测 70% 用户更偏好 Sonnet 4.6)、1M Token 超长上下文 Beta、Computer Use 大幅升级(OSWorld 基准持续领跑)、OfficeQA 与 Opus 4.6 持平、定价与 Sonnet 4.5 相同($3/$15 每百万 Token),附 Claude Code 使用配置与各模型价格对比表。

2026/3/284分钟 阅读ClaudeEagle

2026 年 2 月 17 日,Anthropic 正式发布 Claude Sonnet 4.6。 这是迄今为止最强的 Sonnet 模型—— 不仅在编程上接近 Opus 级别,还带来了 1M Token 超长上下文, 以及大幅提升的 Computer Use 操作能力。

Sonnet 4.6 核心亮点

编程能力:Opus 级别,Sonnet 价格

这是 Sonnet 4.6 最重磅的升级。

Claude Code 内部测试数据

  • 用户对比 Sonnet 4.6 vs Sonnet 4.5:70% 更偏好 Sonnet 4.6
  • 用户对比 Sonnet 4.6 vs Opus 4.5(上一代旗舰):59% 更偏好 Sonnet 4.6

为什么用户更喜欢 Sonnet 4.6?

用户反馈: ✅ 修改代码前会先充分阅读上下文 ✅ 会合并共用逻辑而非重复代码 ✅ 更少"过度工程化"和"偷懒" ✅ 更少虚报完成(说做完了但没做) ✅ 更少幻觉,指令跟随更准确 ✅ 多步任务的连贯性显著提升

定价不变:$3 / $15(输入/输出,每百万 Token)——和 Sonnet 4.5 相同。

1M Token 超长上下文(Beta)

Sonnet 4.6 将上下文窗口扩展到 100 万 Token(Beta 阶段)。

1M Token 能装多少内容?

内容类型大约容量
代码行数~75 万行代码
英文单词~75 万词(约 1500 页书)
PDF 文件~400 份标准研究论文
中文字数~50 万汉字

实际价值:整个中型代码库一次性放入上下文, Claude 能跨文件理解架构,做出更准确的改动建议。

重要的是,Sonnet 4.6 不只是"装得下", 而是能有效推理整个 1M 上下文——在 Vending-Bench Arena(长期规划评测)上, Sonnet 4.6 制定了跨 10 个月的投资策略,最终领先竞争对手。

Computer Use 重大升级

Anthropic 2024 年 10 月首推 Computer Use(让 AI 操控电脑), 当时评价是"还在实验阶段,有时会出错"。

Sonnet 4.6 带来了大幅进步:

OSWorld 基准分数(AI 操控真实软件的标准测试)

Claude Sonnet 3.5 (2024.10) → 基准分 Claude Sonnet 4.0 → 显著提升 Claude Sonnet 4.5 → 继续提升 Claude Sonnet 4.6 → 再次大幅提升 ←── 当前版本

早期用户反馈:Sonnet 4.6 在以下任务达到人类水准:

  • 在复杂电子表格中导航
  • 填写多步骤网页表单
  • 跨多个浏览器标签页整合信息

安全性改进:提示注入(Prompt Injection)攻击抵御能力大幅提升, 与 Opus 4.6 相当——这对 Computer Use 的生产部署至关重要。

综合基准测试

Sonnet 4.6 全面超越 Sonnet 4.5,并在多项测试中接近或超过旧 Opus 模型:

编程(SWE-bench Verified) Sonnet 4.6 > Sonnet 4.5 显著 长文档理解(OfficeQA) Sonnet 4.6 ≈ Opus 4.6(持平旗舰) 前端代码生成 Sonnet 4.6 视觉输出更精美 金融分析(GDPval-AA) Sonnet 4.6 > Sonnet 4.5

Databricks 评价:

"Sonnet 4.6 在 OfficeQA 上的得分与 Opus 4.6 持平, 对企业文档处理(图表/PDF/表格分析)来说是真正的升级。"

Claude Code 中使用 Sonnet 4.6

Sonnet 4.6 是 Claude Code 的默认推荐模型

bash
# Claude Code 默认即使用 Sonnet 4.6
claude

# 如需明确指定
claude --model claude-sonnet-4-6

# API 调用
model: "claude-sonnet-4-6"

推荐场景

  • 日常编程辅助(性价比最优)
  • 大型代码库重构(1M 上下文优势)
  • Computer Use 自动化任务
  • 长期多步骤 Agent 任务

API 价格参考(2026 年 2 月)

模型输入 / 百万 Token输出 / 百万 Token
Claude Sonnet 4.6$3.00$15.00
Claude Opus 4.6$5.00$25.00
Claude Haiku 4.5$0.80$4.00

Sonnet 4.6 是绝大多数应用场景的最优选择—— 它用 Sonnet 的价格提供接近 Opus 的编程能力。


来源:Anthropic 官方博客 - anthropic.com/news/claude-sonnet-4-6

相关文章推荐

资讯Claude Opus 4.6 深度解析:Anthropic 最强旗舰、Agent Teams 与 Adaptive ThinkingClaude Opus 4.6 完整解析:Terminal-Bench 2.0 全球第一、Humanity's Last Exam 第一、GDPval-AA 超 GPT-5.2 144 Elo、首个 Opus 1M Token 上下文、Claude Code Agent Teams(并行子任务团队)、Adaptive Thinking 自适应思考、Effort 参数控制、Context Compaction,附 Sonnet 4.6 vs Opus 4.6 选型对比表。2026/3/28资讯Claude Sonnet 4.6 正式发布:编程能力大幅提升,1M 上下文窗口上线Anthropic 发布 Claude Sonnet 4.6,编程能力全面跃升,在 Claude Code 中 70% 的用户更偏好它而非 Sonnet 4.5,OSWorld 计算机使用得分从 15% 飙升至 72.5%,同时带来 1M Token 上下文窗口、自适应思考和上下文压缩等新功能。2026/2/28资讯Claude 3.5 到 Claude 4 迁移完全指南:兼容性、新能力与成本变化从 Claude 3.5 Sonnet/Haiku 迁移到 Claude 4 系列的完整实战指南:模型 ID 变更对照表、API 接口向后兼容性、Claude 4 新增能力(1M 上下文/Adaptive Thinking/更强编程能力)、价格变化与成本影响、常见迁移注意事项(max_tokens 上限变化/thinking block/beta 头移除)以及分阶段迁移策略。2026/3/21资讯OpenClaw 是什么?2026 年最全面的 AI 个人助手框架介绍OpenClaw 完整介绍:什么是 OpenClaw、核心功能(多渠道消息、Agent 架构、Skills 插件、Cron 定时任务、Hooks、多模型支持)、与 Claude Code 的关系、适用场景,以及为什么越来越多的开发者选择 OpenClaw 作为私人 AI 助手平台。2026/3/15资讯Claude Code 2026 年功能全景:从终端 CLI 到多平台 AI 编程助手的完整进化Claude Code 2026 最新功能全览:Web 版、桌面应用、VS Code 扩展、JetBrains 插件、Slack 集成、GitHub Actions/GitLab CI/CD、Sub-Agents 并行、Output Styles、Remote Control 远程控制,以及订阅计划与使用建议。2026/3/15资讯Anthropic 收购 Vercept:Claude 计算机使用能力迈向人类水平Anthropic 收购 AI 感知初创公司 Vercept(联创含 Faster R-CNN 作者 Ross Girshick),进一步推进 Claude 计算机使用能力。Claude Sonnet 4.6 在 OSWorld 基准上从 15% 跃升至 72.5%,接近人类水平。这是继收购 Bun 团队后 Anthropic 的第二次收购。2026/3/2