2026 年 2 月 5 日,Anthropic 发布 Claude Opus 4.6—— 当前 Anthropic 最强旗舰模型,并同步带来了 Agent Teams、Adaptive Thinking、Effort 控制等重磅新功能。
Opus 4.6 核心升级
旗舰级编程能力
Opus 4.6 在多项权威 AI 编程基准测试中登顶:
- Terminal-Bench 2.0(真实终端编程任务):全球第一
- Humanity's Last Exam(复杂多学科推理):全球第一
- GDPval-AA(企业知识工作:金融/法律/医疗):比 GPT-5.2 领先 144 Elo 分
- BrowseComp(网络深度信息检索):全球第一
- BigLaw Bench(法律推理):90.2 分,40% 满分
与前代对比:Opus 4.6 vs Opus 4.5 在 GDPval-AA 上领先 190 Elo 分——这是非常大的跨越。
1M Token 上下文(首个 Opus)
这是 Opus 系列首次拥有 1M Token 上下文(Beta)。
使用场景:
- 分析整个 50 人团队 × 6 个仓库的代码变更(Rakuten 实际案例)
- 一次性处理多份大型合同/研究报告
- 跨大量文档的深度信息检索
Claude Code 中的 Agent Teams(重磅新功能)
Opus 4.6 发布时,Claude Code 同步推出 Agent Teams:
传统 Claude Code:
单个 AI 顺序处理任务
→ 长任务容易超时或丢失上下文
Agent Teams(Opus 4.6):
编排 Agent(Opus)+ 多个工作 Agent 并行执行
→ 每个子任务独立处理,结果汇总给编排 Agent
→ 复杂任务速度可提升数倍
实战效果(Rakuten 案例):
Opus 4.6 在单日内自主关闭了 13 个 Issue, 将 12 个 Issue 分配给正确团队成员, 管理了跨 6 个仓库的约 50 人组织。
启用方式:
# claude.ai 上的 Claude Code 已集成
# API 参考文档:
# code.claude.com/docs/en/agent-teamsAdaptive Thinking(自适应思考深度)
新的 Adaptive Thinking 让模型根据任务难度自动调整思考深度:
简单任务(格式转换/翻译)→ 快速回答,不过度思考
中等任务(代码调试) → 适度推理
复杂任务(架构设计/数学)→ 深度 Extended Thinking
这解决了之前 Extended Thinking 的痛点—— 以前需要手动决定是否开启思考模式, 现在模型会自己判断。
Effort 控制(开发者新参数)
# 新的 effort 参数,控制智能/速度/成本的平衡
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=8192,
effort="high", # high(默认)/ medium / low
messages=[...]
)| effort 级别 | 适用场景 | 延迟 | 成本 |
|---|---|---|---|
high | 复杂推理/Agent 任务(默认) | 较高 | 较高 |
medium | 日常问答/代码补全 | 中等 | 中等 |
low | 简单分类/格式化 | 低 | 低 |
Context Compaction(上下文压缩)
API 新功能,让 Agent 能在超长任务中自动压缩历史上下文:
response = client.messages.create(
model="claude-opus-4-6",
betas=["compaction-2026-02"],
# 模型会自动摘要历史,释放上下文空间
# 适合长时间运行的 Agent 任务
)实际客户效果
Notion:
"它接受复杂请求并真正贯彻执行,分解成具体步骤、逐步实施, 即使是雄心勃勃的任务也能产出精polish的成果。 对 Notion 用户来说,感觉更像是一个有能力的协作者,而非工具。"
GitHub:
"早期测试显示 Opus 4.6 在复杂多步骤编程工作中表现突出—— 尤其是需要规划和工具调用的 Agent 工作流。"
Cognition(Devin 团队):
"Opus 4.6 能考虑到其他模型会漏掉的边缘情况, 始终提出更优雅、经过深思熟虑的解决方案。"
API 使用
# API 调用
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
effort="high", # 复杂任务推荐 high
messages=[
{"role": "user", "content": "帮我设计整个微服务架构..."}
]
)
# Claude Code 中指定 Opus
claude --model claude-opus-4-6定价:$5 / $25(输入/输出,每百万 Token)——与 Opus 4.5 相同。
Sonnet 4.6 vs Opus 4.6:如何选择?
| 维度 | Sonnet 4.6 | Opus 4.6 |
|---|---|---|
| 日常编程 | ✅ 性价比最优 | ⚠️ 性能有溢出 |
| 复杂 Agent 任务 | 良好 | ✅ 明显更强 |
| 长期规划/推理 | 良好 | ✅ 行业第一 |
| 成本 | $3/$15 | $5/$25 |
| 推荐场景 | 95% 日常使用 | 高价值复杂任务 |
来源:Anthropic 官方博客 - anthropic.com/news/claude-opus-4-6