资讯

Claude Opus 4.6 正式发布:Terminal-Bench 第一、1M 上下文、Agent Teams 全面升级

Anthropic 发布 Claude Opus 4.6:Terminal-Bench 2.0 第一、Humanity's Last Exam 最高分、1M Token 上下文窗口。同步推出自适应思考、上下文压缩、Agent Teams 等重磅 API 功能。Notion、GitHub、SentinelOne 等 20+ 合作伙伴确认超越前代。

2026/2/284分钟 阅读ClaudeEagle

Anthropic 正式发布 Claude Opus 4.6,这是迄今最强的 Opus 级模型。在编程、长上下文推理、Agent 规划等关键能力上全面跃升,同时配套推出自适应思考、上下文压缩、Agent Teams 等重磅 API 新功能。

核心性能亮点

编程能力:行业第一

  • Terminal-Bench 2.0:所有前沿模型中得分最高
  • SWE-bench Verified:25 次平均得分行业领先,特定提示下达 81.42%
  • Shopify、GitHub、Replit、Windsurf 等早期合作伙伴均确认:Opus 4.6 在复杂多步骤编程任务上显著优于 Opus 4.5

知识推理:全面领先

  • Humanity's Last Exam:所有前沿模型中得分最高(53.0%)——这是目前 AI 最难的多学科推理测试
  • GDPval-AA(金融、法律等经济价值知识工作):比 GPT-5.2 高约 144 Elo 点,比 Opus 4.5 高 190 点
  • BigLaw Bench(法律推理):90.2%,Claude 模型最高分
  • BrowseComp(在线寻找难以发现的信息):所有模型中最高分

长上下文:质的飞跃

  • 1M Token 上下文窗口(Beta):Opus 系列首次
  • MRCR v2(1M 变体,8 针检索):76%,而 Sonnet 4.5 仅 18.5%

这代表了一个质的转变:Opus 4.6 真正能够在百万 Token 级别的上下文中有效推理,而不仅仅是存储。

早期合作伙伴评价

Notion:「Claude Opus 4.6 是 Anthropic 迄今发布的最强模型。它能真正完成复杂请求,拆解成具体步骤执行,即使任务雄心勃勃也能产出精良工作。感觉不像工具,更像一个有能力的协作者。」

GitHub:「早期测试显示 Opus 4.6 在开发者日常面对的复杂多步骤编程工作上表现出色——尤其是需要规划和工具调用的 Agentic 工作流。开始解锁长期任务的前沿能力。」

SentinelOne:「Claude Opus 4.6 像高级工程师一样处理了一个数百万行代码库的迁移任务。提前规划,边学边调整策略,用一半的时间完成。」

Rakuten:「Claude Opus 4.6 在一天内自主关闭了 13 个 Issue,并将 12 个 Issue 分配给正确的团队成员,管理了一个约 50 人的组织跨 6 个代码库。它同时处理产品和组织决策,并知道何时上报给人类。」

Box:「在对抗性网络安全调查中,40 次测试 Opus 4.6 赢了 38 次(对比 Claude 4.5 模型)。每个模型使用同一 Agentic 框架,最多 9 个 Subagent 和 100+ 工具调用。」

API 重磅新功能

自适应思考(Adaptive Thinking)

之前只有「开启/关闭」扩展思考的二选一。现在 Claude 可以根据任务复杂度自主决定使用多少思考深度:

python
# 高 effort(默认):Claude 自主决定何时深度思考
response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={"type": "enabled", "budget_tokens": 10000}
)

四个 Effort 级别:lowmediumhigh(默认)、max

上下文压缩(Context Compaction,Beta)

长对话和 Agentic 任务经常撞上上下文窗口上限。上下文压缩在接近阈值时自动摘要并替换旧上下文,让 Claude 执行更长的任务而不中断:

python
beta_client.messages.create(
    model="claude-opus-4-6",
    betas=["context-compaction"],
    max_tokens=8096,
    system="你是一个代码助手",
    messages=[...]
)

1M Token 上下文(Beta)

  • 可容纳整个大型代码库、长篇合同或数十篇研究论文
  • 超过 200k Token 的 Prompt 使用高级定价($10/$37.50 per million 输入/输出)
  • 目前仅在 Claude Developer Platform 可用

128k 输出 Token

Opus 4.6 支持最多 128k Token 的输出,可在单次请求中完成更大输出的任务,无需分多次请求。

Claude Code 新功能

Agent Teams(实验性):在 Claude Code 中组建多个 Agent 协同工作的团队,最适合可以并行进行的任务(如代码库审查)。可以通过 Shift+Up/Down 或 tmux 直接接管任意 Subagent。

启用方法:

json
{
  "env": {
    "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1"
  }
}

安全性同步提升

安全性与智能同步提升,而非以安全换能力:

  • 自动化行为审计:误对齐行为(欺骗、谄媚、鼓励用户幻觉、配合滥用)发生率低
  • 过度拒绝率最低:在所有近期 Claude 模型中,对正常问题的错误拒绝率最低
  • 新增 6 个网络安全探针:专门针对 Opus 4.6 增强的网络安全能力

定价与可用性

  • 价格:与 Opus 4.5 相同,$5/$25 per million tokens(输入/输出)
  • 可用:claude.ai、Anthropic API、AWS Bedrock、Google Cloud Vertex AI
  • API 名称claude-opus-4-6

原文:Claude Opus 4.6 | 来源:Anthropic 官方博客

相关文章推荐

资讯Claude Sonnet 4.6 正式发布:编程能力大幅提升,1M 上下文窗口上线Anthropic 发布 Claude Sonnet 4.6,编程能力全面跃升,在 Claude Code 中 70% 的用户更偏好它而非 Sonnet 4.5,OSWorld 计算机使用得分从 15% 飙升至 72.5%,同时带来 1M Token 上下文窗口、自适应思考和上下文压缩等新功能。2026/2/28资讯Claude 3.5 到 Claude 4 迁移完全指南:兼容性、新能力与成本变化从 Claude 3.5 Sonnet/Haiku 迁移到 Claude 4 系列的完整实战指南:模型 ID 变更对照表、API 接口向后兼容性、Claude 4 新增能力(1M 上下文/Adaptive Thinking/更强编程能力)、价格变化与成本影响、常见迁移注意事项(max_tokens 上限变化/thinking block/beta 头移除)以及分阶段迁移策略。2026/3/21资讯OpenClaw 是什么?2026 年最全面的 AI 个人助手框架介绍OpenClaw 完整介绍:什么是 OpenClaw、核心功能(多渠道消息、Agent 架构、Skills 插件、Cron 定时任务、Hooks、多模型支持)、与 Claude Code 的关系、适用场景,以及为什么越来越多的开发者选择 OpenClaw 作为私人 AI 助手平台。2026/3/15资讯Claude Code 2026 年功能全景:从终端 CLI 到多平台 AI 编程助手的完整进化Claude Code 2026 最新功能全览:Web 版、桌面应用、VS Code 扩展、JetBrains 插件、Slack 集成、GitHub Actions/GitLab CI/CD、Sub-Agents 并行、Output Styles、Remote Control 远程控制,以及订阅计划与使用建议。2026/3/15资讯Claude Sonnet 4.6 深度解析:前沿编程能力、Agent 任务与专业工作的全面升级Claude Sonnet 4.6 深度解析:计算机使用能力从 15% 飞跃至 72.5%(OSWorld 基准)、编程任务(200K 上下文/跨文件重构)、Claude Code 集成优化(Plan Mode/子代理)、Agent 工具调用精准度提升,以及与 Opus 4.6 的定位分工和多平台访问方式。2026/3/2资讯Anthropic 收购 Vercept:Claude 计算机使用能力迈向人类水平Anthropic 收购 AI 感知初创公司 Vercept(联创含 Faster R-CNN 作者 Ross Girshick),进一步推进 Claude 计算机使用能力。Claude Sonnet 4.6 在 OSWorld 基准上从 15% 跃升至 72.5%,接近人类水平。这是继收购 Bun 团队后 Anthropic 的第二次收购。2026/3/2