资讯

Claude Opus 4.8 最新更新:1M 上下文、Fast Mode 和 Agent 编程改进

Anthropic 发布 Claude Opus 4.8,面向复杂推理、长程 Agent 编程和高自治工作负载,带来 1M 上下文、Fast Mode、prompt cache 门槛降低和更好的工具触发。

2026/6/63分钟 阅读ClaudeEagle

Anthropic 官方文档更新了 Claude Opus 4.8。它被定位为当前最强的通用可用模型,重点面向复杂推理、长程 Agent 编程和高自治工作流。


核心规格

Claude Opus 4.8 的 API model ID 是:

text
claude-opus-4-8

主要能力:

  • 默认支持 1M token context window(Claude API、Amazon Bedrock、Vertex AI;Microsoft Foundry 为 200k)
  • 最大输出 128k tokens
  • 支持 adaptive thinking
  • 支持 Opus 4.7 的同一组平台工具和 API 能力
  • 面向复杂推理、长程 Agent coding、持续工具调用场景优化

Fast Mode:更快输出但价格更高

Opus 4.8 在 Claude API 上提供 Fast mode research preview。开发者可以设置:

json
{
  "speed": "fast"
}

官方描述是:在同一模型上获得最高约 2.5 倍的 output tokens/sec,但采用 premium pricing。

适合场景:

  • 编码 Agent 需要快速响应
  • 交互式调试体验很重要
  • 用户等待成本高于推理成本
  • 长输出但不想切到能力更弱的模型

不适合:纯后台批处理、成本敏感的大规模生成。


Prompt Cache 门槛降到 1024 tokens

Opus 4.8 把可缓存 prompt 的最小长度降到 1024 tokens。此前在 Opus 4.7 上太短而无法缓存的 prompt,现在可能无需改代码就能创建 cache entry。

这对 Agent 应用很实用:

  • 系统提示不需要特别长也能缓存
  • 小型工具 schema 更容易命中缓存
  • 多轮会话成本更低
  • 长程任务的输入延迟更稳定

Mid-conversation System Messages

Opus 4.8 支持在 messages 数组中追加 role: "system" 消息,而且不需要 beta header。

这允许应用在长会话中途追加系统级指令,而不是修改顶层 system 字段。好处是:已有 prompt cache prefix 不会被破坏。

典型用途:

  • Agent 运行中途增加新的策略约束
  • 注入工具可用性变化
  • 用户切换模式后赋予新的系统级规则
  • 长会话中追加 operator-level 事实

API 兼容性注意

Opus 4.8 继承了 Opus 4.7 的部分 Messages API 约束:

  • 不支持非默认 temperaturetop_ptop_k
  • 手动 extended thinking budget 不再支持
  • 应使用 thinking: {"type": "adaptive"}effort 参数控制思考深度

迁移时要检查代码中是否还在传旧的采样参数或手动 thinking budget。


对 Agent 编程的意义

官方重点提到三个改进方向:

  • 长程 Agent 编程:更好的长上下文处理、更少 compaction 后跑偏
  • Reasoning effort calibration:不同 effort level 下行为更稳定
  • Tool triggering:更少跳过必要工具调用

这意味着 Opus 4.8 更适合做高自治代码 Agent 的“大脑”,尤其是在需要长时间读代码、调用工具、修复问题、继续执行的任务里。


来源:Anthropic 官方文档 - What's new in Claude Opus 4.8 | 整理:ClaudeEagle

相关文章推荐

资讯Claude Extended Thinking 最新变化:Opus 4.8 改用 Adaptive Thinking,手动预算会报错Claude Extended Thinking 规则发生变化:Opus 4.8/4.7 使用 adaptive thinking,不支持手动 budget_tokens;Sonnet 4.6 和 Opus 4.6 仍可用但已建议迁移。2026/6/6资讯Claude Opus 4.6 深度解析:1M Token 上下文、SWE-bench 72.5%,AI 编程进入新阶段Claude Opus 4.6 深度解析:1M Token 上下文(Beta)、SWE-bench 72.5%,三大改进(谨慎计划/多步骤稳定/自我 review),以及何时选 Opus 而不是 Sonnet 的成本与性能权衡。2026/4/12资讯Anthropic 官方复盘:Claude Code 质量下降事件的三个真实原因(2026 年 4 月)Anthropic 在 4 月 23 日发布罕见的工程透明公告,详解过去一个月 Claude Code 变笨、失忆、额度消耗异常的三个独立根因:推理努力等级悄悄从 high 降到 medium、缓存 Bug 导致推理历史每轮丢失、减少冗长的 System Prompt 修改影响编程质量。所有问题已于 4 月 20 日修复,向所有用户重置使用额度。2026/4/26资讯Claude Opus 4.7 正式发布:编程能力大幅提升,CursorBench 得分 70% vs Opus 4.6 的 58%Claude Opus 4.7 发布详解:CursorBench 得分从 58% 跳至 70%,Rakuten 生产任务解决数 3×,XBOW 视觉精度从 54.5% 跳至 98.5%。覆盖新增 xhigh 努力级别、/ultrareview 命令、Auto Mode 扩展,以及从 Opus 4.6 迁移的 Token 使用变化注意事项。2026/4/22资讯Claude Code 桌面版全面重设计:多 Session 并行工作 + Routines 云端自动化详解2026 年 4 月 14 日 Anthropic 重磅发布:Claude Code 桌面应用全面重设计(支持多 Session 并行)+ Routines 云端自动化功能研究预览。从 AI 编程工具升级为 AI 运营平台的关键一步,含 Code Tab、Routines 使用方法和典型场景。2026/4/16资讯Anthropic 2026 年 Q1 回顾:Claude 4 系列、300 亿营收、Agent 生态爆发Anthropic 2026 年 Q1 全面回顾:年化营收突破 300 亿美元,Claude 4 系列全面铺开,Claude Code 功能爆发性增长。含关键数据和行业分析。2026/4/7