资讯

Claude Extended Thinking 最新变化:Opus 4.8 改用 Adaptive Thinking,手动预算会报错

Claude Extended Thinking 规则发生变化:Opus 4.8/4.7 使用 adaptive thinking,不支持手动 budget_tokens;Sonnet 4.6 和 Opus 4.6 仍可用但已建议迁移。

2026/6/63分钟 阅读ClaudeEagle

Anthropic 更新了 Extended Thinking 文档。对开发者最重要的变化是:Claude Opus 4.8 和 Claude Opus 4.7 不再支持手动 extended thinking budget。

如果你还在这样传:

json
{
  "thinking": {
    "type": "enabled",
    "budget_tokens": 32000
  }
}

在 Opus 4.8 / 4.7 上会返回 400 error。


新推荐:Adaptive Thinking

对于 Opus 4.8 和 Opus 4.7,应该使用:

json
{
  "thinking": {
    "type": "adaptive"
  },
  "output_config": {
    "effort": "high"
  }
}

核心变化是:开发者不再手动指定预算 token,而是让模型根据当前请求判断是否需要思考、思考多少。


各模型支持情况

官方文档总结如下:

  • Claude Opus 4.8:不支持手动 budget_tokens,使用 adaptive thinking
  • Claude Opus 4.7:不支持手动 budget_tokens,使用 adaptive thinking
  • Claude Mythos Preview:adaptive thinking 默认开启,也接受手动模式
  • Claude Opus 4.6:推荐 adaptive thinking,手动模式仍可用但已 deprecated
  • Claude Sonnet 4.6:推荐 adaptive thinking,手动模式仍可用但已 deprecated

如果你的应用会动态选择模型,就必须按模型版本处理 thinking 参数。


为什么要改?

Adaptive Thinking 更适合真实生产流量,因为请求复杂度差异很大:

  • 简单查找不需要花大量 thinking tokens
  • 多步骤推理需要更深思考
  • Agent 循环中每一步复杂度不同
  • 固定 budget 容易浪费或不够用

Opus 4.8 官方还提到:在 adaptive thinking 下,它会在需要时触发推理,简单步骤直接回答,从而减少不必要的 thinking token 消耗。


迁移建议

如果你的代码使用手动 thinking budget:

python
thinking = {"type": "enabled", "budget_tokens": 32000}

迁移到 Opus 4.8 应改为:

python
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

同时检查:

  • 是否仍传 temperaturetop_ptop_k
  • 是否依赖 thinking block 的固定长度
  • 是否把 thinking token 成本写死进预算估算
  • 是否在不同模型间复用同一请求模板

对 Agent 应用的影响

Agent 应用通常是 bimodal workload:有些 turn 很简单,有些 turn 很复杂。固定 thinking budget 往往会造成两类问题:

  • 简单步骤浪费 token
  • 复杂步骤预算不够

Adaptive Thinking 把这个判断交给模型,更适合长程 coding agent、研究 agent、工具调用 agent。


最佳实践

  • Opus 4.8/4.7:只用 adaptive thinking + effort
  • Sonnet 4.6/Opus 4.6:可以继续运行旧逻辑,但尽快迁移
  • 建立按模型版本分支的 request builder
  • 在日志中记录 effort 和 thinking 类型
  • 重新评估成本,因为 thinking token 消耗模式会变化

来源:Anthropic 官方文档 - Building with extended thinking | 整理:ClaudeEagle

相关文章推荐

资讯Claude Opus 4.8 最新更新:1M 上下文、Fast Mode 和 Agent 编程改进Anthropic 发布 Claude Opus 4.8,面向复杂推理、长程 Agent 编程和高自治工作负载,带来 1M 上下文、Fast Mode、prompt cache 门槛降低和更好的工具触发。2026/6/6资讯Claude Opus 4.6 深度解析:Anthropic 最强旗舰、Agent Teams 与 Adaptive ThinkingClaude Opus 4.6 完整解析:Terminal-Bench 2.0 全球第一、Humanity's Last Exam 第一、GDPval-AA 超 GPT-5.2 144 Elo、首个 Opus 1M Token 上下文、Claude Code Agent Teams(并行子任务团队)、Adaptive Thinking 自适应思考、Effort 参数控制、Context Compaction,附 Sonnet 4.6 vs Opus 4.6 选型对比表。2026/3/28资讯Claude Code Week 17 功能详解:Ultrareview 公测、Session Recap、主题自定义Claude Code Week 17(4月20-24日)完整解读:Ultrareview 公测开放(云端并行 Bug 猎人 Agent、Week 18 升级为 claude ultrareview CLI 子命令含 CI 集成示例);Session Recap(终端失焦后返回时显示摘要,含已完成/当前状态/需你决策三部分);Custom Themes(/theme 命令、可修改的颜色元素、通过 Plugin 分发主题);claude.ai/code 界面重设计;以及 Week 16 核心功能回顾。2026/5/13资讯Claude Code Q1 2026 功能大盘点:Remote Control、Dispatch、Channels、Auto Mode 全解析Claude Code Q1 2026 五大核心功能深度解析:Remote Control(从任何地方控制 Session,三个实际场景);Dispatch(程序化触发 vs 脚本调用的架构差异);Channels(6 种事件类型、Python 监控代码、条件触发示例);Dispatch + Channels 完整集成模式;Computer Use(与 Playwright 的对比和选择原则);Auto Mode(与 Dispatch 的必要关系、安全原则);AutoDream(和普通 Prompt 的对比、适用场景判断);以及五个功能协同工作的完整无人值守流水线示例。2026/5/12资讯Claude Code Week 19 功能详解:插件 URL 安装、全局命令历史、auto mode 硬拒绝规则Week 19(5月4–8日)完整功能解读:插件支持从 URL 直接安装 ZIP 包;Ctrl+R 历史恢复全局搜索(Ctrl+S 缩小到当前项目/会话);auto mode 新增 hard_deny 规则(无条件拒绝,不可被 allow 覆盖);Hooks 获得努力等级信息;worktree.baseRef 配置;Sub-agent 缓存命中提升 3 倍;OTEL 环境变量不再泄漏给子进程;以及多个 OAuth 认证可靠性修复。2026/5/10资讯Claude Code Week 18 功能详解:Windows 免 Git Bash、/resume 粘贴 PR URL、ultrareview CLIWeek 18(4月27日–5月1日)完整功能解读:claude auth login 支持粘贴 OAuth 代码(修复 WSL2/SSH/容器登录);claude project purge 清除项目全部状态;/resume 直接粘贴 PR URL 跳回创建会话(支持 GitHub/GitLab/Bitbucket);Windows 彻底无需 Git for Windows;MCP alwaysLoad 选项;claude ultrareview 子命令(CI 集成);PostToolUse Hook 替换所有工具输出;以及多个内存泄漏修复。2026/5/10