深度

Claude Advisor Tool 详解:用 Sonnet 执行、Opus 做战略顾问的低成本 Agent 架构

Claude Advisor Tool 让 Sonnet 或 Haiku 作为执行器,在复杂节点向 Opus 4.8 咨询战略建议,从而在长程编码 Agent、研究流水线和 computer use 中获得接近 Opus 的质量与更低总成本。

2026/6/63分钟 阅读ClaudeEagle

Anthropic 的 Advisor Tool 是一个很有意思的 Agent 架构能力:让较快、较低成本的 executor model 负责大部分生成,在关键时刻向更强的 advisor model 咨询战略建议。

它仍处于 beta,需要使用:

text
anthropic-beta: advisor-tool-2026-03-01

Advisor Tool 的核心思路

很多长程 Agent 任务里,并不是每个 token 都需要最强模型来写。常见模式是:

  • 大部分步骤是机械执行
  • 少数节点需要高质量规划
  • 最怕的是方向错、工具选错、遗漏关键约束

Advisor Tool 把这件事产品化:

  • executor model:执行任务、生成主要输出
  • advisor model:在中途提供战略建议和纠偏

官方描述中,advisor 通常生成 400-700 个文本 token,总计约 1400-1800 tokens(含 thinking),executor 随后继续完成任务。


适合哪些任务?

特别适合长程 Agent 工作负载:

  • 编码 Agent
  • Computer use
  • 多步骤研究流水线
  • 复杂代码迁移
  • 长时间工具调用任务
  • 需要规划但不希望全程用 Opus 的场景

不太适合:

  • 单轮问答
  • 用户已经手动选择模型的 pass-through 应用
  • 每一轮都必须由最强模型直接完成的任务

模型配对规则

Advisor model 必须至少和 executor 一样强。官方示例中:

  • Haiku 4.5 可咨询 Opus 4.8 / Opus 4.7
  • Sonnet 4.6 可咨询 Opus 4.8 / Opus 4.7
  • Opus 4.7 可咨询 Opus 4.8 / Opus 4.7
  • Opus 4.8 只能咨询 Opus 4.8

如果配对无效,API 会返回 400 invalid_request_error


API 快速示例

json
{
  "model": "claude-sonnet-4-6",
  "max_tokens": 4096,
  "tools": [
    {
      "type": "advisor_20260301",
      "name": "advisor",
      "model": "claude-opus-4-8"
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": "Build a concurrent worker pool in Go with graceful shutdown."
    }
  ]
}

当 executor 认为需要建议时,会触发 server-side advisor 调用。开发者不需要额外发第二个请求。


它如何工作?

官方流程:

  1. executor 输出 server_tool_use,调用 advisor
  2. Anthropic 在服务端运行 advisor model
  3. advisor 读取完整 transcript,包括 system、tools、历史 turns、tool results
  4. advisor 结果以 advisor_tool_result 返回 executor
  5. executor 继续生成

整个过程发生在一次 /v1/messages 请求中。


对 Agent 成本优化的启发

Advisor Tool 代表了一种新模式:不是简单在“便宜模型”和“贵模型”之间二选一,而是把强模型变成关键节点顾问。

设计 Agent 时可以考虑:

  • executor 用 Sonnet 处理常规步骤
  • advisor 用 Opus 处理架构规划、风险判断、方向纠偏
  • 对关键任务保留最高智能,但不让全部 token 都按最高单价生成

这对长期运行的 coding agent、research agent、workflow automation agent 都很有价值。


来源:Anthropic 官方文档 - Advisor tool | 整理:ClaudeEagle

相关文章推荐

深度Claude Computer Use 完整指南:桌面自动化、Agent Loop 与安全隔离实践Claude Computer Use 官方文档中文整理:功能定位、支持模型、beta header、工具配置、截图/鼠标/键盘控制、agent loop、参考实现、Docker 沙箱、网络 allowlist、prompt injection 风险和生产安全建议。2026/5/21深度Claude Tool Use 完整指南:Client Tools、Server Tools 与 Agent Loop 实战Claude Tool Use 官方文档中文整理:工具在哪里执行、client tools 和 server tools 的差异、tool_use/stop_reason/tool_result 的循环机制、strict schema、工具描述写法、成本构成与 Agent 安全设计。2026/5/21深度高级提示词工程完全指南 2026:CoT、Few-Shot 与 XML 结构化技巧面向 Claude API 开发者的高级提示词工程完整指南:Chain-of-Thought(思维链)的原理与触发方式、Few-Shot 示例选取策略、Zero-Shot CoT 触发词、XML 标签结构化输出控制(强制 JSON)、角色扮演提示的正确姿势、多步骤任务分解、Claude 专属优化技巧(正向指令 vs 禁止指令)以及提示词 A/B 测试框架。2026/3/21深度Claude API 错误码完全手册:所有错误类型、原因与解决方案Anthropic Claude API 错误码完整参考:authentication_error(401/403)、rate_limit_error(429)、invalid_request_error(400)、api_error(500)、overloaded_error(529)的详细说明,每种错误的常见触发原因、标准解决方案和代码示例(Python/Node.js),以及生产环境的错误处理最佳实践(区分可重试/不可重试错误)。2026/3/18深度Claude API 速率限制完全指南:限额说明、错误处理与优化策略Anthropic Claude API 速率限制完整说明:请求频率限制(RPM)、Token 用量限制(TPM/TPD)、不同使用层级的限额对比(免费层/Build/Scale/Enterprise)、429 错误的标准处理方式(指数退避重试)、提升限额的申请方法、Prompt Caching 和 Batch API 绕过限制的技巧,以及高并发场景的队列设计方案。2026/3/18深度Claude API 批量处理完全指南:Message Batches API 大规模数据处理实战Claude API Message Batches 完整教程:批量 API 原理、与普通 API 的区别(50% 成本折扣)、Python/Node.js 提交批次代码示例、进度追踪与结果获取、错误处理策略、并发批次管理,以及文档摘要/数据分类/批量翻译等典型大规模处理场景实战。2026/3/16