教程

Claude Code 费用完全指南:Token 成本、团队速率限制配置与 10 大省钱策略

Claude Code 费用完全指南:平均每人每天 $6(90% 低于 $12)、月均 $100-200(Sonnet)、/cost 命令查看用量、团队速率限制配置表(1-500+ 人规模的 TPM/RPM 建议)、Agent Teams 7 倍 Token 消耗说明,以及 10 大省钱策略(切换 Haiku/禁用 MCP 服务器/Hooks 预处理/Skills 替代 CLAUDE.md/减少扩展思考/Subagent 委托冗长操作/精确提示词)。

2026/3/55分钟 阅读ClaudeEagle

Claude Code 按 API Token 消耗计费。平均每位开发者每天约 $6,90% 的用户每天低于 $12。团队使用月均约 $100-200/人(Sonnet 4.6),具体取决于使用实例数和自动化程度。

查看当前费用

/cost

输出示例:

Total cost: $0.55 Total duration (API): 6m 19.7s Total duration (wall): 6h 33m 10.2s Total code changes: 0 lines added, 0 lines removed

也可以在状态栏中持续显示 Context 用量:

/config → Status Line → 启用 Context Window Usage

团队费用管理

Claude API 控制台

platform.claude.com 可以:

  • 设置工作区消费上限(Workspace Spend Limits)
  • 查看费用和用量报表(按用户、按工作区)

Bedrock/Vertex/Foundry 用户

Claude Code 不向你的云端发送指标。推荐使用开源工具 LiteLLM 按 Key 追踪消费(Anthropic 不附属也未审计此项目)。

团队速率限制建议(TPM = Token Per Minute,RPM = Request Per Minute)

团队规模每用户 TPM每用户 RPM
1-5 人200k-300k5-7
5-20 人100k-150k2.5-3.5
20-50 人50k-75k1.25-1.75
50-100 人25k-35k0.62-0.87
100-500 人15k-20k0.37-0.47
500+ 人10k-15k0.25-0.35

团队越大,每用户分配的 TPM 越低,因为大组织中同时使用的用户比例较低。速率限制在组织层面生效,个别用户在其他人不活跃时可以使用更多配额。

示例:200 人团队,每用户 20k TPM → 总计申请 4,000,000 TPM(200 × 20,000)。

Agent Teams 的 Token 消耗

Agent Teams(多 Claude Code 实例协作)会生成多个独立的 Context 窗口,Token 使用量约是标准会话的 7 倍(Plan Mode 下)。控制成本:

  • 用 Sonnet 运行队友(而非 Opus)
  • 保持团队规模小
  • 保持 Spawn 提示词聚焦
  • 工作完成后清理团队(活跃队友即使空闲也会消耗 Token)

10 大减少 Token 使用策略

1. 主动管理 Context

bash
# 任务切换时清空 Context
/clear

# 先重命名再清空,方便后续 /resume 找回
/rename auth-refactor
/clear

# 带重点的压缩
/compact Focus on code samples and API usage

2. 选对模型

场景推荐模型
日常编码任务Sonnet(性价比最佳)
复杂架构决策Opus(更强推理)
简单 Subagent 任务Haiku(最省钱)
/model # 会话中切换模型 /config # 设置默认模型

Subagent 配置中指定模型:

json
{ "model": "haiku" }

3. 减少 MCP 服务器开销

每个 MCP 服务器会向每次请求添加工具定义,即使空闲也消耗 Context。

  • 优先使用 CLI 工具ghawsgcloudsentry-cli 比 MCP 更省 Context(不添加持久工具定义)
  • 禁用未使用的服务器/mcp → 禁用不活跃的服务器
  • 自动工具搜索:MCP 工具描述超过 Context 窗口的 10% 时,Claude Code 自动延迟加载(可调低阈值):
    bash
    ENABLE_TOOL_SEARCH=auto:5 claude   # 5% 时触发

4. 安装代码智能插件

代码智能插件让 Claude 使用精确的符号导航,而非基于文本的搜索——一次「跳转到定义」替代了可能的多次 grep + 读取多个文件,大幅减少 Token 消耗。

5. 用 Hooks 预处理数据

Hooks 可以在 Claude 看到数据之前预处理,减少无效 Context 占用:

bash
# 示例:过滤测试输出,只保留失败行
# 原本可能数万行日志 → 只传给 Claude 数百行失败信息
json
{
  "hooks": {
    "PreToolUse": [{
      "matcher": "Bash",
      "hooks": [{
        "type": "command",
        "command": "~/.claude/hooks/filter-test-output.sh"
      }]
    }]
  }
}

6. 将详细指令从 CLAUDE.md 移入 Skills

CLAUDE.md 在每次会话开始时全量加载。如果包含只在特定工作流中才需要的详细指令(如 PR Review、数据库迁移),这些 Token 在做无关工作时也会被消耗。

将专项指令移入 Skills,只在调用时才加载。CLAUDE.md 目标控制在 500 行以内,只保留必要内容。

7. 调整扩展思考(Extended Thinking)

Extended Thinking 默认启用,预算 31,999 Token(思考 Token 按输出 Token 计费)。简单任务可降低:

bash
# 降低思考预算
MAX_THINKING_TOKENS=8000 claude

# 在 /config 中禁用扩展思考
# 或在 /model 中降低 Opus 4.6 的 effort level

8. 将冗长操作委托给 Subagents

运行测试、获取文档、处理日志文件会消耗大量 Context。委托给 Subagent,冗长输出留在 Subagent 的 Context 中,主对话只收到摘要。

9. 写精确的提示词

模糊提示 ❌精确提示 ✅
「改进这个代码库」「在 auth.ts 的 login 函数中添加输入验证」
「修复错误」「修复 src/api/user.ts 第 47 行的类型错误」

模糊请求触发广泛扫描;精确请求让 Claude 以最少的文件读取高效工作。

10. 对复杂任务使用 Plan Mode

在实现前进入 Plan Mode,让 Claude 探索代码库并提出方案,审批后再执行。避免方向错误导致的昂贵返工。

后台 Token 消耗

Claude Code 在空闲时也会消耗少量 Token(通常每次会话不超过 $0.04):

  • 对话摘要:为 claude --resume 功能生成历史会话摘要
  • 命令处理/cost 等命令可能触发状态检查请求

原文:Costs - Claude Code Docs | 来源:Anthropic 官方文档

相关文章推荐

教程Claude Code 认证完全指南:五种登录方式、团队 SSO 配置与凭证安全管理Claude Code 认证完全指南:五种认证方式(个人 Pro/Max、Teams 推荐方案、Enterprise SSO/SAML/Domain Capture、Console API 计费、Bedrock/Vertex/Foundry 环境变量)、凭证 macOS Keychain 加密存储、apiKeyHelper 动态脚本(5 分钟/401 自动刷新/TTL_MS 自定义)、四级优先级、企业 MDM 托管设置统一下发,以及五大常见问题排查。2026/3/7教程Claude Code Fast Mode 完全解析:Opus 4.6 提速 2.5 倍、成本权衡与企业管控Claude Code Fast Mode 完全解析:Opus 4.6 提速 2.5 倍的原理、/fast 命令启用方式、分层价格(<200K/$30 vs >200K/$60 输入)、中途切换的成本陷阱、Fast Mode vs 努力级别的区别、使用要求(不支持第三方云),以及企业 fastModePerSessionOptIn 管控和限速自动降级机制。2026/3/3教程Claude Code MCP 完整使用指南:安装配置主流 MCP 服务器扩展 AI 能力Claude Code MCP(Model Context Protocol)完整使用指南:MCP 是什么(AI 工具扩展标准)、claude mcp 命令管理服务器(add/remove/list)、主流 MCP 服务器安装配置(文件系统/GitHub/PostgreSQL/Brave Search/Slack)、本地 stdio 与远程 SSE 两种连接方式、MCP 服务器安全配置、在 CLAUDE.md 中声明 MCP 工具使用规范,以及自定义 MCP 服务器的快速开发入门。2026/3/18教程Claude Code 输出格式控制完全指南:JSON、流式、结构化输出使用方法Claude Code 和 Claude API 输出格式完整控制指南:--output-format 参数(text/json/stream-json)、非交互模式(-p)的输出控制、结构化 JSON 输出(--json-schema 字段约束)、流式输出(Server-Sent Events)的处理方式、include-partial-messages 流式渐进显示、以及 CI/CD 管道中解析 JSON 输出的实用技巧。2026/3/18教程Claude Code 项目初始化最佳实践:新项目 5 分钟搭建完美 AI 编程环境Claude Code 新项目最佳初始化流程:CLAUDE.md 标准模板(项目背景/技术栈/代码规范/禁止操作)、.claudeignore 初始配置、.claude/commands/ 常用命令预置、settings.json 权限与模型设置、--init 命令的自动化初始化、项目级 vs 全局配置的优先级说明,以及不同类型项目(Web前端/后端API/全栈/开源库)的专项初始化模板。2026/3/18教程Claude Code 权限管理完全指南:精确控制 AI 能执行哪些操作Claude Code 权限系统完整解析:四种权限模式(default/acceptEdits/bypassPermissions/plan)、--allowedTools 和 --disallowedTools 精确工具控制、Bash 命令白名单语法(通配符匹配)、settings.json 持久化权限配置、CLAUDE.md 中的权限规则声明、CI/CD 自动化场景的权限配置、以及如何在效率和安全之间找到平衡点。2026/3/18