教程

Claude Code 费用完全指南:Token 成本、团队速率限制配置与 10 大省钱策略

Claude Code 费用完全指南:平均每人每天 $6(90% 低于 $12)、月均 $100-200(Sonnet)、/cost 命令查看用量、团队速率限制配置表(1-500+ 人规模的 TPM/RPM 建议)、Agent Teams 7 倍 Token 消耗说明,以及 10 大省钱策略(切换 Haiku/禁用 MCP 服务器/Hooks 预处理/Skills 替代 CLAUDE.md/减少扩展思考/Subagent 委托冗长操作/精确提示词)。

2026/3/55分钟 阅读ClaudeEagle

Claude Code 按 API Token 消耗计费。平均每位开发者每天约 $6,90% 的用户每天低于 $12。团队使用月均约 $100-200/人(Sonnet 4.6),具体取决于使用实例数和自动化程度。

查看当前费用

/cost

输出示例:

Total cost: $0.55 Total duration (API): 6m 19.7s Total duration (wall): 6h 33m 10.2s Total code changes: 0 lines added, 0 lines removed

也可以在状态栏中持续显示 Context 用量:

/config → Status Line → 启用 Context Window Usage

团队费用管理

Claude API 控制台

platform.claude.com 可以:

  • 设置工作区消费上限(Workspace Spend Limits)
  • 查看费用和用量报表(按用户、按工作区)

Bedrock/Vertex/Foundry 用户

Claude Code 不向你的云端发送指标。推荐使用开源工具 LiteLLM 按 Key 追踪消费(Anthropic 不附属也未审计此项目)。

团队速率限制建议(TPM = Token Per Minute,RPM = Request Per Minute)

团队规模每用户 TPM每用户 RPM
1-5 人200k-300k5-7
5-20 人100k-150k2.5-3.5
20-50 人50k-75k1.25-1.75
50-100 人25k-35k0.62-0.87
100-500 人15k-20k0.37-0.47
500+ 人10k-15k0.25-0.35

团队越大,每用户分配的 TPM 越低,因为大组织中同时使用的用户比例较低。速率限制在组织层面生效,个别用户在其他人不活跃时可以使用更多配额。

示例:200 人团队,每用户 20k TPM → 总计申请 4,000,000 TPM(200 × 20,000)。

Agent Teams 的 Token 消耗

Agent Teams(多 Claude Code 实例协作)会生成多个独立的 Context 窗口,Token 使用量约是标准会话的 7 倍(Plan Mode 下)。控制成本:

  • 用 Sonnet 运行队友(而非 Opus)
  • 保持团队规模小
  • 保持 Spawn 提示词聚焦
  • 工作完成后清理团队(活跃队友即使空闲也会消耗 Token)

10 大减少 Token 使用策略

1. 主动管理 Context

bash
# 任务切换时清空 Context
/clear

# 先重命名再清空,方便后续 /resume 找回
/rename auth-refactor
/clear

# 带重点的压缩
/compact Focus on code samples and API usage

2. 选对模型

场景推荐模型
日常编码任务Sonnet(性价比最佳)
复杂架构决策Opus(更强推理)
简单 Subagent 任务Haiku(最省钱)
/model # 会话中切换模型 /config # 设置默认模型

Subagent 配置中指定模型:

json
{ "model": "haiku" }

3. 减少 MCP 服务器开销

每个 MCP 服务器会向每次请求添加工具定义,即使空闲也消耗 Context。

  • 优先使用 CLI 工具ghawsgcloudsentry-cli 比 MCP 更省 Context(不添加持久工具定义)
  • 禁用未使用的服务器/mcp → 禁用不活跃的服务器
  • 自动工具搜索:MCP 工具描述超过 Context 窗口的 10% 时,Claude Code 自动延迟加载(可调低阈值):
    bash
    ENABLE_TOOL_SEARCH=auto:5 claude   # 5% 时触发

4. 安装代码智能插件

代码智能插件让 Claude 使用精确的符号导航,而非基于文本的搜索——一次「跳转到定义」替代了可能的多次 grep + 读取多个文件,大幅减少 Token 消耗。

5. 用 Hooks 预处理数据

Hooks 可以在 Claude 看到数据之前预处理,减少无效 Context 占用:

bash
# 示例:过滤测试输出,只保留失败行
# 原本可能数万行日志 → 只传给 Claude 数百行失败信息
json
{
  "hooks": {
    "PreToolUse": [{
      "matcher": "Bash",
      "hooks": [{
        "type": "command",
        "command": "~/.claude/hooks/filter-test-output.sh"
      }]
    }]
  }
}

6. 将详细指令从 CLAUDE.md 移入 Skills

CLAUDE.md 在每次会话开始时全量加载。如果包含只在特定工作流中才需要的详细指令(如 PR Review、数据库迁移),这些 Token 在做无关工作时也会被消耗。

将专项指令移入 Skills,只在调用时才加载。CLAUDE.md 目标控制在 500 行以内,只保留必要内容。

7. 调整扩展思考(Extended Thinking)

Extended Thinking 默认启用,预算 31,999 Token(思考 Token 按输出 Token 计费)。简单任务可降低:

bash
# 降低思考预算
MAX_THINKING_TOKENS=8000 claude

# 在 /config 中禁用扩展思考
# 或在 /model 中降低 Opus 4.6 的 effort level

8. 将冗长操作委托给 Subagents

运行测试、获取文档、处理日志文件会消耗大量 Context。委托给 Subagent,冗长输出留在 Subagent 的 Context 中,主对话只收到摘要。

9. 写精确的提示词

模糊提示 ❌精确提示 ✅
「改进这个代码库」「在 auth.ts 的 login 函数中添加输入验证」
「修复错误」「修复 src/api/user.ts 第 47 行的类型错误」

模糊请求触发广泛扫描;精确请求让 Claude 以最少的文件读取高效工作。

10. 对复杂任务使用 Plan Mode

在实现前进入 Plan Mode,让 Claude 探索代码库并提出方案,审批后再执行。避免方向错误导致的昂贵返工。

后台 Token 消耗

Claude Code 在空闲时也会消耗少量 Token(通常每次会话不超过 $0.04):

  • 对话摘要:为 claude --resume 功能生成历史会话摘要
  • 命令处理/cost 等命令可能触发状态检查请求

原文:Costs - Claude Code Docs | 来源:Anthropic 官方文档

相关文章推荐

教程深入理解 Claude Code 上下文窗口:每个操作消耗多少 Token,一目了然深入分析 Claude Code 200K 上下文窗口的使用方式:每个操作消耗多少 Token、什么被自动加载、如何优化上下文使用。含 7 个实用优化技巧。2026/4/7教程Claude Code 认证完全指南:五种登录方式、团队 SSO 配置与凭证安全管理Claude Code 认证完全指南:五种认证方式(个人 Pro/Max、Teams 推荐方案、Enterprise SSO/SAML/Domain Capture、Console API 计费、Bedrock/Vertex/Foundry 环境变量)、凭证 macOS Keychain 加密存储、apiKeyHelper 动态脚本(5 分钟/401 自动刷新/TTL_MS 自定义)、四级优先级、企业 MDM 托管设置统一下发,以及五大常见问题排查。2026/3/7教程Claude Code Fast Mode 完全解析:Opus 4.6 提速 2.5 倍、成本权衡与企业管控Claude Code Fast Mode 完全解析:Opus 4.6 提速 2.5 倍的原理、/fast 命令启用方式、分层价格(<200K/$30 vs >200K/$60 输入)、中途切换的成本陷阱、Fast Mode vs 努力级别的区别、使用要求(不支持第三方云),以及企业 fastModePerSessionOptIn 管控和限速自动降级机制。2026/3/3教程Claude Code Skills 进阶:动态上下文注入、路径限定激活和 Subagent 集成深度指南Claude Code Skills 三个高级特性深度指南:动态上下文注入(!! 命令预处理原理、内联和多行语法、实战健康检查 Skill 含 6 个命令块、安全注意事项);路径限定自动激活(TypeScript 严格模式/SQL 安全/React 组件三个实战示例);context: fork 在 Subagent 运行(适用场景判断、agent 类型选择);以及三种特性组合的完整 PR 审查 Skill 示例。2026/5/10教程Claude Code Skills 官方完整指南:从入门到高级模式的权威教程Claude Code Skills 官方文档完整中文整理:Skills vs CLAUDE.md 核心区别;目录结构;存储位置和优先级;实时变更检测和 Monorepo 自动发现;完整 Frontmatter 字段参考(20+字段);字符串替换(动态参数);内容类型(参考类 vs 任务类);调用控制表;Skill 内容生命周期(压缩保留机制);三个高级模式(动态注入/路径限定/Subagent运行);以及内置 Bundled Skills 和权限控制方法。2026/5/10教程Claude Code Slack 集成完整指南:团队协作、CI 通知和权限管理Claude Code Slack 集成完整指南:5 大核心功能(频道触发任务/代码问答/CI 通知/PR 审查/Routines 结果推送);安装配置步骤;4 个权限等级(read/write/execute/pr)及频道级配置;人工审批工作流;GitHub Actions + Slack 通知自动化;4 个团队协作场景(新人上手/PM 提需求/频道分工规范/结构化请求模板);以及官方 Slack 集成 vs OpenClaw 方案的对比。2026/5/8