实战

Claude Code 成本管理指南:$6/天基准、TPM 速率限制、10 大降本策略与 Agent 团队费用控制

Claude Code 成本管理完整指南:基准数据(平均 $6/天/开发者/90% 用户 $12 上限/Sonnet 月均 $100-200)、/cost 命令用法(API 用户适用/订阅用户用 /stats)、团队成本管理(Console 消费上限/Claude Code 专属工作区/LiteLLM 第三方追踪)、六档团队 TPM/RPM 速率限制推荐、Agent 团队 Token 倍数消耗(五个控制策略)、10 大降本策略(上下文管理/模型选择/MCP 减少/代码智能插件/Hooks 预处理/Skills 替代 CLAUDE.md/effort 调整/Subagent 委托/精确提示词/Plan 模式),以及 Haiku 后台 Token 消耗说明。

2026/3/95分钟 阅读ClaudeEagle

Claude Code 按 Token 计费,理解成本结构并合理配置,能在不影响效率的前提下大幅降低支出。

成本基准数据

指标数值
平均每开发者每日成本$6
90% 用户的每日上限$12
平均每月费用(Sonnet 4.6)$100–$200/人

实际差异很大,取决于运行实例数量和自动化使用程度。

查看成本

/cost 命令

显示当前会话的 API Token 用量统计:

总成本: $0.55 API 总时长: 6分钟 19.7秒 实际总时长: 6小时 33分钟 10.2秒 代码变更: 0 行新增,0 行删除

/cost 适用于 API 付费用户。Claude Max/Pro 订阅用户的成本已包含在订阅内,使用 /stats 查看用量模式更有意义。

团队成本管理

API 用量控制

  • Claude Console 为工作区设置消费上限
  • 首次用 Claude Console 账号认证时,自动创建「Claude Code」工作区
  • 该工作区专用于 Claude Code,无法创建 API Key

第三方提供商成本追踪

Bedrock、Vertex 和 Foundry 不向 Anthropic 发送指标,可使用 LiteLLM 追踪每个 Key 的支出(开源工具,非 Anthropic 官方,未经安全审计)。

团队速率限制推荐(TPM/RPM)

团队规模每用户 TPM每用户 RPM
1–5 人200k–300k5–7
5–20 人100k–150k2.5–3.5
20–50 人50k–75k1.25–1.75
50–100 人25k–35k0.62–0.87
100–500 人15k–20k0.37–0.47
500+ 人10k–15k0.25–0.35

团队越大,每用户分配 TPM 越低,因为大型团队并发用户比例更低。速率限制是组织级的,个别用户可以临时超出分配(其他人未使用时)。

注意:大型培训活动(如全公司同时上线培训)可能需要额外申请更高 TPM。

Agent 团队 Token 成本

Agent 团队(Agent Teams)会产生倍数级的 Token 消耗——每个成员拥有独立上下文窗口:

控制方法说明
使用 Sonnet 做 Teammate能力和成本的最佳平衡
保持小团队Token 用量近似与成员数成正比
聚焦 spawn promptCLAUDE.md/MCP/Skills 自动加载,spawn prompt 中每个词都消耗 Token
任务完成后清理即使空闲,活跃成员仍持续消耗 Token
默认禁用需设 CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 启用

10 大降低 Token 用量策略

1. 主动管理上下文

/cost # 随时查看用量 /clear # 切换不相关任务时清除历史 /compact Focus on code samples # 自定义压缩焦点

在 CLAUDE.md 中自定义压缩行为:

markdown
# Compact instructions
When compacting, focus on test output and code changes.

2. 选择合适的模型

  • Sonnet 处理绝大多数编码任务,成本低于 Opus
  • 只在复杂架构决策时切换到 Opus
  • Subagent 简单任务可指定 model: haiku

3. 减少 MCP 服务器开销

每个 MCP 服务器都向上下文添加工具定义(即使空闲):

/context # 查看上下文使用情况 /mcp # 禁用未使用的 MCP 服务器

优先用 CLI 工具(ghawsgcloud)替代 MCP 服务器,因为 CLI 不添加持久工具定义。

设置工具搜索阈值(超过后按需加载工具而非预加载):

bash
export ENABLE_TOOL_SEARCH=auto:5   # 超过 5% 上下文时启动按需加载

4. 安装代码智能插件

代码智能插件(LSP)提供精确符号导航,减少文件读取:

  • 「跳转到定义」替代 grep + 读多个候选文件
  • 编辑后自动报告类型错误,无需编译器运行

5. 用 Hooks 预处理数据

bash
# PreToolUse Hook:只传测试失败行给 Claude
if [[ "$cmd" =~ ^(npm test|pytest|go test) ]]; then
  filtered_cmd="$cmd 2>&1 | grep -A 5 -E '(FAIL|ERROR|error:)' | head -100"
fi

把 10,000 行日志过滤为几百行,减少数万 Token 消耗。

6. 把指令从 CLAUDE.md 移到 Skills

CLAUDE.md 每次会话都加载,Skills 只在激活时加载。把大块参考内容、示例移到 Skill 文件中,减少系统提示词体积。

7. 调整扩展思考(Extended Thinking)

扩展思考消耗更多 Token,根据任务复杂度调整 effort 级别:

bash
export CLAUDE_CODE_EFFORT_LEVEL=low    # 简单任务
export CLAUDE_CODE_EFFORT_LEVEL=high   # 复杂推理

8. 将冗长操作委托给 Subagents

让 Subagent 处理大量文件操作或日志分析,结果汇总后返回主会话,避免污染主上下文。

9. 写精确的提示词

含糊的提示词让 Claude 多次探索,消耗更多 Token。具体的提示词减少迭代:

# 低效 修复登录问题 # 高效 修复 src/auth/login.ts 第 47 行的 JWT 验证错误,错误信息:invalid signature

10. 高效处理复杂任务

对大任务使用 Plan 模式先规划,批准计划后再执行,避免多次重试浪费 Token。

后台 Token 消耗

Claude Code 的 Haiku 模型在后台负责以下功能:

  • 对话压缩(/compact
  • 自动记忆条目生成(Auto-memory)
  • 会话标题自动生成
  • Prompt Hooks

这部分消耗通常很小,但在频繁压缩或大量 Auto-memory 场景下会增加。


原文:Manage costs effectively - Claude Code Docs | 来源:Anthropic 官方文档

相关文章推荐

实战Claude Code 团队落地指南:从个人试用到工程团队规模化采用Claude Code 工程团队落地完整指南:三阶段方案(试点/建立最佳实践/规模化推广)、团队 settings.json 和 CLAUDE.md 配置模板、三类使用场景风险分级、AI 代码审查规范、ROI 量化计算方法、企业 API Key 管理与数据安全配置,以及四大常见阻力的应对策略。2026/3/14实战Claude Code 成本管理实战:如何将每日 AI 编程费用控制在预算内Claude Code 平均每位开发者每日成本约 6 美元,每月约 100-200 美元。本文详细介绍成本追踪工具(/cost、/stats)、团队 Rate Limit 配置、6 种降低 Token 消耗策略(.claudeignore、模型分级、上下文压缩、任务合并等),以及 Agent Teams 的成本控制方法。2026/2/27实战Claude Code 命令行工具开发实战:用 AI 快速构建专业 CLI 工具Claude Code 辅助命令行工具(CLI)开发的完整实战指南:Python Click/Typer、Go Cobra、Rust Clap 技术栈选型、用 Claude Code 生成完整 CLI 项目结构(参数解析/子命令/全局选项)、交互式提示和彩色输出、配置文件管理、Shell 自动补全生成、跨平台打包(PyInstaller/goreleaser),以及发布到 PyPI/npm/Homebrew 的完整流程。2026/3/26实战Claude Code Vue 3 实战完全指南:Composition API 开发到企业级前端工程化Claude Code 辅助 Vue 3 开发的完整实战指南:Composition API 组件生成(setup/ref/computed)、Pinia 状态管理代码生成、Vue Router 4 路由配置、TypeScript 类型定义生成(Props/Emits)、Composables 抽象、Vitest 单元测试生成、性能优化(虚拟滚动/v-memo),以及 Options API 迁移和响应式丢失问题排查的 Prompt 模板。2026/3/26实战Claude Code Django 实战完全指南:从模型设计到 REST API 开发全流程Claude Code 辅助 Django 开发的完整实战指南:用 Claude Code 生成 Django 项目结构和 Models(含迁移文件)、Django REST Framework(DRF)API 开发(Serializer/ViewSet/Router)、用户认证系统(JWT/Session/第三方登录)、Django ORM 查询优化(select_related/prefetch_related/annotate)、异步任务(Celery + Redis)、测试用例生成(pytest-django)、Docker 化部署,以及在现有 Django 项目中快速定位和修复 Bug 的 Prompt 技巧。2026/3/26实战Claude Code Rust 实战完全指南:从所有权错误到高性能系统编程Claude Code 辅助 Rust 开发的完整实战指南:用 Claude Code 理解 Rust 所有权(ownership)、借用(borrow)和生命周期(lifetime)报错、生成符合 Rust 惯用法的代码(使用 Result/Option/迭代器)、借助 Claude Code 快速上手异步 Rust(Tokio/async-await)、实战案例(CLI 工具/HTTP 客户端/WebAssembly 模块/系统命令行工具)、Cargo.toml 依赖管理优化、unsafe Rust 代码的安全审查、Rust 与 Python/Go 代码互操作,以及最有价值的 Rust Prompt 模板。2026/3/26