Claude Code 成本管理实战：如何将每日 AI 编程费用控制在预算内

Claude Code 每次交互都会消耗 Token，成本因代码库大小、查询复杂度和对话长度而异。官方数据显示，平均每位开发者每天成本约为 6 美元，90% 的用户每日成本低于 12 美元。本文详细介绍如何追踪和优化 Claude Code 的使用成本。

成本基准参考

使用 Sonnet 4.6 模型时：

个人开发者：平均 6 美元/天，每月约 100-200 美元
90% 用户上限：每日成本低于 12 美元
成本变量：运行实例数量、是否在自动化流水线中使用

追踪使用成本

/cost 命令

查看当前会话的详细 Token 使用统计：

text

/cost

输出示例：

Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

注意：/cost 命令显示 API Token 使用量，适用于 API 用户。Claude Max 和 Pro 订阅用户使用订阅包含的额度，可使用 /stats 查看使用模式。

/stats 命令

text

/stats

显示当前会话的统计信息，包括 Token 使用趋势和会话持续时长。

团队成本管理

设置工作区支出上限

通过 Anthropic Console 设置团队预算：

登录 console.anthropic.com
进入工作区设置
设置每月支出限额
配置超额告警邮件通知

首次使用 Claude Console 账户认证 Claude Code 时，会自动创建名为「Claude Code」的工作区，提供集中的成本跟踪和管理功能。该工作区不支持创建 API key，专用于 Claude Code 认证和使用量追踪。

团队规模与 Rate Limit 建议

团队规模	每用户 TPM（Token/分钟）	每用户 RPM（请求/分钟）
1-5 人	200k-300k	5-7
5-20 人	100k-150k	2.5-3.5
20-50 人	50k-75k	1.25-1.75
50-100 人	25k-35k	0.62-0.87
100-500 人	15k-20k	0.37-0.47
500+ 人	10k-15k	0.25-0.35

每用户 TPM 随团队增大而减少，因为大团队中并发使用 Claude Code 的比例更低。Rate limit 在组织级别应用，当部分用户不活跃时，活跃用户可以暂时消耗更多资源。

如果预计会有高并发场景（如大规模培训课程），需要申请更高的 TPM 配额。

使用 LiteLLM 追踪成本

对于 AWS Bedrock、Google Vertex AI 等云端部署，可以使用 LiteLLM 实现按 key 追踪支出：

bash

# 安装 LiteLLM proxy
pip install litellm[proxy]

# 配置 Claude Code 使用 LiteLLM 网关
export ANTHROPIC_BASE_URL=http://your-litellm-proxy:4000

降低 Token 使用量的策略

1. 利用提示词缓存（Prompt Caching）

Claude Code 自动为重复内容（如系统提示词）启用提示词缓存，无需手动配置。缓存命中可以显著降低成本。

2. 自动上下文压缩（Auto-compaction）

Claude Code 会自动压缩长对话，在接近上下文窗口限制时对历史对话进行摘要，平衡成本和上下文完整性。

手动触发压缩：

text

/compact

3. 选择合适的模型

任务类型	推荐模型	原因
代码搜索、文件浏览	Haiku	速度快，成本低
日常编码、代码审查	Sonnet	速度与能力平衡
复杂架构、安全审计	Opus	最强推理能力

通过 Subagent 配置不同模型：

markdown

---
name: code-explorer
model: claude-haiku-4-5
tools:
  - Read
---
使用 Haiku 快速搜索代码库，降低探索成本。

4. 控制上下文大小

使用 .claudeignore 文件（类似 .gitignore）：

bash

# .claudeignore
node_modules/
dist/
build/
*.min.js
*.map
*.lock
coverage/
.git/

精确描述任务：不要让 Claude 扫描整个代码库，而是指定具体文件：

text

# 低效（Claude 会扫描大量文件）
> find all authentication related code

# 高效（指定范围）
> review the auth logic in src/auth/login.ts

5. Agent Teams 成本控制

Agent Teams 每个成员都有独立上下文窗口，Token 使用量与团队规模成正比：

使用 Sonnet：协调任务的成本和能力最佳平衡
保持小团队：每增加一个成员都会显著增加 Token 消耗
精简启动提示词：避免在启动提示词中包含冗余信息
及时清理团队：空闲成员也会持续消耗 Token
按需启用：Agent Teams 默认禁用，通过 CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 启用

6. 使用 Hook 预处理请求

通过 UserPromptSubmit Hook 过滤低价值请求或添加上下文：

bash

#!/bin/bash
# 在用户提交 Prompt 前检查
PROMPT=$(cat | jq -r '.prompt')

# 如果是简单的格式化请求，直接在本地处理
if echo "$PROMPT" | grep -q "format\|indent\|spacing"; then
  echo "建议使用 Prettier 格式化工具代替 AI 处理简单格式化任务"
fi

7. 非交互模式批量处理

将多个相关任务合并成一个请求，减少对话轮次：

bash

# 低效：多次请求
claude -p "add JSDoc to getUserById"
claude -p "add JSDoc to updateUser"
claude -p "add JSDoc to deleteUser"

# 高效：一次请求
claude -p "add JSDoc comments to all exported functions in src/user.ts"

成本监控告警设置

bash

# 在 ~/.zshrc 或 ~/.bashrc 中添加
alias claude-with-cost='claude; echo "---"; claude -p "/cost"'

# 或通过 SessionEnd Hook 自动显示成本
# ~/.claude/settings.json
{
  "hooks": {
    "SessionEnd": [
      {
        "hooks": [
          {
            "type": "command",
            "command": "echo '会话已结束，运行 /cost 查看本次成本'"
          }
        ]
      }
    ]
  }
}

成本优化总结

策略	预计节省	实施难度
使用 .claudeignore	20-40%	低
任务合并	15-30%	低
模型分级（Haiku/Sonnet/Opus）	30-60%	中
控制 Agent Teams 规模	变量	中
提示词缓存（自动）	20-50%	无需操作
上下文压缩（自动）	10-30%	无需操作

通过综合运用以上策略，可以在保持高开发效率的同时，将 Claude Code 的使用成本降低 40-70%。

来源：Claude Code 官方文档 - Manage Costs 原文作者：Anthropic Team

成本基准参考#

追踪使用成本#

/cost 命令#

/stats 命令#

团队成本管理#

设置工作区支出上限#

团队规模与 Rate Limit 建议#

使用 LiteLLM 追踪成本#

降低 Token 使用量的策略#

1. 利用提示词缓存（Prompt Caching）#

2. 自动上下文压缩（Auto-compaction）#

3. 选择合适的模型#

4. 控制上下文大小#

5. Agent Teams 成本控制#

6. 使用 Hook 预处理请求#

7. 非交互模式批量处理#

成本监控告警设置#

成本优化总结#

相关文章推荐

成本基准参考

追踪使用成本

/cost 命令

/stats 命令

团队成本管理

设置工作区支出上限

团队规模与 Rate Limit 建议

使用 LiteLLM 追踪成本

降低 Token 使用量的策略

1. 利用提示词缓存（Prompt Caching）

2. 自动上下文压缩（Auto-compaction）

3. 选择合适的模型

4. 控制上下文大小

5. Agent Teams 成本控制

6. 使用 Hook 预处理请求

7. 非交互模式批量处理

成本监控告警设置

成本优化总结