Claude Code 每次交互都会消耗 Token,成本因代码库大小、查询复杂度和对话长度而异。官方数据显示,平均每位开发者每天成本约为 6 美元,90% 的用户每日成本低于 12 美元。本文详细介绍如何追踪和优化 Claude Code 的使用成本。
成本基准参考
使用 Sonnet 4.6 模型时:
- 个人开发者:平均 6 美元/天,每月约 100-200 美元
- 90% 用户上限:每日成本低于 12 美元
- 成本变量:运行实例数量、是否在自动化流水线中使用
追踪使用成本
/cost 命令
查看当前会话的详细 Token 使用统计:
/cost输出示例:
Total cost: $0.55
Total duration (API): 6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes: 0 lines added, 0 lines removed
注意:
/cost命令显示 API Token 使用量,适用于 API 用户。Claude Max 和 Pro 订阅用户使用订阅包含的额度,可使用/stats查看使用模式。
/stats 命令
/stats显示当前会话的统计信息,包括 Token 使用趋势和会话持续时长。
团队成本管理
设置工作区支出上限
通过 Anthropic Console 设置团队预算:
- 登录 console.anthropic.com
- 进入工作区设置
- 设置每月支出限额
- 配置超额告警邮件通知
首次使用 Claude Console 账户认证 Claude Code 时,会自动创建名为「Claude Code」的工作区,提供集中的成本跟踪和管理功能。该工作区不支持创建 API key,专用于 Claude Code 认证和使用量追踪。
团队规模与 Rate Limit 建议
| 团队规模 | 每用户 TPM(Token/分钟) | 每用户 RPM(请求/分钟) |
|---|---|---|
| 1-5 人 | 200k-300k | 5-7 |
| 5-20 人 | 100k-150k | 2.5-3.5 |
| 20-50 人 | 50k-75k | 1.25-1.75 |
| 50-100 人 | 25k-35k | 0.62-0.87 |
| 100-500 人 | 15k-20k | 0.37-0.47 |
| 500+ 人 | 10k-15k | 0.25-0.35 |
每用户 TPM 随团队增大而减少,因为大团队中并发使用 Claude Code 的比例更低。Rate limit 在组织级别应用,当部分用户不活跃时,活跃用户可以暂时消耗更多资源。
如果预计会有高并发场景(如大规模培训课程),需要申请更高的 TPM 配额。
使用 LiteLLM 追踪成本
对于 AWS Bedrock、Google Vertex AI 等云端部署,可以使用 LiteLLM 实现按 key 追踪支出:
# 安装 LiteLLM proxy
pip install litellm[proxy]
# 配置 Claude Code 使用 LiteLLM 网关
export ANTHROPIC_BASE_URL=http://your-litellm-proxy:4000降低 Token 使用量的策略
1. 利用提示词缓存(Prompt Caching)
Claude Code 自动为重复内容(如系统提示词)启用提示词缓存,无需手动配置。缓存命中可以显著降低成本。
2. 自动上下文压缩(Auto-compaction)
Claude Code 会自动压缩长对话,在接近上下文窗口限制时对历史对话进行摘要,平衡成本和上下文完整性。
手动触发压缩:
/compact3. 选择合适的模型
| 任务类型 | 推荐模型 | 原因 |
|---|---|---|
| 代码搜索、文件浏览 | Haiku | 速度快,成本低 |
| 日常编码、代码审查 | Sonnet | 速度与能力平衡 |
| 复杂架构、安全审计 | Opus | 最强推理能力 |
通过 Subagent 配置不同模型:
---
name: code-explorer
model: claude-haiku-4-5
tools:
- Read
---
使用 Haiku 快速搜索代码库,降低探索成本。4. 控制上下文大小
使用 .claudeignore 文件(类似 .gitignore):
# .claudeignore
node_modules/
dist/
build/
*.min.js
*.map
*.lock
coverage/
.git/精确描述任务:不要让 Claude 扫描整个代码库,而是指定具体文件:
# 低效(Claude 会扫描大量文件)
> find all authentication related code
# 高效(指定范围)
> review the auth logic in src/auth/login.ts5. Agent Teams 成本控制
Agent Teams 每个成员都有独立上下文窗口,Token 使用量与团队规模成正比:
- 使用 Sonnet:协调任务的成本和能力最佳平衡
- 保持小团队:每增加一个成员都会显著增加 Token 消耗
- 精简启动提示词:避免在启动提示词中包含冗余信息
- 及时清理团队:空闲成员也会持续消耗 Token
- 按需启用:Agent Teams 默认禁用,通过
CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1启用
6. 使用 Hook 预处理请求
通过 UserPromptSubmit Hook 过滤低价值请求或添加上下文:
#!/bin/bash
# 在用户提交 Prompt 前检查
PROMPT=$(cat | jq -r '.prompt')
# 如果是简单的格式化请求,直接在本地处理
if echo "$PROMPT" | grep -q "format\|indent\|spacing"; then
echo "建议使用 Prettier 格式化工具代替 AI 处理简单格式化任务"
fi7. 非交互模式批量处理
将多个相关任务合并成一个请求,减少对话轮次:
# 低效:多次请求
claude -p "add JSDoc to getUserById"
claude -p "add JSDoc to updateUser"
claude -p "add JSDoc to deleteUser"
# 高效:一次请求
claude -p "add JSDoc comments to all exported functions in src/user.ts"成本监控告警设置
# 在 ~/.zshrc 或 ~/.bashrc 中添加
alias claude-with-cost='claude; echo "---"; claude -p "/cost"'
# 或通过 SessionEnd Hook 自动显示成本
# ~/.claude/settings.json
{
"hooks": {
"SessionEnd": [
{
"hooks": [
{
"type": "command",
"command": "echo '会话已结束,运行 /cost 查看本次成本'"
}
]
}
]
}
}成本优化总结
| 策略 | 预计节省 | 实施难度 |
|---|---|---|
| 使用 .claudeignore | 20-40% | 低 |
| 任务合并 | 15-30% | 低 |
| 模型分级(Haiku/Sonnet/Opus) | 30-60% | 中 |
| 控制 Agent Teams 规模 | 变量 | 中 |
| 提示词缓存(自动) | 20-50% | 无需操作 |
| 上下文压缩(自动) | 10-30% | 无需操作 |
通过综合运用以上策略,可以在保持高开发效率的同时,将 Claude Code 的使用成本降低 40-70%。
来源:Claude Code 官方文档 - Manage Costs 原文作者:Anthropic Team