用了 Claude Code 但对账单感到震惊?这篇文章帮你彻底搞清楚 Claude Code 的定价逻辑,以及如何在保持生产力的同时控制成本。
计划对比
| 计划 | 月费 | 包含的 Claude Code 用量 | 适用场景 |
|---|---|---|---|
| Pro | $20/月 | 有限额度 | 轻度使用 |
| Max 5x | $100/月 | 5x Pro 的用量 | 日常开发 |
| Max 20x | $200/月 | 20x Pro 的用量 | 重度开发 |
| Team | $30/人/月 | 团队额度 | 团队使用 |
| Enterprise | 自定义 | 自定义 | 大规模使用 |
| API Console | 按量 | 无包含额度 | 按需使用 |
Token 消耗解析
什么消耗 Token?
| 操作 | 大约消耗 | 说明 |
|---|---|---|
| 启动加载 | ~8,000 | 系统提示 + CLAUDE.md + 环境信息 |
| 读取一个文件 | 1,000-3,000 | 取决于文件大小 |
| 编辑文件 | ~400 | diff 内容 |
| 运行命令 | 500-2,000 | 取决于输出长度 |
| Claude 回复 | 200-1,000 | 输出 Token(最贵) |
上下文重发机制
重要:Claude 的每次回复都需要将整个对话历史作为输入重新发送。这意味着:
- 第 1 次回复:发送 ~8,000 Token
- 第 5 次回复:可能发送 ~30,000 Token
- 第 20 次回复:可能发送 ~100,000 Token
长对话的后半段,每次交互的成本远高于开始时。
成本控制策略
1. 使用 /compact 压缩对话
在长会话中定期运行 /compact,将历史对话压缩为摘要,减少每次重发的 Token 数。
2. 选择合适的模型
| 任务类型 | 推荐模型 | 原因 |
|---|---|---|
| 简单修改 | Haiku | 快、便宜 |
| 日常编码 | Sonnet | 性价比最高 |
| 复杂架构 | Opus | 质量最好 |
用 /model 随时切换。
3. 精确提示,减少探索
text
# ❌ 模糊提示(Claude 需要大量读文件)
修复登录 bug
# ✅ 精确提示(Claude 直接定位)
修复 src/auth/login.ts 第 42 行的
token 刷新竞态条件4. 用子 Agent 处理研究任务
让子 Agent 做大量文件搜索,只返回精炼结果到主会话,避免主会话上下文膨胀。
5. 新任务新会话
如果任务之间没有关联,开新会话比继续旧会话便宜——因为旧会话每次都要重发所有历史。
6. 控制 Fast Mode 使用
| 模式 | 输入 (MTok) | 输出 (MTok) |
|---|---|---|
| 标准 Opus | 标准定价 | 标准定价 |
| Fast Mode | $30 | $150 |
Fast Mode 贵不少。只在需要速度的交互式工作中使用。
7. 设置 Effort Level
text
/effort low # 简单任务
/effort medium # 默认
/effort high # 复杂任务低 effort 减少思考 Token,适合简单修改。
8. 监控用量
- 会话中输入
/cost查看当前会话消耗 - 在 Console 中查看总体用量
- Team/Enterprise 可设置预算警告
典型消耗场景
简单 Bug 修复(~15 分钟)
- 文件读取:3 个文件 (~6,000 Token)
- 分析 + 修改 (~2,000 Token)
- 测试 (~1,500 Token)
- 总计输入:~20,000 Token,输出 ~2,000 Token
功能开发(~1 小时)
- 文件读取:10-15 个文件 (~25,000 Token)
- 多轮交互,上下文逐渐增长
- 总计输入:~150,000 Token,输出 ~15,000 Token
大型重构(~半天)
- 大量文件读取和修改
- 可能触发 /compact 2-3 次
- 总计输入:~500,000+ Token,输出 ~50,000 Token
- 建议:拆分为多个子任务/子 Agent
最佳实践总结
- 短会话 > 长会话(减少上下文重发)
- 精确提示 > 模糊提示(减少探索)
- 合适的模型 > 最贵的模型(不是所有任务需要 Opus)
- 子 Agent > 主会话搜索(减少主会话上下文膨胀)
- 定期 /compact > 等到满(主动管理上下文)
综合整理自 Claude Code 官方定价和文档 | 来源:Claude Code / Anthropic