Fast Mode 是 Claude Code 为 Opus 4.6 提供的高速配置,让模型响应速度提升 2.5 倍,代价是更高的每 Token 费用。
什么是 Fast Mode?
Fast Mode 不是一个不同的模型——它使用相同的 Opus 4.6,通过不同的 API 配置优先保证速度而非成本效率。质量和能力完全相同,只是响应更快。
启用方式
/fast # 在 Claude Code CLI 中切换开/关
/fast # 在 VS Code 扩展中同样支持或者在 settings.json 中永久开启:
{
"fastMode": true
}启用后:
- 若当前模型不是 Opus 4.6,自动切换到 Opus 4.6
- 显示确认消息「Fast mode ON」
- 提示符旁出现
↯图标
关闭 Fast Mode 后,仍保持在 Opus 4.6,不会自动切回之前的模型。需要切换模型用 /model。
价格对比
| 模式 | 输入(每百万 Token) | 输出(每百万 Token) |
|---|---|---|
| Fast Mode(上下文 <200K) | $30 | $150 |
| Fast Mode(上下文 >200K) | $60 | $225 |
Fast Mode 兼容 1M Token 超长上下文窗口。
成本注意事项
中途切换代价高昂:在会话中途开启 Fast Mode,需要为整个对话上下文支付完整的 Fast Mode 未缓存输入 Token 价格——比一开始就开启更贵。
建议:如果计划使用 Fast Mode,在会话开始时就开启。
何时使用 Fast Mode
适合开启 Fast Mode:
- 快速迭代代码修改
- 实时调试会话
- 时间紧迫的工作
适合关闭 Fast Mode(用标准模式):
- 长时间自主任务(速度不如成本重要)
- 批量处理或 CI/CD 流水线
- 成本敏感的工作负载
Fast Mode vs 努力级别(Effort Level)
两者都能加快响应,但机制不同:
| 配置 | 效果 |
|---|---|
| Fast Mode | 相同质量,更低延迟,更高成本 |
| 低努力级别 | 更少思考时间,更快响应,复杂任务质量可能降低 |
可以组合使用:Fast Mode + 低努力级别,在简单任务上追求最高速度。
使用要求
- 不支持第三方云平台:Amazon Bedrock、Google Vertex AI、Microsoft Azure Foundry 均不可用。仅支持 Anthropic Console API 和 Claude 订阅计划的超额用量
- 需要超额用量(Extra Usage):账号必须开启超额计费
- 个人账号:在 Console 账单设置 中开启
- Teams/Enterprise:管理员在组织层面开启
- Teams/Enterprise 默认关闭:管理员必须在 Console 或 Claude AI 管理设置中显式启用
企业管控选项
完全禁用 Fast Mode
export CLAUDE_CODE_DISABLE_FAST_MODE=1要求每次会话重新开启(防止持续计费)
{
"fastModePerSessionOptIn": true
}设置后,每次新会话都从关闭状态开始,用户需要显式执行 /fast 才能开启。适合多人并发会话的团队,防止用户忘记关闭导致持续计费。
限速处理
Fast Mode 有独立的限速上限。触达限速或超额用量耗尽时:
- 自动降级到标准 Opus 4.6
↯图标变灰表示冷却中- 以标准速度和价格继续工作
- 冷却期结束后自动恢复 Fast Mode
如需手动关闭,再次运行 /fast。
Fast Mode 目前是研究预览功能,定价和可用性可能调整。
原文:Speed up responses with fast mode - Claude Code Docs | 来源:Anthropic 官方文档