Fast Mode 是 Claude Code 针对 Opus 4.6 的高速配置,响应速度提升 2.5 倍,以更高的单 Token 成本换取更低延迟。适合需要快速迭代的交互式工作场景。
Fast Mode 目前处于研究预览阶段,功能、定价和可用性可能随反馈调整。
什么是 Fast Mode?
Fast Mode 不是独立模型,而是同一 Opus 4.6 模型的不同 API 配置——以更高的每 Token 成本优先响应速度。质量和能力完全相同,只是响应更快。
核心指标:速度提升 2.5 倍(相比标准 Opus 4.6)
开启/关闭 Fast Mode
/fast # 切换开/关
/fast on # 明确开启
/fast off # 明确关闭(也可再次 /fast)开启后:
- 如果当前是其他模型,自动切换到 Opus 4.6
- 显示确认消息「Fast mode ON」
- 提示框旁出现
↯图标
关闭后:仍然保持在 Opus 4.6,不回退到之前的模型。需要换模型请用 /model。
也可在 settings.json 中永久启用:
{ "fastMode": true }默认跨会话保持:开启 Fast Mode 后,它在后续会话中持续有效,直到手动关闭。
定价(研究预览期)
| 场景 | 输入(百万 Token) | 输出(百万 Token) |
|---|---|---|
| Fast Mode Opus 4.6(<200K Token) | $30 | $150 |
| Fast Mode Opus 4.6(>200K Token) | $60 | $225 |
Fast Mode 兼容 100 万 Token 扩展上下文窗口。
重要:会话中途开启的成本影响
中途开启 Fast Mode 时,整个对话历史的输入 Token 都按 Fast Mode(非缓存)价格计费,比从会话开始就启用 Fast Mode 要贵。最佳实践:在会话开始时就启用 Fast Mode,而不是中途切换。
Fast Mode vs Effort Level
两者都影响响应速度,但机制不同:
| 设置 | 效果 |
|---|---|
| Fast Mode | 相同模型质量,更低延迟,更高成本 |
| 低 Effort Level | 减少思考时间,更快响应,复杂任务质量可能下降 |
组合使用:Fast Mode + 低 Effort Level = 简单任务的最高速度。
export CLAUDE_CODE_EFFORT_LEVEL=low
/fast适用场景
开启 Fast Mode:
- 快速代码迭代(频繁小改动)
- 实时调试(需要即时反馈)
- 时间紧迫的工作(截止日期压力)
关闭 Fast Mode(标准模式):
- 长时间自主任务(速度不关键)
- 批处理或 CI/CD 流水线
- 成本敏感的工作负载
使用要求
| 要求 | 说明 |
|---|---|
| 账号类型 | 订阅计划(Pro/Max/Team/Enterprise)或 Claude Console API 用户 |
| Extra Usage | 必须启用,Fast Mode 直接计入 Extra Usage(不使用订阅额度) |
| 平台限制 | 不支持 Amazon Bedrock、Google Vertex AI、Microsoft Azure Foundry |
| 团队/企业 | Admin 需提前在 Console 或 Admin Settings 中启用 |
启用 Extra Usage:
- 个人账号:Console 账单设置
- Teams/Enterprise:Admin 为组织启用
企业配置
为组织启用
- Console(API 用户):Claude Code preferences
- Claude AI(Teams/Enterprise):Admin Settings → Claude Code
完全禁用
export CLAUDE_CODE_DISABLE_FAST_MODE=1要求每会话手动开启(per-session opt-in)
防止 Fast Mode 跨会话持久(控制成本):
// managed-settings.json
{ "fastModePerSessionOptIn": true }设置后,每个新会话开始时 Fast Mode 关闭,用户需手动 /fast 启用。用户偏好仍保存,移除此设置后恢复默认持久行为。
适合:运行多并发会话的组织,防止用户忘记关闭 Fast Mode 导致成本失控。
速率限制与自动回退
Fast Mode 有独立的速率限制。达到速率限制或 Extra Usage 耗尽时:
- 自动回退到标准 Opus 4.6
↯图标变灰,表示冷却中- 继续以标准速度和价格工作
- 冷却期结束后 Fast Mode 自动重新启用
不想等冷却期:运行 /fast 手动关闭。
原文:Speed up responses with fast mode - Claude Code Docs | 来源:Anthropic 官方文档