想让 Claude Code 的响应速度翻倍?Fast Mode 是 Anthropic 推出的 Opus 4.6 高速配置,让模型响应速度提升 2.5 倍。不是换了个模型,而是同一个 Opus 4.6 使用了不同的 API 配置,优先保证速度而非成本效率。
核心信息
| 特性 | 说明 |
|---|---|
| 速度提升 | 2.5x |
| 模型 | Opus 4.6(同一个模型,同等质量) |
| 定价 | $30/150 MTok(输入/输出) |
| 最低版本 | Claude Code v2.1.36+ |
| 状态 | Research Preview |
如何开启
方式一:会话中切换
text
/fast按 Tab 确认,看到提示 "Fast mode ON" 即开启。提示符旁会出现 ↯ 图标。
方式二:配置文件
在用户设置中添加:
json
{
"fastMode": true
}💡 开启 Fast Mode 会自动切换到 Opus 4.6。关闭后仍停留在 Opus 4.6,需用
/model手动切换其他模型。
定价说明
| 模式 | 输入 (MTok) | 输出 (MTok) |
|---|---|---|
| Fast Mode Opus 4.6 | $30 | $150 |
关键:Fast Mode 在整个 1M Token 上下文窗口中使用统一定价。
避坑提示:在会话中途切换到 Fast Mode 时,整个对话上下文都会按 Fast Mode 定价重新计费。建议在会话开始时就开启 Fast Mode。
什么时候用?
适合 Fast Mode 的场景
- 快速迭代:写代码→测试→修改的快速循环
- 实时调试:需要快速响应的调试会话
- 紧急任务:有时间压力的工作
适合标准模式的场景
- 长时间自主任务:速度不是瓶颈
- 批处理或 CI/CD:不需要交互
- 成本敏感型工作负载
Fast Mode vs Effort Level
两者都能加快响应,但机制不同:
| 设置 | 效果 |
|---|---|
| Fast Mode | 同等质量,更低延迟,更高成本 |
| 降低 Effort Level | 减少思考时间,更快响应,复杂任务质量可能下降 |
组合使用:在简单任务上同时开启 Fast Mode + 低 Effort Level = 最大速度。
使用要求
- 不支持第三方云:不支持 Amazon Bedrock、Google Vertex AI、Microsoft Azure Foundry
- 需要 Extra Usage:账户必须启用额外用量计费
- Team/Enterprise:管理员需要在 Console 中显式启用
⚠️ Fast Mode 的 token 消耗直接计入 Extra Usage,不消耗计划中的包含额度。从第一个 token 开始就按 Fast Mode 费率计费。
管理员配置
Console API 客户
在 Claude Code preferences 中启用。
要求每次会话重新启用
通过 managed settings 配置:
json
{
"fastModeResetPerSession": true
}这样每次新会话都需要手动 /fast 开启,避免用户意外持续使用高价模式。
实用技巧
- 会话开始就决定:避免中途切换带来的额外成本
- 搭配子 Agent:让主会话用 Fast Mode 快速迭代,子 Agent 用标准模式做重活
- 监控成本:Fast Mode 比标准模式贵不少,注意控制使用时长
- VS Code 用户:在 VS Code 扩展中也可用
/fast切换
原文来源:Claude Code Fast Mode 文档 | 来源:Claude Code 官方文档