教程

Claude Code Fast Mode 深度解析:2.5x 速度提升、定价、速率限制回退与企业 per-session 控制

Claude Code Fast Mode 完整指南:2.5 倍速度提升原理(相同 Opus 4.6/不同 API 配置)、/fast 开关命令(自动切换到 Opus 4.6/↯ 图标/跨会话持久)、定价(<200K $30/$150;>200K $60/$225)、会话中途开启的成本影响(整段历史按 Fast Mode 价格)及最佳实践(会话开始时启用)、Fast Mode vs Effort Level 对比(组合使用最高速度)、适用和不适用场景、三大使用要求(账号类型/Extra Usage/平台限制 Bedrock 不支持)、企业配置(Console 启用/DISABLE_FAST_MODE 禁用/fastModePerSessionOptIn per-session 控制),以及速率限制自动回退机制(↯ 变灰/冷却后自动重启)。

2026/3/94分钟 阅读ClaudeEagle

Fast Mode 是 Claude Code 针对 Opus 4.6 的高速配置,响应速度提升 2.5 倍,以更高的单 Token 成本换取更低延迟。适合需要快速迭代的交互式工作场景。

Fast Mode 目前处于研究预览阶段,功能、定价和可用性可能随反馈调整。

什么是 Fast Mode?

Fast Mode 不是独立模型,而是同一 Opus 4.6 模型的不同 API 配置——以更高的每 Token 成本优先响应速度。质量和能力完全相同,只是响应更快。

核心指标:速度提升 2.5 倍(相比标准 Opus 4.6)

开启/关闭 Fast Mode

bash
/fast          # 切换开/关
/fast on       # 明确开启
/fast off      # 明确关闭(也可再次 /fast)

开启后:

  • 如果当前是其他模型,自动切换到 Opus 4.6
  • 显示确认消息「Fast mode ON」
  • 提示框旁出现 图标

关闭后:仍然保持在 Opus 4.6,不回退到之前的模型。需要换模型请用 /model

也可在 settings.json 中永久启用:

json
{ "fastMode": true }

默认跨会话保持:开启 Fast Mode 后,它在后续会话中持续有效,直到手动关闭。

定价(研究预览期)

场景输入(百万 Token)输出(百万 Token)
Fast Mode Opus 4.6(<200K Token)$30$150
Fast Mode Opus 4.6(>200K Token)$60$225

Fast Mode 兼容 100 万 Token 扩展上下文窗口

重要:会话中途开启的成本影响

中途开启 Fast Mode 时,整个对话历史的输入 Token 都按 Fast Mode(非缓存)价格计费,比从会话开始就启用 Fast Mode 要贵。最佳实践:在会话开始时就启用 Fast Mode,而不是中途切换。

Fast Mode vs Effort Level

两者都影响响应速度,但机制不同:

设置效果
Fast Mode相同模型质量,更低延迟,更高成本
低 Effort Level减少思考时间,更快响应,复杂任务质量可能下降

组合使用:Fast Mode + 低 Effort Level = 简单任务的最高速度。

bash
export CLAUDE_CODE_EFFORT_LEVEL=low
/fast

适用场景

开启 Fast Mode

  • 快速代码迭代(频繁小改动)
  • 实时调试(需要即时反馈)
  • 时间紧迫的工作(截止日期压力)

关闭 Fast Mode(标准模式)

  • 长时间自主任务(速度不关键)
  • 批处理或 CI/CD 流水线
  • 成本敏感的工作负载

使用要求

要求说明
账号类型订阅计划(Pro/Max/Team/Enterprise)或 Claude Console API 用户
Extra Usage必须启用,Fast Mode 直接计入 Extra Usage(不使用订阅额度)
平台限制不支持 Amazon Bedrock、Google Vertex AI、Microsoft Azure Foundry
团队/企业Admin 需提前在 Console 或 Admin Settings 中启用

启用 Extra Usage:

企业配置

为组织启用

  • Console(API 用户)Claude Code preferences
  • Claude AI(Teams/Enterprise):Admin Settings → Claude Code

完全禁用

bash
export CLAUDE_CODE_DISABLE_FAST_MODE=1

要求每会话手动开启(per-session opt-in)

防止 Fast Mode 跨会话持久(控制成本):

json
// managed-settings.json
{ "fastModePerSessionOptIn": true }

设置后,每个新会话开始时 Fast Mode 关闭,用户需手动 /fast 启用。用户偏好仍保存,移除此设置后恢复默认持久行为。

适合:运行多并发会话的组织,防止用户忘记关闭 Fast Mode 导致成本失控。

速率限制与自动回退

Fast Mode 有独立的速率限制。达到速率限制或 Extra Usage 耗尽时:

  1. 自动回退到标准 Opus 4.6
  2. 图标变灰,表示冷却中
  3. 继续以标准速度和价格工作
  4. 冷却期结束后 Fast Mode 自动重新启用

不想等冷却期:运行 /fast 手动关闭。


原文:Speed up responses with fast mode - Claude Code Docs | 来源:Anthropic 官方文档

相关文章推荐

教程Claude Code 模型选择指南:Opus、Sonnet、Haiku 怎么配、什么时候换Claude Code 模型配置完整指南:Opus/Sonnet/Haiku 三模型适用场景、opusplan 双模式别名、超长上下文(1m)、成本对比、会话动态切换、企业限制配置,附任务-模型决策树。2026/3/14教程Claude Code 模型配置完全指南:opusplan 混合模式、effort 级别、1M 上下文与第三方 Model 固定Claude Code 模型配置完全指南:6 个模型别名(default/sonnet/opus/haiku/sonnet[1m]/opusplan 混合模式)、四种设置优先级(/model 会话 > --model 启动 > ANTHROPIC_MODEL 环境变量 > settings.json)、default 按账号类型说明(Max/Team Premium 默认 Opus/Pro/Standard 默认 Sonnet)、opusplan 规划执行混合模式原理、三级 Effort 级别(low/medium/high 及自适应推理关闭方式)、1M Token 上下文(Beta 可用性/200K 计费门槛/DISABLE_1M_CONTEXT 禁用)、企业 availableModels 白名单、四个模型别名环境变量,以及第三方部署(Bedrock/Vertex/Foundry)固定版本的重要操作和升级流程。2026/3/9教程Claude Code Desktop 深度使用指南:并行 Git Worktree、CI/PR 监控、应用预览与企业配置Claude Code Desktop 深度指南:开始会话四项配置(环境 Local/Remote/SSH/模型/权限模式)、四种权限模式对比(Ask/Auto accept/Plan/Bypass 及推荐工作流)、应用预览(自动验证/持久化 Cookie/launch.json 配置)、可视化 Diff 审查(注释+Cmd+Enter 批量提交)和代码 Review(高信号问题聚焦)、GitHub PR 监控(Auto-fix/Auto-merge/gh CLI 要求)、并行 Git Worktree 会话(独立隔离/分支前缀/设置更改 Worktree 路径)、远程云端会话(关机继续/多仓库/iOS App 监控)、SSH 会话、Desktop 持久定时任务(跨会话/频率/错过执行策略),以及企业配置(Admin 控制/MDM/SSO)和常见问题排查。2026/3/8教程Claude Code Fast Mode 完全解析:Opus 4.6 提速 2.5 倍、成本权衡与企业管控Claude Code Fast Mode 完全解析:Opus 4.6 提速 2.5 倍的原理、/fast 命令启用方式、分层价格(<200K/$30 vs >200K/$60 输入)、中途切换的成本陷阱、Fast Mode vs 努力级别的区别、使用要求(不支持第三方云),以及企业 fastModePerSessionOptIn 管控和限速自动降级机制。2026/3/3教程Claude Code MCP 完整使用指南:安装配置主流 MCP 服务器扩展 AI 能力Claude Code MCP(Model Context Protocol)完整使用指南:MCP 是什么(AI 工具扩展标准)、claude mcp 命令管理服务器(add/remove/list)、主流 MCP 服务器安装配置(文件系统/GitHub/PostgreSQL/Brave Search/Slack)、本地 stdio 与远程 SSE 两种连接方式、MCP 服务器安全配置、在 CLAUDE.md 中声明 MCP 工具使用规范,以及自定义 MCP 服务器的快速开发入门。2026/3/18教程Claude Code 输出格式控制完全指南:JSON、流式、结构化输出使用方法Claude Code 和 Claude API 输出格式完整控制指南:--output-format 参数(text/json/stream-json)、非交互模式(-p)的输出控制、结构化 JSON 输出(--json-schema 字段约束)、流式输出(Server-Sent Events)的处理方式、include-partial-messages 流式渐进显示、以及 CI/CD 管道中解析 JSON 输出的实用技巧。2026/3/18