跳转到主要内容
快速模式处于研究预览阶段。该功能、定价和可用性可能会根据反馈而改变。
快速模式是 Claude Opus 的高速配置,使模型速度提高最多 2.5 倍,但每个令牌的成本更高。当您需要速度进行交互式工作(如快速迭代或实时调试)时,使用 /fast 将其打开,当成本比延迟更重要时,将其关闭。 快速模式不是一个不同的模型。它使用 Claude Opus,但采用不同的 API 配置,优先考虑速度而不是成本效率。您获得相同的质量和功能,只是响应速度更快。快速模式在 Opus 4.8、Opus 4.7 和 Opus 4.6 上受支持。它在 Sonnet、Haiku 或其他模型上不可用。
Opus 4.6 的快速模式已弃用,将在 Opus 4.8 发布后约 30 天内移除。移除后,Opus 4.6 上的快速模式将回退到标准速度和标准定价。迁移到 Opus 4.8 或 Opus 4.7 以保持加速。
快速模式需要 Claude Code v2.1.36 或更高版本。使用 claude --version 检查您的版本。
需要了解的内容:
  • 使用 /fast 在 Claude Code CLI 中切换快速模式。Claude Code VS Code 扩展中不支持快速模式。
  • 快速模式定价在 Opus 4.8 上为 10/10/50 MTok,在 Opus 4.7 和 Opus 4.6 上为 30/30/150 MTok。
  • 可供订阅计划(Pro/Max/Team/Enterprise)上的所有 Claude Code 用户和 Claude 控制台使用。
  • 对于订阅计划(Pro/Max/Team/Enterprise)上的 Claude Code 用户,快速模式仅通过使用额度提供,不包含在订阅速率限制中。
本页涵盖如何切换快速模式、其成本权衡何时使用要求每个会话选择加入速率限制行为

切换快速模式

通过以下任一方式切换快速模式:
  • 输入 /fast 并按 Tab 键打开或关闭
  • 在您的用户设置文件中设置 "fastMode": true
默认情况下,快速模式在会话之间保持。管理员可以配置快速模式在每个会话时重置。有关详细信息,请参阅要求每个会话选择加入 为了获得最佳成本效率,在会话开始时启用快速模式,而不是在对话中途切换。有关详细信息,请参阅了解成本权衡 启用快速模式时:
  • 如果您使用的是不同的模型,Claude Code 会自动切换到 Opus
  • 您将看到确认消息:“Fast mode ON”
  • 快速模式处于活动状态时,提示旁边会出现一个小的 图标
  • 随时再次运行 /fast 以检查快速模式是否打开或关闭
当您再次使用 /fast 禁用快速模式时,您仍然保持在 Opus 上。模型不会恢复到您之前的模型。要切换到不同的模型,请使用 /model Opus 4.8 是 Claude Code v2.1.154 及更高版本中的快速模式默认值。在 v2.1.142 到 v2.1.153 版本中,快速模式默认为 Opus 4.7。

了解成本权衡

快速模式的每个令牌定价高于标准 Opus,乘数因模型而异:
模型输入 (MTok)输出 (MTok)
Opus 4.8$10$50
Opus 4.7 和 Opus 4.6$30$150
快速模式定价在整个 1M 令牌上下文窗口中是固定的。有关要比较的标准 Opus 费率,请参阅 Claude 定价参考 在对话中首次启用快速模式时,您需要为整个对话上下文支付完整的快速模式未缓存输入令牌价格。对话进行得越深入,成本就越高,因此从一开始就启用快速模式更便宜。该成本每个对话只应用一次,因此稍后关闭快速模式再打开不会重复收费。有关机制,请参阅 快速模式如何与提示缓存交互

决定何时使用快速模式

快速模式最适合响应延迟比成本更重要的交互式工作:
  • 快速迭代代码更改
  • 实时调试会话
  • 时间敏感的工作,有紧迫的截止日期
标准模式更适合:
  • 速度不那么重要的长期自主任务
  • 批处理或 CI/CD 管道
  • 成本敏感的工作负载

快速模式与努力级别

快速模式和努力级别都会影响响应速度,但方式不同:
设置效果
快速模式相同的模型质量,更低的延迟,更高的成本
较低的努力级别更少的思考时间,更快的响应,在复杂任务上可能质量较低
您可以结合两者:在直接任务上使用快速模式和较低的努力级别以获得最大速度。

要求

快速模式需要以下所有条件:
  • 仅限 Anthropic API 或订阅:快速模式可通过 Anthropic 控制台 API 和使用使用额度的 Claude 订阅计划获得。它在 Amazon Bedrock、Google Vertex AI、Microsoft Azure Foundry 或 AWS 上的 Claude Platform 上不可用。
  • 启用使用额度:您的账户必须启用使用额度,这允许在您的计划包含的使用量之外进行计费。对于个人账户,在您的控制台计费设置中启用此功能。对于团队和企业,管理员必须为组织启用使用额度。
快速模式使用直接计入使用额度,即使您的计划上还有剩余使用量。这意味着快速模式令牌不计入您的计划包含的使用量,并从第一个令牌开始按快速模式费率收费。
  • 团队和企业的管理员启用:快速模式默认对团队和企业组织禁用。管理员必须明确启用快速模式,用户才能访问它。
如果您的管理员尚未为您的组织启用快速模式,/fast 命令将显示”Fast mode has been disabled by your organization.”

为您的组织启用快速模式

管理员可以在以下位置启用快速模式: 另一个完全禁用快速模式的选项是设置 CLAUDE_CODE_DISABLE_FAST_MODE=1。请参阅环境变量

要求每个会话选择加入

默认情况下,快速模式在会话之间保持:如果用户启用快速模式,它会在未来的会话中保持打开。团队企业计划上的管理员可以通过在托管设置服务器托管设置中将 fastModePerSessionOptIn 设置为 true 来防止这种情况。这会导致每个会话以快速模式关闭开始,要求用户使用 /fast 明确启用它。
{
  "fastModePerSessionOptIn": true
}
这对于在用户运行多个并发会话的组织中控制成本很有用。用户在需要速度时仍然可以使用 /fast 启用快速模式,但它会在每个新会话开始时重置。用户的快速模式偏好仍然被保存,因此删除此设置会恢复默认的持久行为。

处理速率限制

快速模式与标准 Opus 有单独的速率限制。Opus 4.8、Opus 4.7 和 Opus 4.6 的快速模式共享相同的速率限制池:任一模型上的使用都会从相同的限制中扣除。当您达到快速模式速率限制或用完使用额度时:
  1. 快速模式自动回退到标准速度
  2. 图标变灰以指示冷却
  3. 您继续以标准速度和定价工作
  4. 冷却过期时,快速模式自动重新启用
要手动禁用快速模式而不是等待冷却,请再次运行 /fast

研究预览

快速模式是一个研究预览功能。这意味着:
  • 该功能可能会根据反馈而改变
  • 可用性和定价可能会改变
  • 底层 API 配置可能会演变
通过您通常的 Anthropic 支持渠道报告问题或反馈。

另请参阅