快速模式处于研究预览阶段。该功能、定价和可用性可能会根据反馈而改变。
/fast 将其打开,当成本比延迟更重要时,将其关闭。
快速模式不是一个不同的模型。它使用相同的 Opus 4.6,但采用不同的 API 配置,优先考虑速度而不是成本效率。您获得相同的质量和功能,只是响应速度更快。
快速模式需要 Claude Code v2.1.36 或更高版本。使用
claude --version 检查您的版本。- 使用
/fast在 Claude Code CLI 中切换快速模式。也可通过 Claude Code VS Code 扩展中的/fast使用。 - Opus 4.6 快速模式定价从 $30/150 MTok 开始。快速模式在所有计划上享受 50% 折扣,直到太平洋时间 2 月 16 日晚上 11:59。
- 可供订阅计划(Pro/Max/Team/Enterprise)上的所有 Claude Code 用户和 Claude 控制台使用。
- 对于订阅计划(Pro/Max/Team/Enterprise)上的 Claude Code 用户,快速模式仅通过额外使用提供,不包含在订阅速率限制中。
切换快速模式
通过以下任一方式切换快速模式:- 输入
/fast并按 Tab 键打开或关闭 - 在您的用户设置文件中设置
"fastMode": true
- 如果您使用的是不同的模型,Claude Code 会自动切换到 Opus 4.6
- 您将看到确认消息:“Fast mode ON”
- 快速模式处于活动状态时,提示旁边会出现一个小的
↯图标 - 随时再次运行
/fast以检查快速模式是否打开或关闭
/fast 禁用快速模式时,您仍然保持在 Opus 4.6 上。模型不会恢复到您之前的模型。要切换到不同的模型,请使用 /model。
了解成本权衡
快速模式的每个令牌定价高于标准 Opus 4.6:| 模式 | 输入 (MTok) | 输出 (MTok) |
|---|---|---|
| Opus 4.6 上的快速模式 (<200K) | $30 | $150 |
| Opus 4.6 上的快速模式 (>200K) | $60 | $225 |
决定何时使用快速模式
快速模式最适合响应延迟比成本更重要的交互式工作:- 快速迭代代码更改
- 实时调试会话
- 时间敏感的工作,有紧迫的截止日期
- 速度不那么重要的长期自主任务
- 批处理或 CI/CD 管道
- 成本敏感的工作负载
快速模式与努力级别
快速模式和努力级别都会影响响应速度,但方式不同:| 设置 | 效果 |
|---|---|
| 快速模式 | 相同的模型质量,更低的延迟,更高的成本 |
| 较低的努力级别 | 更少的思考时间,更快的响应,在复杂任务上可能质量较低 |
要求
快速模式需要以下所有条件:- 第三方云提供商上不可用:快速模式在 Amazon Bedrock、Google Vertex AI 或 Microsoft Azure Foundry 上不可用。快速模式可通过 Anthropic 控制台 API 和使用额外使用的 Claude 订阅计划获得。
- 启用额外使用:您的账户必须启用额外使用,这允许在您的计划包含的使用量之外进行计费。对于个人账户,在您的控制台计费设置中启用此功能。对于团队和企业,管理员必须为组织启用额外使用。
快速模式使用直接计入额外使用,即使您的计划上还有剩余使用量。这意味着快速模式令牌不计入您的计划包含的使用量,并从第一个令牌开始按快速模式费率收费。
- 团队和企业的管理员启用:快速模式默认对团队和企业组织禁用。管理员必须明确启用快速模式,用户才能访问它。
如果您的管理员尚未为您的组织启用快速模式,
/fast 命令将显示”Fast mode has been disabled by your organization.”为您的组织启用快速模式
管理员可以在以下位置启用快速模式:- 控制台(API 客户):Claude Code 偏好设置
- Claude AI(团队和企业):管理员设置 > Claude Code
CLAUDE_CODE_DISABLE_FAST_MODE=1。请参阅环境变量。
要求每个会话选择加入
默认情况下,快速模式在会话之间保持:如果用户启用快速模式,它会在未来的会话中保持打开。团队或企业计划上的管理员可以通过在托管设置或服务器托管设置中将fastModePerSessionOptIn 设置为 true 来防止这种情况。这会导致每个会话以快速模式关闭开始,要求用户使用 /fast 明确启用它。
/fast 启用快速模式,但它会在每个新会话开始时重置。用户的快速模式偏好仍然被保存,因此删除此设置会恢复默认的持久行为。
处理速率限制
快速模式与标准 Opus 4.6 有单独的速率限制。当您达到快速模式速率限制或用完额外使用额度时:- 快速模式自动回退到标准 Opus 4.6
↯图标变灰以指示冷却- 您继续以标准速度和定价工作
- 冷却过期时,快速模式自动重新启用
/fast。
研究预览
快速模式是一个研究预览功能。这意味着:- 该功能可能会根据反馈而改变
- 可用性和定价可能会改变
- 底层 API 配置可能会演变