O modo rápido está em visualização de pesquisa. O recurso, preços e disponibilidade podem mudar com base no feedback.
/fast quando você precisar de velocidade para trabalho interativo como iteração rápida ou depuração ao vivo, e desative-o quando o custo importa mais do que a latência.
O modo rápido não é um modelo diferente. Ele usa o mesmo Opus 4.6 com uma configuração de API diferente que prioriza a velocidade sobre a eficiência de custo. Você obtém qualidade e capacidades idênticas, apenas respostas mais rápidas.
O modo rápido requer Claude Code v2.1.36 ou posterior. Verifique sua versão com
claude --version.- Use
/fastpara alternar o modo rápido no CLI do Claude Code. Também disponível via/fastna Extensão Claude Code VS Code. - O preço do modo rápido para Opus 4.6 começa em $30/150 MTok. O modo rápido está disponível com desconto de 50% para todos os planos até 23:59 PT em 16 de fevereiro.
- Disponível para todos os usuários do Claude Code em planos de assinatura (Pro/Max/Team/Enterprise) e Claude Console.
- Para usuários do Claude Code em planos de assinatura (Pro/Max/Team/Enterprise), o modo rápido está disponível apenas via uso extra e não está incluído nos limites de taxa de assinatura.
Alternar modo rápido
Alterne o modo rápido de uma destas formas:- Digite
/faste pressione Tab para alternar ativado ou desativado - Defina
"fastMode": trueno seu arquivo de configurações do usuário
- Se você estiver em um modelo diferente, o Claude Code alterna automaticamente para Opus 4.6
- Você verá uma mensagem de confirmação: “Fast mode ON”
- Um pequeno ícone
↯aparece ao lado do prompt enquanto o modo rápido está ativo - Execute
/fastnovamente a qualquer momento para verificar se o modo rápido está ativado ou desativado
/fast novamente, você permanece no Opus 4.6. O modelo não reverte para seu modelo anterior. Para alternar para um modelo diferente, use /model.
Entender o tradeoff de custo
O modo rápido tem preços por token mais altos do que o Opus 4.6 padrão:| Modo | Entrada (MTok) | Saída (MTok) |
|---|---|---|
| Modo rápido no Opus 4.6 (<200K) | $30 | $150 |
| Modo rápido no Opus 4.6 (>200K) | $60 | $225 |
Decidir quando usar o modo rápido
O modo rápido é melhor para trabalho interativo onde a latência de resposta importa mais do que o custo:- Iteração rápida em mudanças de código
- Sessões de depuração ao vivo
- Trabalho sensível ao tempo com prazos apertados
- Tarefas autônomas longas onde a velocidade importa menos
- Processamento em lote ou pipelines CI/CD
- Cargas de trabalho sensíveis ao custo
Modo rápido vs nível de esforço
O modo rápido e o nível de esforço afetam a velocidade de resposta, mas de formas diferentes:| Configuração | Efeito |
|---|---|
| Modo rápido | Mesma qualidade de modelo, latência mais baixa, custo mais alto |
| Nível de esforço mais baixo | Menos tempo de pensamento, respostas mais rápidas, qualidade potencialmente mais baixa em tarefas complexas |
Requisitos
O modo rápido requer todos os seguintes:- Não disponível em provedores de nuvem de terceiros: o modo rápido não está disponível no Amazon Bedrock, Google Vertex AI ou Microsoft Azure Foundry. O modo rápido está disponível através da API do Anthropic Console e para planos de assinatura Claude usando uso extra.
- Uso extra ativado: sua conta deve ter o uso extra ativado, o que permite cobrança além do uso incluído no seu plano. Para contas individuais, ative isso nas suas configurações de cobrança do Console. Para Teams e Enterprise, um administrador deve ativar o uso extra para a organização.
O uso do modo rápido é cobrado diretamente no uso extra, mesmo que você tenha uso restante no seu plano. Isso significa que os tokens do modo rápido não contam contra o uso incluído do seu plano e são cobrados à taxa do modo rápido desde o primeiro token.
- Habilitação de administrador para Teams e Enterprise: o modo rápido está desativado por padrão para organizações Teams e Enterprise. Um administrador deve explicitamente ativar o modo rápido antes que os usuários possam acessá-lo.
Se seu administrador não tiver ativado o modo rápido para sua organização, o comando
/fast mostrará “Fast mode has been disabled by your organization.”Ativar modo rápido para sua organização
Os administradores podem ativar o modo rápido em:- Console (clientes de API): Preferências do Claude Code
- Claude AI (Teams e Enterprise): Admin Settings > Claude Code
CLAUDE_CODE_DISABLE_FAST_MODE=1. Consulte Variáveis de ambiente.
Require per-session opt-in
Por padrão, o modo rápido persiste entre sessões: se um usuário ativa o modo rápido, ele permanece ativado em futuras sessões. Os administradores em planos Teams ou Enterprise podem evitar isso definindofastModePerSessionOptIn como true em managed settings ou server-managed settings. Isso faz com que cada sessão comece com o modo rápido desativado, exigindo que os usuários o ativem explicitamente com /fast.
/fast quando precisam de velocidade, mas ele é redefinido no início de cada nova sessão. A preferência de modo rápido do usuário ainda é salva, portanto remover essa configuração restaura o comportamento padrão persistente.
Lidar com limites de taxa
O modo rápido tem limites de taxa separados do Opus 4.6 padrão. Quando você atinge o limite de taxa do modo rápido ou fica sem créditos de uso extra:- O modo rápido automaticamente volta para Opus 4.6 padrão
- O ícone
↯fica cinza para indicar cooldown - Você continua trabalhando com velocidade e preços padrão
- Quando o cooldown expira, o modo rápido é automaticamente reativado
/fast novamente.
Research preview
O modo rápido é um recurso de visualização de pesquisa. Isso significa:- O recurso pode mudar com base no feedback
- A disponibilidade e preços estão sujeitos a alterações
- A configuração de API subjacente pode evoluir
Veja também
- Configuração de modelo: alterne modelos e ajuste níveis de esforço
- Gerenciar custos efetivamente: rastreie o uso de tokens e reduza custos
- Configuração da linha de status: exiba informações de modelo e contexto