Pular para o conteúdo principal
O modo rápido está em visualização de pesquisa. O recurso, preços e disponibilidade podem mudar com base no feedback.
O modo rápido é uma configuração de alta velocidade para Claude Opus, tornando o modelo até 2,5x mais rápido a um custo maior por token. Ative-o com /fast quando você precisar de velocidade para trabalho interativo como iteração rápida ou depuração ao vivo, e desative-o quando o custo importa mais do que a latência. O modo rápido não é um modelo diferente. Ele usa Claude Opus com uma configuração de API diferente que prioriza a velocidade sobre a eficiência de custo. Você obtém qualidade e capacidades idênticas com respostas mais rápidas. O modo rápido é suportado no Opus 4.8 e Opus 4.7. Não está disponível no Sonnet, Haiku ou outros modelos.
O modo rápido para Opus 4.7 está descontinuado desde 25 de junho de 2026 e será removido em 24 de julho de 2026. Após a remoção, solicitações de modo rápido no Opus 4.7 retornam um erro e não voltam para o Opus 4.7 padrão. Migre para Opus 4.8 para manter a aceleração.
O modo rápido requer Claude Code v2.1.36 ou posterior. Verifique sua versão com claude --version.
O que você precisa saber:
  • Use /fast para alternar o modo rápido no CLI do Claude Code. O modo rápido não é suportado na extensão VS Code.
  • O preço do modo rápido por MTok de entrada/saída é $10/$50 no Opus 4.8 e $30/$150 no Opus 4.7.
  • Disponível para todos os usuários do Claude Code em planos de assinatura (Pro/Max/Team/Enterprise) e Claude Console.
  • Para usuários do Claude Code em planos de assinatura (Pro/Max/Team/Enterprise), o modo rápido está disponível apenas via créditos de uso e não está incluído nos limites de taxa de assinatura.

Alternar modo rápido

Alterne o modo rápido de uma destas formas: Por padrão, o modo rápido persiste entre sessões. Os administradores podem configurar o modo rápido para ser redefinido a cada sessão. Consulte require per-session opt-in para obter detalhes. Para melhor eficiência de custo, ative o modo rápido no início de uma sessão em vez de alternar no meio da conversa. Consulte understand the cost tradeoff para obter detalhes. Quando você ativa o modo rápido:
  • Se você estiver em um modelo diferente, o Claude Code alterna automaticamente para o Opus
  • Você verá uma mensagem de confirmação: “Fast mode ON”
  • Um pequeno ícone aparece ao lado do prompt enquanto o modo rápido está ativo
  • Execute /fast novamente a qualquer momento para verificar se o modo rápido está ativado ou desativado
Quando você desativa o modo rápido com /fast novamente, você permanece no Opus. O modelo não reverte para seu modelo anterior. Para alternar para um modelo diferente, use /model. O Opus 4.8 é o padrão do modo rápido no Claude Code v2.1.154 e posterior. Na v2.1.142 até v2.1.153, o modo rápido usa como padrão o Opus 4.7.

Entender o tradeoff de custo

O modo rápido tem preços por token mais altos do que o Opus padrão, com o multiplicador variando por modelo:
ModeloEntrada (MTok)Saída (MTok)
Opus 4.8$10$50
Opus 4.7$30$150
O preço do modo rápido é fixo em toda a janela de contexto de 1M token. Para a taxa padrão do Opus para comparar, consulte a referência de preços do Claude. A primeira vez que você ativa o modo rápido em uma conversa, você paga o preço total do token de entrada não armazenado em cache do modo rápido para todo o contexto da conversa. Quanto mais profundo você estiver em uma conversa, mais isso custa, portanto ativar o modo rápido desde o início é mais barato. O custo se aplica uma vez por conversa, portanto desativar e ativar o modo rápido novamente mais tarde não o repete. Para o mecanismo, consulte como o modo rápido interage com o cache de prompt.

Decidir quando usar o modo rápido

O modo rápido é melhor para trabalho interativo onde a latência de resposta importa mais do que o custo:
  • Iteração rápida em mudanças de código
  • Sessões de depuração ao vivo
  • Trabalho sensível ao tempo com prazos apertados
O modo padrão é melhor para:
  • Tarefas autônomas longas onde a velocidade importa menos
  • Processamento em lote ou pipelines CI/CD
  • Cargas de trabalho sensíveis ao custo

Modo rápido vs nível de esforço

O modo rápido e o nível de esforço afetam a velocidade de resposta, mas de formas diferentes:
ConfiguraçãoEfeito
Modo rápidoMesma qualidade de modelo, latência mais baixa, custo mais alto
Nível de esforço mais baixoMenos tempo de pensamento, respostas mais rápidas, qualidade potencialmente mais baixa em tarefas complexas
Você pode combinar ambos: use o modo rápido com um nível de esforço mais baixo para máxima velocidade em tarefas diretas.

Requisitos

O modo rápido requer todos os seguintes:
  • Apenas API Anthropic ou assinatura: o modo rápido está disponível através da API do Anthropic Console e para planos de assinatura Claude usando créditos de uso. Não está disponível no Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry ou Claude Platform na AWS.
  • Créditos de uso ativados: sua conta deve ter créditos de uso ativados, o que permite cobrança além do uso incluído no seu plano. Para contas individuais, ative isso nas suas configurações de cobrança do Console. Para Teams e Enterprise, um administrador deve ativar créditos de uso para a organização.
O uso do modo rápido é cobrado diretamente nos créditos de uso, mesmo que você tenha uso restante no seu plano. Isso significa que os tokens do modo rápido não contam contra o uso incluído do seu plano e são cobrados à taxa do modo rápido desde o primeiro token.
  • Habilitação de administrador para Team e Enterprise: o modo rápido está desativado por padrão para organizações Team e Enterprise. Um administrador deve explicitamente ativar o modo rápido antes que os usuários possam acessá-lo.
Se seu administrador não tiver ativado o modo rápido para sua organização, o comando /fast mostrará “Fast mode has been disabled by your organization.” Se a lista de permissões availableModels da sua organização excluir o modelo Opus do modo rápido, /fast é recusado com “is not in your organization’s allowed models”. A exceção é uma sessão já em execução em um modelo Opus permitido que suporte modo rápido: /fast ativa o modo rápido no seu modelo atual em vez de alternar modelos.

Ativar modo rápido para sua organização

Onde você ativa o modo rápido depende de qual produto sua organização usa: Outra opção para desativar completamente o modo rápido é definir CLAUDE_CODE_DISABLE_FAST_MODE=1. Consulte Variáveis de ambiente.

Require per-session opt-in

Por padrão, o modo rápido persiste entre sessões: se um usuário ativa o modo rápido, ele permanece ativado em futuras sessões. Os administradores em planos Team ou Enterprise podem evitar isso definindo fastModePerSessionOptIn como true em managed settings ou server-managed settings. Isso faz com que cada sessão comece com o modo rápido desativado, exigindo que os usuários o ativem explicitamente com /fast.
{
  "fastModePerSessionOptIn": true
}
Isso é útil para controlar custos em organizações onde os usuários executam várias sessões simultâneas. Os usuários ainda podem ativar o modo rápido com /fast quando precisam de velocidade, mas ele é redefinido no início de cada nova sessão. A preferência de modo rápido do usuário ainda é salva, portanto remover essa configuração restaura o comportamento padrão persistente.

Lidar com limites de taxa

O modo rápido tem limites de taxa separados do Opus padrão. O modo rápido no Opus 4.8 e Opus 4.7 compartilham o mesmo pool de limite de taxa: o uso em qualquer um deles é extraído dos mesmos limites. Quando você atinge o limite de taxa do modo rápido ou fica sem créditos de uso:
  1. O modo rápido automaticamente volta para velocidade padrão
  2. O ícone fica cinza para indicar cooldown
  3. Você continua trabalhando com velocidade e preços padrão
  4. Quando o cooldown expira, o modo rápido é automaticamente reativado
Para desativar o modo rápido manualmente em vez de esperar pelo cooldown, execute /fast novamente.

Research preview

O modo rápido é um recurso de visualização de pesquisa. Isso significa:
  • O recurso pode mudar com base no feedback
  • A disponibilidade e preços estão sujeitos a alterações
  • A configuração de API subjacente pode evoluir
Relate problemas ou feedback através de seus canais de suporte Anthropic usuais.

Veja também