Pular para o conteúdo principal

Documentation Index

Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt

Use this file to discover all available pages before exploring further.

O modo rápido está em visualização de pesquisa. O recurso, preços e disponibilidade podem mudar com base no feedback.
O modo rápido é uma configuração de alta velocidade para Claude Opus, tornando o modelo 2,5x mais rápido a um custo maior por token. Ative-o com /fast quando você precisar de velocidade para trabalho interativo como iteração rápida ou depuração ao vivo, e desative-o quando o custo importa mais do que a latência. O modo rápido não é um modelo diferente. Ele usa Claude Opus com uma configuração de API diferente que prioriza a velocidade sobre a eficiência de custo. Você obtém qualidade e capacidades idênticas, apenas respostas mais rápidas. O modo rápido é suportado no Opus 4.6 e Opus 4.7. Não está disponível no Sonnet, Haiku ou outros modelos.
O modo rápido requer Claude Code v2.1.36 ou posterior. Verifique sua versão com claude --version.
O que você precisa saber:
  • Use /fast para alternar o modo rápido no CLI do Claude Code. Também disponível via /fast na Extensão Claude Code VS Code.
  • Por padrão, /fast é executado no Opus 4.6. Para executar o modo rápido no Opus 4.7, defina a variável de ambiente CLAUDE_CODE_ENABLE_OPUS_4_7_FAST_MODE.
  • O preço do modo rápido é $30/150 MTok tanto no Opus 4.6 quanto no Opus 4.7.
  • Disponível para todos os usuários do Claude Code em planos de assinatura (Pro/Max/Team/Enterprise) e Claude Console.
  • Para usuários do Claude Code em planos de assinatura (Pro/Max/Team/Enterprise), o modo rápido está disponível apenas via uso extra e não está incluído nos limites de taxa de assinatura.
Esta página cobre como alternar o modo rápido, usar o modo rápido no Opus 4.7, o tradeoff de custo, quando usá-lo, requisitos, opt-in por sessão e comportamento de limite de taxa.

Alternar modo rápido

Alterne o modo rápido de uma destas formas: Por padrão, o modo rápido persiste entre sessões. Os administradores podem configurar o modo rápido para ser redefinido a cada sessão. Consulte require per-session opt-in para obter detalhes. Para melhor eficiência de custo, ative o modo rápido no início de uma sessão em vez de alternar no meio da conversa. Consulte understand the cost tradeoff para obter detalhes. Quando você ativa o modo rápido:
  • Se você estiver em um modelo diferente, o Claude Code alterna automaticamente para o modelo de modo rápido: Opus 4.6 por padrão, ou Opus 4.7 quando CLAUDE_CODE_ENABLE_OPUS_4_7_FAST_MODE está definido.
  • Você verá uma mensagem de confirmação: “Fast mode ON”
  • Um pequeno ícone aparece ao lado do prompt enquanto o modo rápido está ativo
  • Execute /fast novamente a qualquer momento para verificar se o modo rápido está ativado ou desativado
Quando você desativa o modo rápido com /fast novamente, você permanece na mesma versão do Opus que o modo rápido estava executando. O modelo não reverte para seu modelo anterior. Para alternar para um modelo diferente, use /model.

Usar modo rápido no Opus 4.7

O modo rápido no Opus 4.7 requer Claude Code v2.1.139 ou posterior.
O modo rápido para Claude Opus 4.7 está em visualização de pesquisa. Ele é executado na mesma velocidade 2,5x e no mesmo preço que o modo rápido para Opus 4.6, sem outras mudanças de comportamento.
Em 14 de maio de 2026, o Opus 4.7 se torna o modelo de modo rápido padrão. Até então, opte por participar definindo CLAUDE_CODE_ENABLE_OPUS_4_7_FAST_MODE=1.
Para optar por participar, defina CLAUDE_CODE_ENABLE_OPUS_4_7_FAST_MODE=1 antes de iniciar o Claude Code. Com a variável definida, /fast é executado no Opus 4.7. Sem ela, /fast continua a ser executado no Opus 4.6. Você pode definir a variável como uma exportação de shell:
export CLAUDE_CODE_ENABLE_OPUS_4_7_FAST_MODE=1
Ou em qualquer arquivo de configurações do Claude Code, incluindo configurações de usuário, projeto e gerenciadas, para definir o escopo da participação:
{
  "env": {
    "CLAUDE_CODE_ENABLE_OPUS_4_7_FAST_MODE": "1"
  }
}
O modo rápido para Opus 4.6 permanece disponível ao lado do Opus 4.7. Os dois compartilham o mesmo pool de limite de taxa do modo rápido: o uso em qualquer modelo é extraído dos mesmos limites. Para fixar o modo rápido no Opus 4.6 explicitamente, defina CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1. Esta variável tem precedência, portanto o modo rápido é executado no Opus 4.6 independentemente de CLAUDE_CODE_ENABLE_OPUS_4_7_FAST_MODE estar definido.

Entender o tradeoff de custo

O modo rápido tem preços por token mais altos do que o Opus padrão:
ModoEntrada (MTok)Saída (MTok)
Modo rápido no Opus 4.6$30$150
Modo rápido no Opus 4.7$30$150
O preço do modo rápido é fixo em toda a janela de contexto de 1M token. Quando você alterna para o modo rápido no meio de uma conversa, você paga o preço total do token de entrada não armazenado em cache do modo rápido para todo o contexto da conversa. Isso custa mais do que se você tivesse ativado o modo rápido desde o início.

Decidir quando usar o modo rápido

O modo rápido é melhor para trabalho interativo onde a latência de resposta importa mais do que o custo:
  • Iteração rápida em mudanças de código
  • Sessões de depuração ao vivo
  • Trabalho sensível ao tempo com prazos apertados
O modo padrão é melhor para:
  • Tarefas autônomas longas onde a velocidade importa menos
  • Processamento em lote ou pipelines CI/CD
  • Cargas de trabalho sensíveis ao custo

Modo rápido vs nível de esforço

O modo rápido e o nível de esforço afetam a velocidade de resposta, mas de formas diferentes:
ConfiguraçãoEfeito
Modo rápidoMesma qualidade de modelo, latência mais baixa, custo mais alto
Nível de esforço mais baixoMenos tempo de pensamento, respostas mais rápidas, qualidade potencialmente mais baixa em tarefas complexas
Você pode combinar ambos: use o modo rápido com um nível de esforço mais baixo para máxima velocidade em tarefas diretas.

Requisitos

O modo rápido requer todos os seguintes:
  • Não disponível em provedores de nuvem de terceiros: o modo rápido não está disponível no Amazon Bedrock, Google Vertex AI ou Microsoft Azure Foundry. O modo rápido está disponível através da API do Anthropic Console e para planos de assinatura Claude usando uso extra.
  • Uso extra ativado: sua conta deve ter o uso extra ativado, o que permite cobrança além do uso incluído no seu plano. Para contas individuais, ative isso nas suas configurações de cobrança do Console. Para Teams e Enterprise, um administrador deve ativar o uso extra para a organização.
O uso do modo rápido é cobrado diretamente no uso extra, mesmo que você tenha uso restante no seu plano. Isso significa que os tokens do modo rápido não contam contra o uso incluído do seu plano e são cobrados à taxa do modo rápido desde o primeiro token.
  • Habilitação de administrador para Teams e Enterprise: o modo rápido está desativado por padrão para organizações Teams e Enterprise. Um administrador deve explicitamente ativar o modo rápido antes que os usuários possam acessá-lo.
Se seu administrador não tiver ativado o modo rápido para sua organização, o comando /fast mostrará “Fast mode has been disabled by your organization.”

Ativar modo rápido para sua organização

Os administradores podem ativar o modo rápido em: Outra opção para desativar completamente o modo rápido é definir CLAUDE_CODE_DISABLE_FAST_MODE=1. Consulte Variáveis de ambiente.

Require per-session opt-in

Por padrão, o modo rápido persiste entre sessões: se um usuário ativa o modo rápido, ele permanece ativado em futuras sessões. Os administradores em planos Teams ou Enterprise podem evitar isso definindo fastModePerSessionOptIn como true em managed settings ou server-managed settings. Isso faz com que cada sessão comece com o modo rápido desativado, exigindo que os usuários o ativem explicitamente com /fast.
{
  "fastModePerSessionOptIn": true
}
Isso é útil para controlar custos em organizações onde os usuários executam várias sessões simultâneas. Os usuários ainda podem ativar o modo rápido com /fast quando precisam de velocidade, mas ele é redefinido no início de cada nova sessão. A preferência de modo rápido do usuário ainda é salva, portanto remover essa configuração restaura o comportamento padrão persistente.

Lidar com limites de taxa

O modo rápido tem limites de taxa separados do Opus padrão. O modo rápido para Opus 4.6 e Opus 4.7 compartilham o mesmo pool de limite de taxa: o uso em qualquer modelo é extraído dos mesmos limites. Quando você atinge o limite de taxa do modo rápido ou fica sem uso extra:
  1. O modo rápido automaticamente volta para velocidade padrão na mesma versão do Opus
  2. O ícone fica cinza para indicar cooldown
  3. Você continua trabalhando com velocidade e preços padrão
  4. Quando o cooldown expira, o modo rápido é automaticamente reativado
Para desativar o modo rápido manualmente em vez de esperar pelo cooldown, execute /fast novamente.

Research preview

O modo rápido é um recurso de visualização de pesquisa. Isso significa:
  • O recurso pode mudar com base no feedback
  • A disponibilidade e preços estão sujeitos a alterações
  • A configuração de API subjacente pode evoluir
Relate problemas ou feedback através de seus canais de suporte Anthropic usuais.

Veja também