Passer au contenu principal
Le mode rapide est en aperçu de recherche. La fonctionnalité, la tarification et la disponibilité peuvent changer en fonction des commentaires.
Le mode rapide est une configuration haute vitesse pour Claude Opus, rendant le modèle jusqu’à 2,5 fois plus rapide à un coût par jeton plus élevé. Activez-le avec /fast quand vous avez besoin de vitesse pour un travail interactif comme l’itération rapide ou le débogage en direct, et désactivez-le quand le coût importe plus que la latence. Le mode rapide n’est pas un modèle différent. Il utilise Claude Opus avec une configuration API différente qui priorise la vitesse plutôt que l’efficacité des coûts. Vous obtenez une qualité et des capacités identiques avec des réponses plus rapides. Le mode rapide est pris en charge sur Opus 4.8, Opus 4.7 et Opus 4.6. Il n’est pas disponible sur Sonnet, Haiku ou d’autres modèles.
Le mode rapide pour Opus 4.6 est déprécié et sera supprimé environ 30 jours après le lancement d’Opus 4.8. Après la suppression, le mode rapide sur Opus 4.6 revient à la vitesse standard à la tarification standard. Migrez vers Opus 4.8 ou Opus 4.7 pour conserver l’accélération.
Le mode rapide nécessite Claude Code v2.1.36 ou ultérieur. Vérifiez votre version avec claude --version.
Ce qu’il faut savoir :
  • Utilisez /fast pour activer/désactiver le mode rapide dans Claude Code CLI. Le mode rapide n’est pas pris en charge dans l’extension VS Code.
  • La tarification du mode rapide par MTok entrée/sortie est de 10 /50/50 sur Opus 4.8 et de 30 /150/150 sur Opus 4.7 et Opus 4.6.
  • Disponible pour tous les utilisateurs de Claude Code sur les plans d’abonnement (Pro/Max/Team/Enterprise) et Claude Console.
  • Pour les utilisateurs de Claude Code sur les plans d’abonnement (Pro/Max/Team/Enterprise), le mode rapide est disponible via les crédits d’utilisation uniquement et n’est pas inclus dans les limites de taux d’abonnement.
Cette page couvre comment activer le mode rapide, son compromis de coût, quand l’utiliser, les exigences, l’opt-in par session, et le comportement des limites de taux.

Activer le mode rapide

Activez le mode rapide de l’une de ces deux façons : Par défaut, le mode rapide persiste entre les sessions. Les administrateurs peuvent configurer le mode rapide pour qu’il se réinitialise à chaque session. Consultez opt-in par session pour plus de détails. Pour la meilleure efficacité des coûts, activez le mode rapide au début d’une session plutôt que de basculer en milieu de conversation. Consultez comprendre le compromis de coût pour plus de détails. Quand vous activez le mode rapide :
  • Si vous êtes sur un modèle différent, Claude Code bascule automatiquement vers Opus
  • Vous verrez un message de confirmation : « Mode rapide ACTIVÉ »
  • Une petite icône apparaît à côté de l’invite pendant que le mode rapide est actif
  • Exécutez /fast à nouveau à tout moment pour vérifier si le mode rapide est activé ou désactivé
Quand vous désactivez le mode rapide avec /fast à nouveau, vous restez sur Opus. Le modèle ne revient pas à votre modèle précédent. Pour basculer vers un modèle différent, utilisez /model. Opus 4.8 est le mode rapide par défaut dans Claude Code v2.1.154 et ultérieur. Sur v2.1.142 à v2.1.153, le mode rapide utilise par défaut Opus 4.7.

Comprendre le compromis de coût

Le mode rapide a une tarification par jeton plus élevée que l’Opus standard, avec un multiplicateur variant selon le modèle :
ModèleEntrée (MTok)Sortie (MTok)
Opus 4.8$10$50
Opus 4.7 et Opus 4.6$30$150
La tarification du mode rapide est plate sur toute la fenêtre de contexte de 1 million de jetons. Pour le tarif Opus standard à comparer, consultez la référence de tarification Claude. La première fois que vous activez le mode rapide dans une conversation, vous payez le prix complet du jeton d’entrée non mis en cache du mode rapide pour tout le contexte de la conversation. Plus vous êtes avancé dans une conversation, plus cela coûte cher, donc activer le mode rapide dès le départ est moins cher. Le coût s’applique une seule fois par conversation, donc basculer le mode rapide hors ligne puis le réactiver plus tard ne le répète pas. Pour le mécanisme, consultez comment le mode rapide interagit avec le cache de prompt.

Décider quand utiliser le mode rapide

Le mode rapide est idéal pour le travail interactif où la latence de réponse importe plus que le coût :
  • Itération rapide sur les modifications de code
  • Sessions de débogage en direct
  • Travail sensible au temps avec des délais serrés
Le mode standard est meilleur pour :
  • Les tâches autonomes longues où la vitesse importe moins
  • Le traitement par lots ou les pipelines CI/CD
  • Les charges de travail sensibles aux coûts

Mode rapide par rapport au niveau d’effort

Le mode rapide et le niveau d’effort affectent tous deux la vitesse de réponse, mais différemment :
ParamètreEffet
Mode rapideMême qualité de modèle, latence inférieure, coût plus élevé
Niveau d’effort inférieurMoins de temps de réflexion, réponses plus rapides, qualité potentiellement inférieure sur les tâches complexes
Vous pouvez combiner les deux : utilisez le mode rapide avec un niveau d’effort inférieur pour une vitesse maximale sur les tâches simples.

Exigences

Le mode rapide nécessite tous les éléments suivants :
  • API Anthropic ou abonnement uniquement : le mode rapide est disponible via l’API Anthropic Console et pour les plans d’abonnement Claude utilisant les crédits d’utilisation. Il n’est pas disponible sur Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry ou Claude Platform sur AWS.
  • Crédits d’utilisation activés : votre compte doit avoir les crédits d’utilisation activés, ce qui permet la facturation au-delà de l’utilisation incluse dans votre plan. Pour les comptes individuels, activez ceci dans vos paramètres de facturation Console. Pour Teams et Enterprise, un administrateur doit activer les crédits d’utilisation pour l’organisation.
L’utilisation du mode rapide est facturée directement à partir des crédits d’utilisation, même si vous avez une utilisation restante sur votre plan. Cela signifie que les jetons du mode rapide ne comptent pas par rapport à l’utilisation incluse de votre plan et sont facturés au tarif du mode rapide à partir du premier jeton.
  • Activation par l’administrateur pour Team et Enterprise : le mode rapide est désactivé par défaut pour les organisations Team et Enterprise. Un administrateur doit explicitement activer le mode rapide avant que les utilisateurs puissent y accéder.
Si votre administrateur n’a pas activé le mode rapide pour votre organisation, la commande /fast affichera « Le mode rapide a été désactivé par votre organisation. »

Activer le mode rapide pour votre organisation

Les administrateurs peuvent activer le mode rapide dans : Une autre option pour désactiver complètement le mode rapide est de définir CLAUDE_CODE_DISABLE_FAST_MODE=1. Consultez Variables d’environnement.

Opt-in par session

Par défaut, le mode rapide persiste entre les sessions : si un utilisateur active le mode rapide, il reste activé dans les sessions futures. Les administrateurs sur les plans Team ou Enterprise peuvent empêcher cela en définissant fastModePerSessionOptIn à true dans les paramètres gérés ou les paramètres gérés par le serveur. Cela fait que chaque session commence avec le mode rapide désactivé, obligeant les utilisateurs à l’activer explicitement avec /fast.
{
  "fastModePerSessionOptIn": true
}
Ceci est utile pour contrôler les coûts dans les organisations où les utilisateurs exécutent plusieurs sessions simultanées. Les utilisateurs peuvent toujours activer le mode rapide avec /fast quand ils ont besoin de vitesse, mais il se réinitialise au début de chaque nouvelle session. La préférence du mode rapide de l’utilisateur est toujours enregistrée, donc supprimer ce paramètre restaure le comportement persistant par défaut.

Gérer les limites de taux

Le mode rapide a des limites de taux séparées de l’Opus standard. Le mode rapide sur Opus 4.8, Opus 4.7 et Opus 4.6 partagent le même pool de limites de taux : l’utilisation sur l’un d’entre eux puise dans les mêmes limites. Quand vous atteignez la limite de taux du mode rapide ou que vous manquez de crédits d’utilisation :
  1. Le mode rapide bascule automatiquement vers la vitesse standard
  2. L’icône devient grise pour indiquer le refroidissement
  3. Vous continuez à travailler à la vitesse et à la tarification standard
  4. Quand le refroidissement expire, le mode rapide se réactive automatiquement
Pour désactiver manuellement le mode rapide au lieu d’attendre le refroidissement, exécutez /fast à nouveau.

Aperçu de recherche

Le mode rapide est une fonctionnalité d’aperçu de recherche. Cela signifie :
  • La fonctionnalité peut changer en fonction des commentaires
  • La disponibilité et la tarification sont sujettes à changement
  • La configuration API sous-jacente peut évoluer
Signalez les problèmes ou les commentaires via vos canaux de support Anthropic habituels.

Voir aussi