Passer au contenu principal
Claude Code consomme des tokens pour chaque interaction. Le coût moyen est de 6 pardeˊveloppeurparjour,lescou^tsquotidiensrestantendessousde12par développeur par jour, les coûts quotidiens restant en dessous de 12 pour 90 % des utilisateurs. Pour l’utilisation en équipe, Claude Code facture selon la consommation de tokens API. En moyenne, Claude Code coûte environ 100 à 200 $ par développeur par mois avec Sonnet 4.5, bien qu’il y ait une grande variance selon le nombre d’instances que les utilisateurs exécutent et s’ils l’utilisent dans l’automatisation.

Suivre vos coûts

Utiliser la commande /cost

La commande /cost n’est pas destinée aux abonnés Claude Max et Pro.
La commande /cost fournit des statistiques détaillées sur l’utilisation des tokens pour votre session actuelle :
Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

Options de suivi supplémentaires

Consultez l’utilisation historique dans la Claude Console (nécessite un rôle Admin ou Billing) et définissez des limites de dépenses de l’espace de travail pour l’espace de travail Claude Code (nécessite un rôle Admin).
Lorsque vous authentifiez pour la première fois Claude Code avec votre compte Claude Console, un espace de travail appelé « Claude Code » est automatiquement créé pour vous. Cet espace de travail fournit un suivi et une gestion centralisés des coûts pour toute l’utilisation de Claude Code dans votre organisation. Vous ne pouvez pas créer de clés API pour cet espace de travail - il est exclusivement destiné à l’authentification et à l’utilisation de Claude Code.

Gérer les coûts pour les équipes

Lors de l’utilisation de Claude API, vous pouvez limiter les dépenses totales de l’espace de travail Claude Code. Pour configurer, suivez ces instructions. Les administrateurs peuvent consulter les rapports de coûts et d’utilisation en suivant ces instructions. Sur Bedrock et Vertex, Claude Code n’envoie pas de métriques depuis votre cloud. Afin d’obtenir des métriques de coûts, plusieurs grandes entreprises ont signalé l’utilisation de LiteLLM, qui est un outil open-source qui aide les entreprises à suivre les dépenses par clé. Ce projet n’est pas affilié à Anthropic et nous n’avons pas audité sa sécurité.

Recommandations de limite de débit

Lors de la configuration de Claude Code pour les équipes, considérez ces recommandations par utilisateur basées sur la taille de votre organisation pour Token Per Minute (TPM) et Request Per Minute (RPM) :
Taille de l’équipeTPM par utilisateurRPM par utilisateur
1-5 utilisateurs200k-300k5-7
5-20 utilisateurs100k-150k2.5-3.5
20-50 utilisateurs50k-75k1.25-1.75
50-100 utilisateurs25k-35k0.62-0.87
100-500 utilisateurs15k-20k0.37-0.47
500+ utilisateurs10k-15k0.25-0.35
Par exemple, si vous avez 200 utilisateurs, vous pourriez demander 20k TPM pour chaque utilisateur, ou 4 millions de TPM au total (200*20 000 = 4 millions). Le TPM par utilisateur diminue à mesure que la taille de l’équipe augmente car nous nous attendons à ce que moins d’utilisateurs utilisent Claude Code simultanément dans les grandes organisations. Ces limites de débit s’appliquent au niveau de l’organisation, et non par utilisateur individuel, ce qui signifie que les utilisateurs individuels peuvent temporairement consommer plus que leur part calculée lorsque d’autres n’utilisent pas activement le service.
Si vous anticipez des scénarios avec une utilisation simultanée inhabituellement élevée (comme des sessions de formation en direct avec de grands groupes), vous pourriez avoir besoin d’allocations TPM plus élevées par utilisateur.

Réduire l’utilisation des tokens

  • Conversations compactes :
    • Claude utilise le compactage automatique par défaut lorsque le contexte dépasse 95 % de la capacité
    • Basculer le compactage automatique : Exécutez /config et accédez à « Auto-compact enabled »
    • Utilisez /compact manuellement lorsque le contexte devient volumineux
    • Ajouter des instructions personnalisées : /compact Focus on code samples and API usage
    • Personnalisez le compactage en ajoutant à CLAUDE.md :
      # Summary instructions
      
      When you are using compact, please focus on test output and code changes
      
  • Écrire des requêtes spécifiques : Évitez les demandes vagues qui déclenchent des analyses inutiles
  • Décomposer les tâches complexes : Divisez les grandes tâches en interactions ciblées
  • Effacer l’historique entre les tâches : Utilisez /clear pour réinitialiser le contexte
Les coûts peuvent varier considérablement en fonction de :
  • La taille de la base de code analysée
  • La complexité des requêtes
  • Le nombre de fichiers recherchés ou modifiés
  • La longueur de l’historique de conversation
  • La fréquence du compactage des conversations

Utilisation des tokens en arrière-plan

Claude Code utilise des tokens pour certaines fonctionnalités en arrière-plan même en cas d’inactivité :
  • Résumé de conversation : Tâches en arrière-plan qui résument les conversations précédentes pour la fonctionnalité claude --resume
  • Traitement des commandes : Certaines commandes comme /cost peuvent générer des requêtes pour vérifier l’état
Ces processus en arrière-plan consomment une petite quantité de tokens (généralement moins de 0,04 $ par session) même sans interaction active.

Suivi des changements de version et des mises à jour

Informations de version actuelle

Pour vérifier votre version actuelle de Claude Code et les détails d’installation :
claude doctor
Cette commande affiche votre version, le type d’installation et les informations système.

Comprendre les changements de comportement de Claude Code

Claude Code reçoit régulièrement des mises à jour qui peuvent modifier le fonctionnement des fonctionnalités, y compris la génération de rapports de coûts :
  • Suivi de version : Utilisez claude doctor pour voir votre version actuelle
  • Changements de comportement : Les fonctionnalités comme /cost peuvent afficher les informations différemment selon les versions
  • Accès à la documentation : Claude a toujours accès à la dernière documentation, ce qui peut aider à expliquer le comportement actuel des fonctionnalités

Quand la génération de rapports de coûts change

Si vous remarquez des changements dans la façon dont les coûts sont affichés (comme la commande /cost affichant des informations différentes) :
  1. Vérifiez votre version : Exécutez claude doctor pour confirmer votre version actuelle
  2. Consultez la documentation : Demandez à Claude directement le comportement actuel des fonctionnalités, car il a accès à la documentation à jour
  3. Contactez le support : Pour des questions de facturation spécifiques, contactez le support Anthropic via votre compte Console
Pour les déploiements en équipe, nous recommandons de commencer par un petit groupe pilote pour établir les modèles d’utilisation avant un déploiement plus large.