Zum Hauptinhalt springen
Claude Code verbraucht Token für jede Interaktion. Die durchschnittlichen Kosten betragen $6 pro Entwickler pro Tag, wobei die täglichen Kosten für 90% der Benutzer unter $12 bleiben. Für die Teamnutzung berechnet Claude Code nach API-Token-Verbrauch. Im Durchschnitt kostet Claude Code ~$100-200/Entwickler pro Monat mit Sonnet 4.5, es gibt jedoch große Unterschiede je nachdem, wie viele Instanzen Benutzer ausführen und ob sie es in der Automatisierung verwenden.

Verfolgen Sie Ihre Kosten

Verwendung des /cost-Befehls

Der /cost-Befehl ist nicht für Claude Max und Pro Abonnenten vorgesehen.
Der /cost-Befehl bietet detaillierte Token-Nutzungsstatistiken für Ihre aktuelle Sitzung:
Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

Zusätzliche Tracking-Optionen

Überprüfen Sie historische Nutzung in der Claude Console (erfordert Admin- oder Billing-Rolle) und legen Sie Workspace-Ausgabenlimits für den Claude Code Workspace fest (erfordert Admin-Rolle).
Wenn Sie Claude Code zum ersten Mal mit Ihrem Claude Console-Konto authentifizieren, wird automatisch ein Workspace namens “Claude Code” für Sie erstellt. Dieser Workspace bietet zentralisierte Kostenverfolgung und -verwaltung für alle Claude Code-Nutzungen in Ihrer Organisation. Sie können keine API-Schlüssel für diesen Workspace erstellen - er ist ausschließlich für Claude Code-Authentifizierung und -Nutzung vorgesehen.

Verwaltung von Kosten für Teams

Bei Verwendung der Claude API können Sie die Gesamtausgaben des Claude Code Workspace begrenzen. Zum Konfigurieren folgen Sie diesen Anweisungen. Administratoren können Kosten- und Nutzungsberichte anzeigen, indem sie diesen Anweisungen folgen. Bei Bedrock und Vertex sendet Claude Code keine Metriken aus Ihrer Cloud. Um Kostenmetriken zu erhalten, berichteten mehrere große Unternehmen von der Verwendung von LiteLLM, einem Open-Source-Tool, das Unternehmen hilft, Ausgaben nach Schlüssel zu verfolgen. Dieses Projekt ist nicht mit Anthropic verbunden und wir haben seine Sicherheit nicht überprüft.

Empfehlungen für Ratenlimits

Beachten Sie bei der Einrichtung von Claude Code für Teams diese Empfehlungen für Token Pro Minute (TPM) und Anfragen Pro Minute (RPM) pro Benutzer basierend auf Ihrer Organisationsgröße:
TeamgrößeTPM pro BenutzerRPM pro Benutzer
1-5 Benutzer200k-300k5-7
5-20 Benutzer100k-150k2.5-3.5
20-50 Benutzer50k-75k1.25-1.75
50-100 Benutzer25k-35k0.62-0.87
100-500 Benutzer15k-20k0.37-0.47
500+ Benutzer10k-15k0.25-0.35
Wenn Sie beispielsweise 200 Benutzer haben, könnten Sie 20k TPM für jeden Benutzer anfordern, oder 4 Millionen insgesamt TPM (200*20.000 = 4 Millionen). Die TPM pro Benutzer nimmt ab, wenn die Teamgröße wächst, da wir erwarten, dass weniger Benutzer Claude Code gleichzeitig in größeren Organisationen verwenden. Diese Ratenlimits gelten auf Organisationsebene, nicht pro einzelnem Benutzer, was bedeutet, dass einzelne Benutzer vorübergehend mehr als ihren berechneten Anteil verbrauchen können, wenn andere den Service nicht aktiv nutzen.
Wenn Sie Szenarien mit ungewöhnlich hoher gleichzeitiger Nutzung erwarten (z. B. Live-Schulungssitzungen mit großen Gruppen), benötigen Sie möglicherweise höhere TPM-Zuordnungen pro Benutzer.

Token-Nutzung reduzieren

  • Kompakte Konversationen:
    • Claude verwendet standardmäßig Auto-Compact, wenn der Kontext 95% Kapazität überschreitet
    • Auto-Compact umschalten: Führen Sie /config aus und navigieren Sie zu “Auto-compact enabled”
    • Verwenden Sie /compact manuell, wenn der Kontext groß wird
    • Fügen Sie benutzerdefinierte Anweisungen hinzu: /compact Focus on code samples and API usage
    • Passen Sie die Komprimierung an, indem Sie zu CLAUDE.md hinzufügen:
      # Summary instructions
      
      When you are using compact, please focus on test output and code changes
      
  • Schreiben Sie spezifische Abfragen: Vermeiden Sie vage Anfragen, die unnötige Scans auslösen
  • Zerlegen Sie komplexe Aufgaben: Teilen Sie große Aufgaben in fokussierte Interaktionen auf
  • Löschen Sie den Verlauf zwischen Aufgaben: Verwenden Sie /clear, um den Kontext zurückzusetzen
Die Kosten können je nach folgenden Faktoren erheblich variieren:
  • Größe der analysierten Codebasis
  • Komplexität der Abfragen
  • Anzahl der durchsuchten oder geänderten Dateien
  • Länge des Konversationsverlaufs
  • Häufigkeit der Konversationskomprimierung

Hintergrund-Token-Nutzung

Claude Code verwendet Token für einige Hintergrundfunktionen, auch wenn es untätig ist:
  • Konversationszusammenfassung: Hintergrund-Jobs, die vorherige Konversationen für die Funktion claude --resume zusammenfassen
  • Befehlsverarbeitung: Einige Befehle wie /cost können Anfragen zum Überprüfen des Status generieren
Diese Hintergrundprozesse verbrauchen eine kleine Menge Token (typischerweise unter $0.04 pro Sitzung), auch ohne aktive Interaktion.

Verfolgung von Versionsänderungen und Updates

Aktuelle Versionsinformationen

Um Ihre aktuelle Claude Code-Version und Installationsdetails zu überprüfen:
claude doctor
Dieser Befehl zeigt Ihre Version, den Installationstyp und Systeminformationen an.

Verständnis von Änderungen im Claude Code-Verhalten

Claude Code erhält regelmäßig Updates, die ändern können, wie Funktionen funktionieren, einschließlich Kostenberichte:
  • Versionsverfolgung: Verwenden Sie claude doctor, um Ihre aktuelle Version zu sehen
  • Verhaltensänderungen: Funktionen wie /cost können Informationen in verschiedenen Versionen unterschiedlich anzeigen
  • Dokumentationszugriff: Claude hat immer Zugriff auf die neueste Dokumentation, die helfen kann, das aktuelle Funktionsverhalten zu erklären

Wenn sich die Kostenberichterstattung ändert

Wenn Sie Änderungen in der Anzeige von Kosten bemerken (z. B. der /cost-Befehl zeigt unterschiedliche Informationen an):
  1. Überprüfen Sie Ihre Version: Führen Sie claude doctor aus, um Ihre aktuelle Version zu bestätigen
  2. Konsultieren Sie die Dokumentation: Fragen Sie Claude direkt nach dem aktuellen Funktionsverhalten, da es Zugriff auf aktuelle Dokumentation hat
  3. Kontaktieren Sie den Support: Bei spezifischen Abrechnungsfragen wenden Sie sich an den Anthropic-Support über Ihr Console-Konto
Für Team-Bereitstellungen empfehlen wir, mit einer kleinen Pilotgruppe zu beginnen, um Nutzungsmuster zu etablieren, bevor Sie einen breiteren Rollout durchführen.