LLM-Gateways bieten eine zentralisierte Proxy-Schicht zwischen Claude Code und Modellanbietern und bieten häufig:Documentation Index
Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
- Zentralisierte Authentifizierung - Einzelner Punkt für die API-Schlüsselverwaltung
- Nutzungsverfolgung - Überwachen Sie die Nutzung über Teams und Projekte hinweg
- Kostenkontrollen - Implementieren Sie Budgets und Ratenlimits
- Audit-Protokollierung - Verfolgen Sie alle Modellinteraktionen zur Compliance
- Modell-Routing - Wechseln Sie zwischen Anbietern ohne Code-Änderungen
Gateway-Anforderungen
Damit ein LLM-Gateway mit Claude Code funktioniert, muss es die folgenden Anforderungen erfüllen: API-Format Das Gateway muss Clients mindestens eines der folgenden API-Formate bereitstellen:-
Anthropic Messages:
/v1/messages,/v1/messages/count_tokens- Muss Request-Header weiterleiten:
anthropic-beta,anthropic-version
- Muss Request-Header weiterleiten:
-
Bedrock InvokeModel:
/invoke,/invoke-with-response-stream- Muss Request-Body-Felder beibehalten:
anthropic_beta,anthropic_version
- Muss Request-Body-Felder beibehalten:
-
Vertex rawPredict:
:rawPredict,:streamRawPredict,/count-tokens:rawPredict- Muss Request-Header weiterleiten:
anthropic-beta,anthropic-version
- Muss Request-Header weiterleiten:
Claude Code bestimmt, welche Funktionen aktiviert werden sollen, basierend auf dem API-Format. Bei Verwendung des Anthropic Messages-Formats mit Bedrock oder Vertex müssen Sie möglicherweise die Umgebungsvariable
CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1 setzen.| Header | Beschreibung |
|---|---|
X-Claude-Code-Session-Id | Ein eindeutiger Bezeichner für die aktuelle Claude Code-Sitzung. Proxies können dies verwenden, um alle API-Anfragen aus einer einzelnen Sitzung zu aggregieren, ohne den Request-Body zu analysieren. |
X-Claude-Code-Agent-Id | Bezeichner des Subagenten oder Teamkollegen, der die Anfrage gestellt hat. Ihr Proxy kann dies verwenden, um API-Kosten einzelnen parallelen Subagenten innerhalb einer Sitzung zuzuordnen, ohne den Request-Body zu analysieren. Nur für Anfragen vorhanden, die von einem In-Process-Subagenten oder Teamkollegen gestellt werden. |
X-Claude-Code-Parent-Agent-Id | Bezeichner des Agenten, der den Agent spawnte, der die Anfrage stellt. Verwenden Sie dies zusammen mit X-Claude-Code-Agent-Id, um API-Kosten über verschachtelte Agenten in Ihrem Proxy zuzuordnen. Nur vorhanden, wenn der anfragende Agent selbst von einem anderen Agenten gespawnt wurde. |
CLAUDE_CODE_ATTRIBUTION_HEADER=0, um ihn auszulassen.
Konfiguration
Modellauswahl
Standardmäßig verwendet Claude Code Standard-Modellnamen für das ausgewählte API-Format. WennANTHROPIC_BASE_URL auf ein Gateway verweist, das das Anthropic Messages-Format bereitstellt, fragt Claude Code beim Start den /v1/models-Endpunkt des Gateways ab und fügt die zurückgegebenen Modelle zur /model-Auswahl hinzu. Setzen Sie CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1, um dies zu aktivieren. Die Erkennung ist standardmäßig deaktiviert, damit Gateways, die durch einen gemeinsamen API-Schlüssel unterstützt werden, nicht jedes Modell, auf das der Schlüssel zugreifen kann, jedem Benutzer anzeigen. Jeder erkannte Eintrag ist mit „Aus Gateway” gekennzeichnet und verwendet das Feld display_name aus der Antwort, wenn eines bereitgestellt wird. Dies erfordert Claude Code v2.1.129 oder später.
Die Erkennung gilt nur für das Anthropic Messages-Format. Sie wird nicht für Bedrock- oder Vertex-Pass-Through-Endpunkte ausgeführt und wird nicht ausgeführt, wenn ANTHROPIC_BASE_URL nicht gesetzt ist oder auf api.anthropic.com verweist.
Die Erkennungsanfrage authentifiziert sich auf die gleiche Weise wie Inferenzanfragen: Sie sendet ANTHROPIC_AUTH_TOKEN als Bearer-Token oder ANTHROPIC_API_KEY als x-api-key-Header, wenn kein Auth-Token gesetzt ist, zusammen mit allen Headern aus ANTHROPIC_CUSTOM_HEADERS. Nur Modelle, deren ID mit claude oder anthropic beginnt, werden zur Auswahl hinzugefügt. Die Ergebnisse werden in ~/.claude/cache/gateway-models.json zwischengespeichert und bei jedem Start aktualisiert. Wenn die Anfrage fehlschlägt oder das Gateway /v1/models nicht implementiert, wird die Auswahl auf die zwischengespeicherte Liste vom vorherigen Start oder auf die integrierte Modellliste zurückgesetzt.
Wenn Ihr Gateway Modellnamen verwendet, die nicht dem Erkennungsfilter entsprechen, verwenden Sie die in Modellkonfiguration dokumentierten Umgebungsvariablen, um sie manuell hinzuzufügen.
LiteLLM-Konfiguration
Voraussetzungen
- Claude Code auf die neueste Version aktualisiert
- LiteLLM Proxy Server bereitgestellt und zugänglich
- Zugriff auf Claude-Modelle über Ihren gewählten Anbieter
Grundlegende LiteLLM-Einrichtung
Konfigurieren Sie Claude Code:Authentifizierungsmethoden
Statischer API-Schlüssel
Einfachste Methode mit einem festen API-Schlüssel:Authorization-Header gesendet.
Dynamischer API-Schlüssel mit Helper
Für rotierende Schlüssel oder Pro-Benutzer-Authentifizierung:- Erstellen Sie ein API-Schlüssel-Helper-Skript:
- Konfigurieren Sie Claude Code-Einstellungen zur Verwendung des Helpers:
- Legen Sie das Token-Aktualisierungsintervall fest:
Authorization- und X-Api-Key-Header gesendet. Der apiKeyHelper hat eine niedrigere Priorität als ANTHROPIC_AUTH_TOKEN oder ANTHROPIC_API_KEY.
Einheitlicher Endpoint (empfohlen)
Verwendung von LiteLLMs Anthropic-Format-Endpoint:- Lastverteilung
- Fallbacks
- Konsistente Unterstützung für Kosten-Tracking und End-Benutzer-Tracking