Documentation Index
Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
Voraussetzungen
Bevor Sie Claude Code mit Vertex AI konfigurieren, stellen Sie sicher, dass Sie über Folgendes verfügen:- Ein Google Cloud Platform (GCP)-Konto mit aktivierter Abrechnung
- Ein GCP-Projekt mit aktivierter Vertex AI API
- Zugriff auf gewünschte Claude-Modelle (z. B. Claude Sonnet 4.6)
- Google Cloud SDK (
gcloud) installiert und konfiguriert - Kontingent im gewünschten GCP-Bereich zugewiesen
Anmelden mit Vertex AI
Wenn Sie Google Cloud-Anmeldedaten haben und Claude Code über Vertex AI verwenden möchten, führt Sie der Anmeldeasistent durch den Prozess. Sie führen die GCP-seitigen Voraussetzungen einmal pro Projekt durch; der Assistent kümmert sich um die Claude Code-Seite.Der Vertex AI-Setup-Assistent erfordert Claude Code v2.1.98 oder später. Führen Sie
claude --version aus, um dies zu überprüfen.Aktivieren Sie Claude-Modelle in Ihrem GCP-Projekt
Aktivieren Sie die Vertex AI API für Ihr Projekt, und fordern Sie dann Zugriff auf die Claude-Modelle an, die Sie im Vertex AI Model Garden möchten. Siehe IAM-Konfiguration für die Berechtigungen, die Ihr Konto benötigt.
Starten Sie Claude Code und wählen Sie Vertex AI
Führen Sie
claude aus. Wählen Sie bei der Anmeldeeingabeaufforderung 3rd-party platform und dann Google Vertex AI.Folgen Sie den Eingabeaufforderungen des Assistenten
Wählen Sie, wie Sie sich bei Google Cloud authentifizieren: Application Default Credentials von
gcloud, eine Service-Account-Schlüsseldatei oder Anmeldedaten, die bereits in Ihrer Umgebung vorhanden sind. Der Assistent erkennt Ihr Projekt und Ihre Region, überprüft, welche Claude-Modelle Ihr Projekt aufrufen kann, und ermöglicht es Ihnen, diese zu fixieren. Das Ergebnis wird im env-Block Ihrer Benutzereinstellungsdatei gespeichert, sodass Sie Umgebungsvariablen nicht selbst exportieren müssen./setup-vertex jederzeit aus, um den Assistenten erneut zu öffnen und Ihre Anmeldedaten, Ihr Projekt, Ihre Region oder Ihre Modellpins zu ändern.
Regionskonfiguration
Claude Code unterstützt Vertex AI globale, Multi-Region- und regionale Endpunkte. Legen SieCLOUD_ML_REGION auf global, einen Multi-Region-Standort wie eu oder us oder eine bestimmte Region wie us-east5 fest. Claude Code wählt den korrekten Vertex AI-Hostnamen für jedes Formular aus, einschließlich der Hosts aiplatform.eu.rep.googleapis.com und aiplatform.us.rep.googleapis.com für Multi-Region-Standorte.
Vertex AI unterstützt möglicherweise die Claude Code-Standardmodelle nicht auf jedem Endpunkttyp. Die Modellverfügbarkeit variiert je nach spezifischen Regionen, Multi-Region-Standorten und globalen Endpunkten. Möglicherweise müssen Sie zu einem unterstützten Standort wechseln oder ein unterstütztes Modell angeben.
Manuelles Setup
Um Vertex AI über Umgebungsvariablen statt über den Assistenten zu konfigurieren, z. B. in CI oder einem skriptgesteuerten Enterprise-Rollout, folgen Sie den folgenden Schritten.1. Aktivieren Sie die Vertex AI API
Aktivieren Sie die Vertex AI API in Ihrem GCP-Projekt:2. Fordern Sie Modellzugriff an
Fordern Sie Zugriff auf Claude-Modelle in Vertex AI an:- Navigieren Sie zum Vertex AI Model Garden
- Suchen Sie nach ‘Claude”-Modellen
- Fordern Sie Zugriff auf gewünschte Claude-Modelle an (z. B. Claude Sonnet 4.6)
- Warten Sie auf Genehmigung (kann 24–48 Stunden dauern)
3. Konfigurieren Sie GCP-Anmeldedaten
Claude Code verwendet die standardmäßige Google Cloud-Authentifizierung. Weitere Informationen finden Sie in der Google Cloud-Authentifizierungsdokumentation. Claude Code v2.1.121 oder später unterstützt X.509-zertifikatbasierte Workload Identity Federation über die gleiche Application Default Credentials-Kette. Legen SieGOOGLE_APPLICATION_CREDENTIALS auf den Pfad Ihrer Anmeldedaten-Konfigurationsdatei fest.
Claude Code verwendet
ANTHROPIC_VERTEX_PROJECT_ID als die Projekt-ID für Vertex AI-Anfragen. Die Umgebungsvariablen GCLOUD_PROJECT und GOOGLE_CLOUD_PROJECT sowie die Anmeldedatei, auf die GOOGLE_APPLICATION_CREDENTIALS verweist, haben Vorrang vor ihr. Wenn keine dieser Optionen gesetzt sind, wird die Projekt-ID aus Ihrer gcloud-Konfiguration oder dem angehängten Service-Konto aufgelöst.Erweiterte Anmeldedaten-Konfiguration
Claude Code unterstützt die automatische Aktualisierung von Anmeldedaten für GCP über die EinstellunggcpAuthRefresh. Wenn Claude Code erkennt, dass Ihre GCP-Anmeldedaten abgelaufen sind oder nicht geladen werden können, führt es den konfigurierten Befehl aus, um neue Anmeldedaten zu erhalten, bevor die Anfrage erneut versucht wird.
gcpAuthRefresh in Projekteinstellungen wie .claude/settings.json festlegen, wird der Befehl nur ausgeführt, nachdem Sie die Workspace-Vertrauensaufforderung akzeptiert haben.
4. Konfigurieren Sie Claude Code
Legen Sie die folgenden Umgebungsvariablen fest:VERTEX_REGION_CLAUDE_*-Variable. Siehe die Referenz für Umgebungsvariablen für die vollständige Liste. Überprüfen Sie Vertex Model Garden, um zu bestimmen, welche Modelle globale Endpunkte versus nur regionale Endpunkte unterstützen.
Prompt Caching wird automatisch aktiviert. Um es zu deaktivieren, legen Sie DISABLE_PROMPT_CACHING=1 fest. Um eine 1-Stunden-Cache-TTL statt des 5-Minuten-Standards anzufordern, legen Sie ENABLE_PROMPT_CACHING_1H=1 fest; Cache-Schreibvorgänge mit einer 1-Stunden-TTL werden mit einem höheren Satz abgerechnet. Für erhöhte Ratenlimits wenden Sie sich an den Google Cloud-Support. Bei Verwendung von Vertex AI sind die Befehle /login und /logout deaktiviert, da die Authentifizierung über Google Cloud-Anmeldedaten erfolgt.
Claude Code deaktiviert MCP-Toolsuche standardmäßig auf Vertex AI, sodass MCP-Tool-Definitionen beim Start geladen werden. Vertex AI unterstützt Toolsuche für Claude Sonnet 4.5 und später sowie Claude Opus 4.5 und später. Legen Sie ENABLE_TOOL_SEARCH=true fest, um sie auf diesen Modellen zu aktivieren. Frühere Modelle auf Vertex AI akzeptieren den erforderlichen Beta-Header nicht, und Anfragen schlagen fehl, wenn Sie die Toolsuche mit ihnen aktivieren.
5. Fixieren Sie Modellversionen
Legen Sie diese Umgebungsvariablen auf spezifische Vertex AI-Modell-IDs fest. OhneANTHROPIC_DEFAULT_OPUS_MODEL wird der opus-Alias auf Vertex zu Opus 4.6 aufgelöst. Legen Sie ihn auf die Opus 4.7-ID fest, um das neueste Modell zu verwenden:
| Modelltyp | Standardwert |
|---|---|
| Primäres Modell | claude-sonnet-4-5@20250929 |
| Kleines/schnelles Modell | Gleich wie primäres Modell |
ANTHROPIC_DEFAULT_HAIKU_MODEL auf eine Modell-ID fest, die in Ihrem Projekt verfügbar ist.
Um Modelle weiter anzupassen:
Startmodellprüfungen
Wenn Claude Code mit konfiguriertem Vertex AI startet, überprüft es, dass die Modelle, die es verwenden möchte, in Ihrem Projekt zugänglich sind. Diese Prüfung erfordert Claude Code v2.1.98 oder später. Wenn Sie eine Modellversion fixiert haben, die älter als der aktuelle Claude Code-Standard ist, und Ihr Projekt die neuere Version aufrufen kann, fordert Claude Code Sie auf, die Fixierung zu aktualisieren. Das Akzeptieren schreibt die neue Modell-ID in Ihre Benutzereinstellungsdatei und startet Claude Code neu. Das Ablehnen wird bis zur nächsten Standardversionänderung beibehalten. Wenn Sie ein Modell nicht fixiert haben und der aktuelle Standard in Ihrem Projekt nicht verfügbar ist, fällt Claude Code für die aktuelle Sitzung zur vorherigen Version zurück und zeigt einen Hinweis an. Das Fallback wird nicht beibehalten. Aktivieren Sie das neuere Modell im Model Garden oder fixieren Sie eine Version, um die Auswahl dauerhaft zu machen.IAM-Konfiguration
Weisen Sie die erforderlichen IAM-Berechtigungen zu: Die Rolleroles/aiplatform.user umfasst die erforderlichen Berechtigungen:
aiplatform.endpoints.predict- Erforderlich für Modellaufrufe und Token-Zählung
Erstellen Sie ein dediziertes GCP-Projekt für Claude Code, um die Kostenverfolgung und Zugriffskontrolle zu vereinfachen.
1M-Token-Kontextfenster
Claude Opus 4.7, Opus 4.6 und Sonnet 4.6 unterstützen das 1M-Token-Kontextfenster auf Vertex AI. Claude Code aktiviert automatisch das erweiterte Kontextfenster, wenn Sie eine 1M-Modellvariante auswählen. Der Setup-Assistent bietet eine 1M-Kontextoption an, wenn er Modelle fixiert. Um es stattdessen für ein manuell fixiertes Modell zu aktivieren, hängen Sie[1m] an die Modell-ID an. Siehe Modelle für Drittanbieter-Bereitstellungen fixieren für Details.
Fehlerbehebung
Wenn Sie auf Fehler „Could not load the default credentials” stoßen:- Führen Sie
gcloud auth application-default loginaus, um Application Default Credentials einzurichten - Setzen Sie
GOOGLE_APPLICATION_CREDENTIALSauf einen Pfad zu einer Service-Account-Schlüsseldatei - Siehe GCP-Anmeldedaten konfigurieren für alle Optionen
- Überprüfen Sie aktuelle Kontingente oder fordern Sie eine Kontingenterhöhung über die Cloud Console an
- Bestätigen Sie, dass das Modell im Model Garden aktiviert ist
- Überprüfen Sie, dass das Modell am angegebenen Standort verfügbar ist. Einige Modelle werden nur auf
globaloder Multi-Region-Standorten wieeuundusangeboten, nicht in spezifischen Regionen - Wenn Sie
CLOUD_ML_REGION=globalverwenden, überprüfen Sie, dass Ihre Modelle globale Endpunkte im Model Garden unter „Unterstützte Funktionen” unterstützen. Für Modelle, die globale Endpunkte nicht unterstützen, können Sie entweder:- Ein unterstütztes Modell über
ANTHROPIC_MODELoderANTHROPIC_DEFAULT_HAIKU_MODELangeben, oder - Einen regionalen oder Multi-Region-Standort mit
VERTEX_REGION_<MODEL_NAME>-Umgebungsvariablen festlegen
- Ein unterstütztes Modell über
- Stellen Sie für regionale Endpunkte sicher, dass das primäre Modell und das kleine/schnelle Modell in Ihrer ausgewählten Region unterstützt werden
- Erwägen Sie, zu
CLOUD_ML_REGION=globalzu wechseln, um bessere Verfügbarkeit zu erreichen