Voraussetzungen
Bevor Sie Claude Code mit Vertex AI konfigurieren, stellen Sie sicher, dass Sie über Folgendes verfügen:- Ein Google Cloud Platform (GCP)-Konto mit aktivierter Abrechnung
- Ein GCP-Projekt mit aktivierter Vertex AI API
- Zugriff auf gewünschte Claude-Modelle (z. B. Claude Sonnet 4.5)
- Google Cloud SDK (
gcloud) installiert und konfiguriert - Kontingent in der gewünschten GCP-Region zugewiesen
Region-Konfiguration
Claude Code kann sowohl mit Vertex AI global als auch mit regionalen Endpunkten verwendet werden.Vertex AI unterstützt möglicherweise die Claude Code-Standardmodelle nicht in allen Regionen. Möglicherweise müssen Sie zu einer unterstützten Region oder einem unterstützten Modell wechseln.
Vertex AI unterstützt möglicherweise die Claude Code-Standardmodelle nicht auf globalen Endpunkten. Möglicherweise müssen Sie zu einem regionalen Endpunkt oder einem unterstützten Modell wechseln.
Setup
1. Vertex AI API aktivieren
Aktivieren Sie die Vertex AI API in Ihrem GCP-Projekt:2. Modellzugriff anfordern
Fordern Sie Zugriff auf Claude-Modelle in Vertex AI an:- Navigieren Sie zum Vertex AI Model Garden
- Suchen Sie nach “Claude”-Modellen
- Fordern Sie Zugriff auf gewünschte Claude-Modelle an (z. B. Claude Sonnet 4.5)
- Warten Sie auf Genehmigung (kann 24-48 Stunden dauern)
3. GCP-Anmeldedaten konfigurieren
Claude Code verwendet die standardmäßige Google Cloud-Authentifizierung. Weitere Informationen finden Sie in der Google Cloud-Authentifizierungsdokumentation.Bei der Authentifizierung verwendet Claude Code automatisch die Projekt-ID aus der Umgebungsvariablen
ANTHROPIC_VERTEX_PROJECT_ID. Um dies zu überschreiben, legen Sie eine dieser Umgebungsvariablen fest: GCLOUD_PROJECT, GOOGLE_CLOUD_PROJECT oder GOOGLE_APPLICATION_CREDENTIALS.4. Claude Code konfigurieren
Legen Sie die folgenden Umgebungsvariablen fest:Prompt Caching wird automatisch unterstützt, wenn Sie das
cache_control Ephemeral-Flag angeben. Um es zu deaktivieren, legen Sie DISABLE_PROMPT_CACHING=1 fest. Für erhöhte Ratenlimits wenden Sie sich an den Google Cloud-Support.Bei Verwendung von Vertex AI sind die Befehle
/login und /logout deaktiviert, da die Authentifizierung über Google Cloud-Anmeldedaten erfolgt.5. Modellkonfiguration
Claude Code verwendet diese Standardmodelle für Vertex AI:| Modelltyp | Standardwert |
|---|---|
| Primäres Modell | claude-sonnet-4-5@20250929 |
| Kleines/schnelles Modell | claude-haiku-4-5@20251001 |
Für Vertex AI-Benutzer wird Claude Code nicht automatisch von Haiku 3.5 auf Haiku 4.5 aktualisiert. Um manuell zu einem neueren Haiku-Modell zu wechseln, legen Sie die Umgebungsvariable
ANTHROPIC_DEFAULT_HAIKU_MODEL auf den vollständigen Modellnamen fest (z. B. claude-haiku-4-5@20251001).IAM-Konfiguration
Weisen Sie die erforderlichen IAM-Berechtigungen zu: Die Rolleroles/aiplatform.user umfasst die erforderlichen Berechtigungen:
aiplatform.endpoints.predict- Erforderlich für Modellaufrufe und Token-Zählung
Wir empfehlen, ein dediziertes GCP-Projekt für Claude Code zu erstellen, um die Kostenverfolgung und Zugriffskontrolle zu vereinfachen.
1M Token-Kontextfenster
Claude Sonnet 4 und Sonnet 4.5 unterstützen das 1M Token-Kontextfenster auf Vertex AI.Das 1M Token-Kontextfenster befindet sich derzeit in der Beta-Phase. Um das erweiterte Kontextfenster zu verwenden, fügen Sie den
context-1m-2025-08-07 Beta-Header in Ihre Vertex AI-Anfragen ein.Fehlerbehebung
Wenn Sie auf Kontingentprobleme stoßen:- Überprüfen Sie aktuelle Kontingente oder fordern Sie eine Kontingenterhöhung über die Cloud Console an
- Bestätigen Sie, dass das Modell im Model Garden aktiviert ist
- Überprüfen Sie, dass Sie Zugriff auf die angegebene Region haben
- Wenn Sie
CLOUD_ML_REGION=globalverwenden, überprüfen Sie, dass Ihre Modelle globale Endpunkte im Model Garden unter “Unterstützte Funktionen” unterstützen. Für Modelle, die globale Endpunkte nicht unterstützen, können Sie entweder:- Ein unterstütztes Modell über
ANTHROPIC_MODELoderANTHROPIC_SMALL_FAST_MODELangeben, oder - Einen regionalen Endpunkt mit
VERTEX_REGION_<MODEL_NAME>Umgebungsvariablen festlegen
- Ein unterstütztes Modell über
- Stellen Sie für regionale Endpunkte sicher, dass das primäre Modell und das kleine/schnelle Modell in Ihrer ausgewählten Region unterstützt werden
- Erwägen Sie, zu
CLOUD_ML_REGION=globalzu wechseln, um eine bessere Verfügbarkeit zu erreichen