Voraussetzungen
Bevor Sie Claude Code mit Vertex AI konfigurieren, stellen Sie sicher, dass Sie über Folgendes verfügen:- Ein Google Cloud Platform (GCP)-Konto mit aktivierter Abrechnung
- Ein GCP-Projekt mit aktivierter Vertex AI API
- Zugriff auf gewünschte Claude-Modelle (z. B. Claude Sonnet 4.6)
- Google Cloud SDK (
gcloud) installiert und konfiguriert - Kontingent im gewünschten GCP-Bereich zugewiesen
Wenn Sie Claude Code für mehrere Benutzer bereitstellen, fixieren Sie Ihre Modellversionen, um Fehler zu vermeiden, wenn Anthropic neue Modelle veröffentlicht.
Regionskonfiguration
Claude Code kann sowohl mit Vertex AI global als auch mit regionalen Endpunkten verwendet werden.Vertex AI unterstützt möglicherweise die Claude Code-Standardmodelle nicht in allen Regionen oder auf globalen Endpunkten. Möglicherweise müssen Sie zu einer unterstützten Region wechseln, einen regionalen Endpunkt verwenden oder ein unterstütztes Modell angeben.
Setup
1. Vertex AI API aktivieren
Aktivieren Sie die Vertex AI API in Ihrem GCP-Projekt:2. Modellzugriff anfordern
Fordern Sie Zugriff auf Claude-Modelle in Vertex AI an:- Navigieren Sie zum Vertex AI Model Garden
- Suchen Sie nach „Claude”-Modellen
- Fordern Sie Zugriff auf gewünschte Claude-Modelle an (z. B. Claude Sonnet 4.6)
- Warten Sie auf Genehmigung (kann 24–48 Stunden dauern)
3. GCP-Anmeldedaten konfigurieren
Claude Code verwendet die standardmäßige Google Cloud-Authentifizierung. Weitere Informationen finden Sie in der Google Cloud-Authentifizierungsdokumentation.Bei der Authentifizierung verwendet Claude Code automatisch die Projekt-ID aus der Umgebungsvariablen
ANTHROPIC_VERTEX_PROJECT_ID. Um dies zu überschreiben, legen Sie eine dieser Umgebungsvariablen fest: GCLOUD_PROJECT, GOOGLE_CLOUD_PROJECT oder GOOGLE_APPLICATION_CREDENTIALS.4. Claude Code konfigurieren
Legen Sie die folgenden Umgebungsvariablen fest:cache_control ephemeral angeben. Um es zu deaktivieren, legen Sie DISABLE_PROMPT_CACHING=1 fest. Für erhöhte Ratenlimits wenden Sie sich an den Google Cloud-Support. Bei Verwendung von Vertex AI sind die Befehle /login und /logout deaktiviert, da die Authentifizierung über Google Cloud-Anmeldedaten erfolgt.
5. Modellversionen fixieren
Legen Sie diese Umgebungsvariablen auf spezifische Vertex AI-Modell-IDs fest:| Modelltyp | Standardwert |
|---|---|
| Primäres Modell | claude-sonnet-4-6 |
| Kleines/schnelles Modell | claude-haiku-4-5@20251001 |
IAM-Konfiguration
Weisen Sie die erforderlichen IAM-Berechtigungen zu: Die Rolleroles/aiplatform.user umfasst die erforderlichen Berechtigungen:
aiplatform.endpoints.predict- Erforderlich für Modellaufrufe und Token-Zählung
Erstellen Sie ein dediziertes GCP-Projekt für Claude Code, um die Kostenverfolgung und Zugriffskontrolle zu vereinfachen.
1M Token-Kontextfenster
Claude Opus 4.6, Sonnet 4.6, Sonnet 4.5 und Sonnet 4 unterstützen das 1M Token-Kontextfenster auf Vertex AI. Claude Code aktiviert automatisch das erweiterte Kontextfenster, wenn Sie eine 1M-Modellvariante auswählen. Um das 1M-Kontextfenster für Ihr fixiertes Modell zu aktivieren, hängen Sie[1m] an die Modell-ID an. Siehe Modelle für Drittanbieter-Bereitstellungen fixieren für Details.
Fehlerbehebung
Wenn Sie auf Kontingentprobleme stoßen:- Überprüfen Sie aktuelle Kontingente oder fordern Sie eine Kontingenterhöhung über die Cloud Console an
- Bestätigen Sie, dass das Modell im Model Garden aktiviert ist
- Überprüfen Sie, dass Sie Zugriff auf die angegebene Region haben
- Wenn Sie
CLOUD_ML_REGION=globalverwenden, überprüfen Sie, dass Ihre Modelle globale Endpunkte im Model Garden unter „Unterstützte Funktionen” unterstützen. Für Modelle, die globale Endpunkte nicht unterstützen, können Sie entweder:- Ein unterstütztes Modell über
ANTHROPIC_MODELoderANTHROPIC_SMALL_FAST_MODELangeben, oder - Einen regionalen Endpunkt mit
VERTEX_REGION_<MODEL_NAME>-Umgebungsvariablen festlegen
- Ein unterstütztes Modell über
- Stellen Sie für regionale Endpunkte sicher, dass das primäre Modell und das kleine/schnelle Modell in Ihrer ausgewählten Region unterstützt werden
- Erwägen Sie, zu
CLOUD_ML_REGION=globalzu wechseln, um bessere Verfügbarkeit zu erreichen