Documentation Index
Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
Conditions préalables
Avant de configurer Claude Code avec Vertex AI, assurez-vous que vous disposez de :- Un compte Google Cloud Platform (GCP) avec facturation activée
- Un projet GCP avec l’API Vertex AI activée
- Accès aux modèles Claude souhaités (par exemple, Claude Sonnet 4.6)
- Google Cloud SDK (
gcloud) installé et configuré - Quota alloué dans la région GCP souhaitée
Se connecter avec Vertex AI
Si vous disposez d’identifiants Google Cloud et souhaitez commencer à utiliser Claude Code via Vertex AI, l’assistant de connexion vous guide à travers le processus. Vous complétez les conditions préalables du côté GCP une fois par projet ; l’assistant gère le côté Claude Code.L’assistant de configuration Vertex AI nécessite Claude Code v2.1.98 ou version ultérieure. Exécutez
claude --version pour vérifier.Activer les modèles Claude dans votre projet GCP
Activez l’API Vertex AI pour votre projet, puis demandez l’accès aux modèles Claude que vous souhaitez dans le Vertex AI Model Garden. Consultez Configuration IAM pour les autorisations dont votre compte a besoin.
Démarrer Claude Code et choisir Vertex AI
Exécutez
claude. À l’invite de connexion, sélectionnez plateforme tierce, puis Google Vertex AI.Suivre les invites de l'assistant
Choisissez comment vous vous authentifiez auprès de Google Cloud : identifiants par défaut de l’application à partir de
gcloud, fichier de clé de compte de service, ou identifiants déjà dans votre environnement. L’assistant détecte votre projet et votre région, vérifie quels modèles Claude votre projet peut invoquer, et vous permet de les épingler. Il enregistre le résultat dans le bloc env de votre fichier de paramètres utilisateur, vous n’avez donc pas besoin d’exporter les variables d’environnement vous-même./setup-vertex à tout moment pour rouvrir l’assistant et modifier vos identifiants, votre projet, votre région ou vos épingles de modèle.
Configuration de la région
Claude Code prend en charge les points de terminaison Vertex AI globaux, multi-régions et régionaux. DéfinissezCLOUD_ML_REGION sur global, un emplacement multi-région tel que eu ou us, ou une région spécifique telle que us-east5. Claude Code sélectionne le nom d’hôte Vertex AI correct pour chaque formulaire, y compris les hôtes aiplatform.eu.rep.googleapis.com et aiplatform.us.rep.googleapis.com pour les emplacements multi-régions.
Vertex AI peut ne pas prendre en charge les modèles par défaut de Claude Code sur tous les types de points de terminaison. La disponibilité des modèles varie selon les régions spécifiques, les emplacements multi-régions et les points de terminaison globaux. Vous devrez peut-être basculer vers un emplacement pris en charge ou spécifier un modèle pris en charge.
Configuration manuelle
Pour configurer Vertex AI via des variables d’environnement au lieu de l’assistant, par exemple dans CI ou un déploiement d’entreprise scriptée, suivez les étapes ci-dessous.1. Activer l’API Vertex AI
Activez l’API Vertex AI dans votre projet GCP :2. Demander l’accès au modèle
Demandez l’accès aux modèles Claude dans Vertex AI :- Accédez au Vertex AI Model Garden
- Recherchez les modèles ’ Claude ’
- Demandez l’accès aux modèles Claude souhaités (par exemple, Claude Sonnet 4.6)
- Attendez l’approbation (peut prendre 24 à 48 heures)
3. Configurer les identifiants GCP
Claude Code utilise l’authentification Google Cloud standard. Pour plus d’informations, consultez la documentation d’authentification Google Cloud. Claude Code v2.1.121 ou version ultérieure prend en charge la Fédération d’identité de charge de travail basée sur certificat X.509 via la même chaîne Application Default Credentials. DéfinissezGOOGLE_APPLICATION_CREDENTIALS sur le chemin de votre fichier de configuration des identifiants.
Claude Code utilise
ANTHROPIC_VERTEX_PROJECT_ID comme ID de projet pour les demandes Vertex AI. Les variables d’environnement GCLOUD_PROJECT et GOOGLE_CLOUD_PROJECT et le fichier d’identifiants référencé par GOOGLE_APPLICATION_CREDENTIALS ont la priorité sur celui-ci. Si aucun de ces éléments n’est défini, l’ID de projet est résolu à partir de votre configuration gcloud ou du compte de service attaché.Configuration avancée des identifiants
Claude Code prend en charge l’actualisation automatique des identifiants GCP via le paramètregcpAuthRefresh. Lorsque Claude Code détecte que vos identifiants GCP ont expiré ou ne peuvent pas être chargés, il exécute la commande configurée pour obtenir de nouveaux identifiants avant de réessayer la demande.
gcpAuthRefresh dans les paramètres du projet tels que .claude/settings.json, la commande s’exécute uniquement après que vous ayez accepté l’invite de confiance de l’espace de travail.
4. Configurer Claude Code
Définissez les variables d’environnement suivantes :VERTEX_REGION_CLAUDE_* correspondante. Consultez la référence des variables d’environnement pour la liste complète. Vérifiez Vertex Model Garden pour déterminer quels modèles prennent en charge les points de terminaison globaux par rapport aux points de terminaison régionaux uniquement.
La mise en cache des invites est activée automatiquement. Pour la désactiver, définissez DISABLE_PROMPT_CACHING=1. Pour demander une TTL de cache d’1 heure au lieu de la valeur par défaut de 5 minutes, définissez ENABLE_PROMPT_CACHING_1H=1 ; les écritures de cache avec une TTL d’1 heure sont facturées à un taux plus élevé. Pour des limites de débit accrues, contactez le support Google Cloud. Lors de l’utilisation de Vertex AI, les commandes /login et /logout sont désactivées car l’authentification est gérée via les identifiants Google Cloud.
La recherche d’outils MCP est désactivée par défaut sur Vertex AI car le point de terminaison n’accepte pas l’en-tête bêta requis. Toutes les définitions d’outils MCP se chargent à l’avance à la place. Pour participer, définissez ENABLE_TOOL_SEARCH=true.
5. Épingler les versions de modèle
Définissez ces variables d’environnement sur des ID de modèle Vertex AI spécifiques. SansANTHROPIC_DEFAULT_OPUS_MODEL, l’alias opus sur Vertex se résout à Opus 4.6. Définissez-le sur l’ID Opus 4.7 pour utiliser le dernier modèle :
| Type de modèle | Valeur par défaut |
|---|---|
| Modèle principal | claude-sonnet-4-5@20250929 |
| Modèle petit/rapide | claude-haiku-4-5@20251001 |
Vérifications du modèle au démarrage
Lorsque Claude Code démarre avec Vertex AI configuré, il vérifie que les modèles qu’il a l’intention d’utiliser sont accessibles dans votre projet. Cette vérification nécessite Claude Code v2.1.98 ou version ultérieure. Si vous avez épinglé une version de modèle plus ancienne que la valeur par défaut actuelle de Claude Code, et que votre projet peut invoquer la version plus récente, Claude Code vous invite à mettre à jour l’épingle. L’acceptation écrit le nouvel ID de modèle dans votre fichier de paramètres utilisateur et redémarre Claude Code. Le refus est mémorisé jusqu’au prochain changement de version par défaut. Si vous n’avez pas épinglé un modèle et que la valeur par défaut actuelle n’est pas disponible dans votre projet, Claude Code revient à la version précédente pour la session actuelle et affiche un avis. Le retour n’est pas persistant. Activez le modèle plus récent dans Model Garden ou épinglez une version pour rendre le choix permanent.Configuration IAM
Attribuez les autorisations IAM requises : Le rôleroles/aiplatform.user inclut les autorisations requises :
aiplatform.endpoints.predict- Requis pour l’invocation de modèle et le comptage des jetons
Créez un projet GCP dédié pour Claude Code pour simplifier le suivi des coûts et le contrôle d’accès.
Fenêtre de contexte de 1M de jetons
Claude Opus 4.7, Opus 4.6 et Sonnet 4.6 prennent en charge la fenêtre de contexte de 1M de jetons sur Vertex AI. Claude Code active automatiquement la fenêtre de contexte étendue lorsque vous sélectionnez une variante de modèle 1M. L’assistant de configuration offre une option de contexte 1M lorsqu’il épingle les modèles. Pour l’activer pour un modèle épinglé manuellement à la place, ajoutez[1m] à l’ID du modèle. Consultez Épingler les modèles pour les déploiements tiers pour plus de détails.
Résolution des problèmes
Si vous rencontrez des erreurs « Impossible de charger les identifiants par défaut » :- Exécutez
gcloud auth application-default loginpour configurer les identifiants par défaut de l’application - Définissez
GOOGLE_APPLICATION_CREDENTIALSsur le chemin d’un fichier de clé de compte de service - Consultez Configurer les identifiants GCP pour toutes les options
- Vérifiez les quotas actuels ou demandez une augmentation de quota via la Console Cloud
- Confirmez que le modèle est activé dans Model Garden
- Vérifiez que le modèle est disponible dans l’emplacement que vous avez spécifié. Certains modèles ne sont proposés que sur les emplacements
globalou multi-régions tels queeuetus, pas dans les régions spécifiques - Si vous utilisez
CLOUD_ML_REGION=global, vérifiez que vos modèles prennent en charge les points de terminaison globaux dans Model Garden sous « Fonctionnalités prises en charge ». Pour les modèles qui ne prennent pas en charge les points de terminaison globaux, soit :- Spécifiez un modèle pris en charge via
ANTHROPIC_MODELouANTHROPIC_DEFAULT_HAIKU_MODEL, soit - Définissez une région ou un emplacement multi-région à l’aide des variables d’environnement
VERTEX_REGION_<MODEL_NAME>
- Spécifiez un modèle pris en charge via
- Pour les points de terminaison régionaux, assurez-vous que le modèle principal et le modèle petit/rapide sont pris en charge dans votre région sélectionnée
- Envisagez de basculer vers
CLOUD_ML_REGION=globalpour une meilleure disponibilité