Documentation Index
Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
Prerequisiti
Prima di configurare Claude Code con Vertex AI, assicurati di avere:- Un account Google Cloud Platform (GCP) con fatturazione abilitata
- Un progetto GCP con Vertex AI API abilitata
- Accesso ai modelli Claude desiderati (ad esempio, Claude Sonnet 4.6)
- Google Cloud SDK (
gcloud) installato e configurato - Quota allocata nella regione GCP desiderata
Accedi con Vertex AI
Se hai credenziali Google Cloud e desideri iniziare a utilizzare Claude Code tramite Vertex AI, la procedura guidata di accesso ti guida attraverso i passaggi. Completi i prerequisiti lato GCP una volta per progetto; la procedura guidata gestisce il lato Claude Code.La procedura guidata di configurazione di Vertex AI richiede Claude Code v2.1.98 o versione successiva. Esegui
claude --version per verificare.Abilita i modelli Claude nel tuo progetto GCP
Abilita Vertex AI API per il tuo progetto, quindi richiedi accesso ai modelli Claude che desideri in Vertex AI Model Garden. Consulta Configurazione IAM per le autorizzazioni di cui il tuo account ha bisogno.
Avvia Claude Code e scegli Vertex AI
Esegui
claude. Al prompt di accesso, seleziona 3rd-party platform, quindi Google Vertex AI.Segui i prompt della procedura guidata
Scegli come autenticarti a Google Cloud: Application Default Credentials da
gcloud, un file di chiave dell’account di servizio, o credenziali già presenti nel tuo ambiente. La procedura guidata rileva il tuo progetto e la tua regione, verifica quali modelli Claude il tuo progetto può invocare, e ti consente di fissarli. Salva il risultato nel blocco env del tuo file di impostazioni utente, quindi non è necessario esportare variabili di ambiente da solo./setup-vertex in qualsiasi momento per riaprire la procedura guidata e modificare le tue credenziali, progetto, regione o fissaggi di modello.
Configurazione della regione
Claude Code supporta endpoint Vertex AI globali, multi-regione e regionali. ImpostaCLOUD_ML_REGION su global, una posizione multi-regione come eu o us, o una regione specifica come us-east5. Claude Code seleziona il nome host Vertex AI corretto per ogni modulo, inclusi gli host aiplatform.eu.rep.googleapis.com e aiplatform.us.rep.googleapis.com per le posizioni multi-regione.
Vertex AI potrebbe non supportare i modelli predefiniti di Claude Code su ogni tipo di endpoint. La disponibilità del modello varia tra regioni specifiche, posizioni multi-regione e endpoint globali. Potrebbe essere necessario passare a una posizione supportata o specificare un modello supportato.
Configurazione manuale
Per configurare Vertex AI tramite variabili di ambiente invece della procedura guidata, ad esempio in CI o in un rollout aziendale con script, segui i passaggi di seguito.1. Abilita Vertex AI API
Abilita Vertex AI API nel tuo progetto GCP:2. Richiedi accesso al modello
Richiedi accesso ai modelli Claude in Vertex AI:- Accedi a Vertex AI Model Garden
- Cerca i modelli “Claude”
- Richiedi accesso ai modelli Claude desiderati (ad esempio, Claude Sonnet 4.6)
- Attendi l’approvazione (potrebbe richiedere 24-48 ore)
3. Configura le credenziali GCP
Claude Code utilizza l’autenticazione standard di Google Cloud. Per ulteriori informazioni, consulta la documentazione di autenticazione di Google Cloud. Claude Code v2.1.121 o versioni successive supporta X.509 certificate-based Workload Identity Federation attraverso la stessa catena Application Default Credentials. ImpostaGOOGLE_APPLICATION_CREDENTIALS al percorso del tuo file di configurazione delle credenziali.
Claude Code utilizza
ANTHROPIC_VERTEX_PROJECT_ID come ID progetto per le richieste Vertex AI. Le variabili di ambiente GCLOUD_PROJECT e GOOGLE_CLOUD_PROJECT e il file di credenziali a cui fa riferimento GOOGLE_APPLICATION_CREDENTIALS hanno la precedenza su di esso. Se nessuno di questi è impostato, l’ID progetto viene risolto dalla tua configurazione gcloud o dall’account di servizio collegato.Configurazione avanzata delle credenziali
Claude Code supporta l’aggiornamento automatico delle credenziali GCP tramite l’impostazionegcpAuthRefresh. Quando Claude Code rileva che le tue credenziali GCP sono scadute o non possono essere caricate, esegue il comando configurato per ottenere nuove credenziali prima di riprovare la richiesta.
gcpAuthRefresh nelle impostazioni del progetto come .claude/settings.json, il comando viene eseguito solo dopo che accetti il prompt di fiducia dell’area di lavoro.
4. Configura Claude Code
Imposta le seguenti variabili di ambiente:VERTEX_REGION_CLAUDE_* corrispondente. Consulta il riferimento delle variabili di ambiente per l’elenco completo. Controlla Vertex Model Garden per determinare quali modelli supportano endpoint globali rispetto a quelli solo regionali.
Prompt caching è abilitato automaticamente. Per disabilitarlo, imposta DISABLE_PROMPT_CACHING=1. Per richiedere un TTL cache di 1 ora invece del valore predefinito di 5 minuti, imposta ENABLE_PROMPT_CACHING_1H=1; le scritture della cache con TTL di 1 ora vengono fatturate a una tariffa più elevata. Per limiti di velocità aumentati, contatta il supporto di Google Cloud. Quando utilizzi Vertex AI, i comandi /login e /logout sono disabilitati poiché l’autenticazione è gestita tramite le credenziali di Google Cloud.
Claude Code disabilita MCP tool search per impostazione predefinita su Vertex AI, quindi le definizioni degli strumenti MCP vengono caricate in anticipo. Vertex AI supporta la ricerca degli strumenti per Claude Sonnet 4.5 e versioni successive e Claude Opus 4.5 e versioni successive. Imposta ENABLE_TOOL_SEARCH=true per abilitarla su questi modelli. I modelli precedenti su Vertex AI non accettano l’intestazione beta richiesta e le richieste non riescono se abiliti la ricerca degli strumenti con essi.
5. Fissa le versioni del modello
Imposta queste variabili di ambiente su ID modello Vertex AI specifici. SenzaANTHROPIC_DEFAULT_OPUS_MODEL, l’alias opus su Vertex si risolve in Opus 4.6. Impostalo sull’ID di Opus 4.7 per utilizzare il modello più recente:
| Tipo di modello | Valore predefinito |
|---|---|
| Modello primario | claude-sonnet-4-5@20250929 |
| Modello piccolo/veloce | Uguale al modello primario |
ANTHROPIC_DEFAULT_HAIKU_MODEL su un ID modello disponibile nel tuo progetto.
Per personalizzare ulteriormente i modelli:
Controlli del modello all’avvio
Quando Claude Code si avvia con Vertex AI configurato, verifica che i modelli che intende utilizzare siano accessibili nel tuo progetto. Questo controllo richiede Claude Code v2.1.98 o versione successiva. Se hai fissato una versione del modello più vecchia del valore predefinito corrente di Claude Code, e il tuo progetto può invocare la versione più recente, Claude Code ti chiede di aggiornare il fissaggio. Accettare scrive il nuovo ID modello nel tuo file di impostazioni utente e riavvia Claude Code. Rifiutare viene ricordato fino al prossimo cambio di versione predefinita. Se non hai fissato un modello e il valore predefinito corrente non è disponibile nel tuo progetto, Claude Code ritorna alla versione precedente per la sessione corrente e mostra un avviso. Il ritorno non è persistente. Abilita il modello più recente in Model Garden o fissa una versione per rendere la scelta permanente.Configurazione IAM
Assegna le autorizzazioni IAM richieste: Il ruoloroles/aiplatform.user include le autorizzazioni richieste:
aiplatform.endpoints.predict- Richiesto per l’invocazione del modello e il conteggio dei token
Crea un progetto GCP dedicato per Claude Code per semplificare il tracciamento dei costi e il controllo degli accessi.
Finestra di contesto da 1M token
Claude Opus 4.7, Opus 4.6 e Sonnet 4.6 supportano la finestra di contesto da 1M token su Vertex AI. Claude Code abilita automaticamente la finestra di contesto estesa quando selezioni una variante di modello 1M. La procedura guidata di configurazione offre un’opzione di contesto 1M quando fissa i modelli. Per abilitarla per un modello fissato manualmente, aggiungi[1m] all’ID del modello. Consulta Fissa i modelli per le distribuzioni di terze parti per i dettagli.
Risoluzione dei problemi
Se riscontri errori “Could not load the default credentials”:- Esegui
gcloud auth application-default loginper configurare le credenziali predefinite dell’applicazione - Imposta
GOOGLE_APPLICATION_CREDENTIALSsu un percorso di file della chiave dell’account di servizio - Vedi Configure GCP credentials per tutte le opzioni
- Controlla le quote attuali o richiedi un aumento della quota tramite Cloud Console
- Conferma che il modello è abilitato in Model Garden
- Verifica che il modello sia disponibile nella posizione che hai specificato. Alcuni modelli sono offerti solo su posizioni
globalo multi-regione comeeueus, non in regioni specifiche - Se utilizzi
CLOUD_ML_REGION=global, controlla che i tuoi modelli supportino endpoint globali in Model Garden in “Supported features”. Per i modelli che non supportano endpoint globali, puoi:- Specificare un modello supportato tramite
ANTHROPIC_MODELoANTHROPIC_DEFAULT_HAIKU_MODEL, oppure - Impostare una regione o una posizione multi-regione utilizzando le variabili di ambiente
VERTEX_REGION_<MODEL_NAME>
- Specificare un modello supportato tramite
- Per gli endpoint regionali, assicurati che il modello primario e il modello piccolo/veloce siano supportati nella tua regione selezionata
- Considera di passare a
CLOUD_ML_REGION=globalper una migliore disponibilità