Requisitos previos
Antes de configurar Claude Code con Vertex AI, asegúrese de tener:- Una cuenta de Google Cloud Platform (GCP) con facturación habilitada
- Un proyecto de GCP con la API de Vertex AI habilitada
- Acceso a los modelos Claude deseados (por ejemplo, Claude Sonnet 4.6)
- Google Cloud SDK (
gcloud) instalado y configurado - Cuota asignada en la región de GCP deseada
Si está implementando Claude Code para varios usuarios, fije las versiones de su modelo para evitar problemas cuando Anthropic lance nuevos modelos.
Configuración de región
Claude Code se puede usar con puntos finales de Vertex AI globales y regionales.Vertex AI puede no admitir los modelos predeterminados de Claude Code en todas las regiones o en puntos finales globales. Es posible que deba cambiar a una región compatible, usar un punto final regional o especificar un modelo compatible.
Configuración
1. Habilitar la API de Vertex AI
Habilite la API de Vertex AI en su proyecto de GCP:2. Solicitar acceso al modelo
Solicite acceso a los modelos Claude en Vertex AI:- Navegue al Vertex AI Model Garden
- Busque modelos “Claude”
- Solicite acceso a los modelos Claude deseados (por ejemplo, Claude Sonnet 4.6)
- Espere la aprobación (puede tomar 24-48 horas)
3. Configurar credenciales de GCP
Claude Code utiliza la autenticación estándar de Google Cloud. Para obtener más información, consulte la documentación de autenticación de Google Cloud.Al autenticarse, Claude Code utilizará automáticamente el ID de proyecto de la variable de entorno
ANTHROPIC_VERTEX_PROJECT_ID. Para anular esto, establezca una de estas variables de entorno: GCLOUD_PROJECT, GOOGLE_CLOUD_PROJECT o GOOGLE_APPLICATION_CREDENTIALS.4. Configurar Claude Code
Establezca las siguientes variables de entorno:VERTEX_REGION_CLAUDE_*. Consulte la referencia de variables de entorno para obtener la lista completa. Verifique Vertex Model Garden para determinar qué modelos admiten puntos finales globales frente a solo regionales.
Prompt caching se admite automáticamente cuando especifica la bandera efímera cache_control. Para deshabilitarlo, establezca DISABLE_PROMPT_CACHING=1. Para límites de velocidad elevados, póngase en contacto con el soporte de Google Cloud. Al usar Vertex AI, los comandos /login y /logout están deshabilitados ya que la autenticación se maneja a través de credenciales de Google Cloud.
5. Fijar versiones de modelo
Establezca estas variables de entorno en ID de modelo específicos de Vertex AI:| Tipo de modelo | Valor predeterminado |
|---|---|
| Modelo principal | claude-sonnet-4-6 |
| Modelo pequeño/rápido | claude-haiku-4-5@20251001 |
Configuración de IAM
Asigne los permisos de IAM requeridos: El rolroles/aiplatform.user incluye los permisos requeridos:
aiplatform.endpoints.predict- Requerido para la invocación de modelo y conteo de tokens
Cree un proyecto de GCP dedicado para Claude Code para simplificar el seguimiento de costos y el control de acceso.
Ventana de contexto de 1M de tokens
Claude Opus 4.6, Sonnet 4.6, Sonnet 4.5 y Sonnet 4 admiten la ventana de contexto de 1M de tokens en Vertex AI. Claude Code habilita automáticamente la ventana de contexto extendida cuando selecciona una variante de modelo de 1M. Para habilitar la ventana de contexto de 1M para su modelo fijado, agregue[1m] al ID del modelo. Consulte Fijar modelos para implementaciones de terceros para obtener más detalles.
Solución de problemas
Si encuentra problemas de cuota:- Verifique las cuotas actuales o solicite un aumento de cuota a través de Cloud Console
- Confirme que el modelo está habilitado en Model Garden
- Verifique que tenga acceso a la región especificada
- Si utiliza
CLOUD_ML_REGION=global, verifique que sus modelos admitan puntos finales globales en Model Garden en “Características compatibles”. Para modelos que no admiten puntos finales globales, ya sea:- Especifique un modelo compatible a través de
ANTHROPIC_MODELoANTHROPIC_DEFAULT_HAIKU_MODEL, o - Establezca un punto final regional usando variables de entorno
VERTEX_REGION_<MODEL_NAME>
- Especifique un modelo compatible a través de
- Para puntos finales regionales, asegúrese de que el modelo principal y el modelo pequeño/rápido sean compatibles en su región seleccionada
- Considere cambiar a
CLOUD_ML_REGION=globalpara una mejor disponibilidad