Requisitos previos
Antes de configurar Claude Code con Vertex AI, asegúrate de tener:- Una cuenta de Google Cloud Platform (GCP) con facturación habilitada
- Un proyecto de GCP con la API de Vertex AI habilitada
- Acceso a los modelos Claude deseados (por ejemplo, Claude Sonnet 4.5)
- Google Cloud SDK (
gcloud) instalado y configurado - Cuota asignada en la región de GCP deseada
Configuración de región
Claude Code se puede usar tanto con puntos finales globales como regionales de Vertex AI.Vertex AI puede no admitir los modelos predeterminados de Claude Code en todas las regiones. Es posible que debas cambiar a una región o modelo compatible.
Vertex AI puede no admitir los modelos predeterminados de Claude Code en puntos finales globales. Es posible que debas cambiar a un punto final regional o a un modelo compatible.
Configuración
1. Habilitar la API de Vertex AI
Habilita la API de Vertex AI en tu proyecto de GCP:2. Solicitar acceso al modelo
Solicita acceso a los modelos Claude en Vertex AI:- Navega al Vertex AI Model Garden
- Busca modelos “Claude”
- Solicita acceso a los modelos Claude deseados (por ejemplo, Claude Sonnet 4.5)
- Espera la aprobación (puede tomar 24-48 horas)
3. Configurar credenciales de GCP
Claude Code utiliza la autenticación estándar de Google Cloud. Para más información, consulta la documentación de autenticación de Google Cloud.Al autenticarse, Claude Code utilizará automáticamente el ID de proyecto de la variable de entorno
ANTHROPIC_VERTEX_PROJECT_ID. Para anular esto, establece una de estas variables de entorno: GCLOUD_PROJECT, GOOGLE_CLOUD_PROJECT, o GOOGLE_APPLICATION_CREDENTIALS.4. Configurar Claude Code
Establece las siguientes variables de entorno:El almacenamiento en caché de indicaciones se admite automáticamente cuando especificas la bandera efímera
cache_control. Para deshabilitarlo, establece DISABLE_PROMPT_CACHING=1. Para límites de velocidad elevados, contacta con el soporte de Google Cloud.Al usar Vertex AI, los comandos
/login y /logout están deshabilitados ya que la autenticación se maneja a través de credenciales de Google Cloud.5. Configuración del modelo
Claude Code utiliza estos modelos predeterminados para Vertex AI:| Tipo de modelo | Valor predeterminado |
|---|---|
| Modelo principal | claude-sonnet-4-5@20250929 |
| Modelo pequeño/rápido | claude-haiku-4-5@20251001 |
Para usuarios de Vertex AI, Claude Code no se actualizará automáticamente de Haiku 3.5 a Haiku 4.5. Para cambiar manualmente a un modelo Haiku más nuevo, establece la variable de entorno
ANTHROPIC_DEFAULT_HAIKU_MODEL al nombre completo del modelo (por ejemplo, claude-haiku-4-5@20251001).Configuración de IAM
Asigna los permisos de IAM requeridos: El rolroles/aiplatform.user incluye los permisos requeridos:
aiplatform.endpoints.predict- Requerido para la invocación de modelos y conteo de tokens
Recomendamos crear un proyecto de GCP dedicado para Claude Code para simplificar el seguimiento de costos y el control de acceso.
Ventana de contexto de 1M de tokens
Claude Sonnet 4 y Sonnet 4.5 admiten la ventana de contexto de 1M de tokens en Vertex AI.La ventana de contexto de 1M de tokens está actualmente en beta. Para usar la ventana de contexto extendida, incluye el encabezado beta
context-1m-2025-08-07 en tus solicitudes de Vertex AI.Solución de problemas
Si encuentras problemas de cuota:- Verifica las cuotas actuales o solicita un aumento de cuota a través de Cloud Console
- Confirma que el modelo está habilitado en Model Garden
- Verifica que tengas acceso a la región especificada
- Si usas
CLOUD_ML_REGION=global, verifica que tus modelos admitan puntos finales globales en Model Garden bajo “Características compatibles”. Para modelos que no admiten puntos finales globales, ya sea:- Especifica un modelo compatible a través de
ANTHROPIC_MODELoANTHROPIC_SMALL_FAST_MODEL, o - Establece un punto final regional usando variables de entorno
VERTEX_REGION_<MODEL_NAME>
- Especifica un modelo compatible a través de
- Para puntos finales regionales, asegúrate de que el modelo principal y el modelo pequeño/rápido sean compatibles en tu región seleccionada
- Considera cambiar a
CLOUD_ML_REGION=globalpara mejor disponibilidad