Documentation Index
Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
Requisitos previos
Antes de configurar Claude Code con Vertex AI, asegúrese de tener:- Una cuenta de Google Cloud Platform (GCP) con facturación habilitada
- Un proyecto de GCP con la API de Vertex AI habilitada
- Acceso a los modelos Claude deseados (por ejemplo, Claude Sonnet 4.6)
- Google Cloud SDK (
gcloud) instalado y configurado - Cuota asignada en la región de GCP deseada
Iniciar sesión con Vertex AI
Si tiene credenciales de Google Cloud y desea comenzar a usar Claude Code a través de Vertex AI, el asistente de inicio de sesión lo guía a través del proceso. Completa los requisitos previos del lado de GCP una vez por proyecto; el asistente maneja el lado de Claude Code.El asistente de configuración de Vertex AI requiere Claude Code v2.1.98 o posterior. Ejecute
claude --version para verificar.Habilitar modelos Claude en su proyecto de GCP
Habilite la API de Vertex AI para su proyecto, luego solicite acceso a los modelos Claude que desee en el Vertex AI Model Garden. Consulte Configuración de IAM para los permisos que su cuenta necesita.
Inicie Claude Code y elija Vertex AI
Ejecute
claude. En el mensaje de inicio de sesión, seleccione 3rd-party platform, luego Google Vertex AI.Siga los mensajes del asistente
Elija cómo se autentica en Google Cloud: Credenciales predeterminadas de aplicación de
gcloud, un archivo de clave de cuenta de servicio, o credenciales ya en su entorno. El asistente detecta su proyecto y región, verifica qué modelos Claude puede invocar su proyecto, y le permite fijarlos. Guarda el resultado en el bloque env de su archivo de configuración de usuario, por lo que no necesita exportar variables de entorno usted mismo./setup-vertex en cualquier momento para reabrirlo el asistente y cambiar sus credenciales, proyecto, región o fijaciones de modelo.
Configuración de región
Claude Code admite puntos finales de Vertex AI globales, multirregión y regionales. EstablezcaCLOUD_ML_REGION en global, una ubicación multirregión como eu o us, o una región específica como us-east5. Claude Code selecciona el nombre de host correcto de Vertex AI para cada formulario, incluidos los hosts aiplatform.eu.rep.googleapis.com y aiplatform.us.rep.googleapis.com para ubicaciones multirregión.
Vertex AI puede no admitir los modelos predeterminados de Claude Code en todos los tipos de puntos finales. La disponibilidad del modelo varía según regiones específicas, ubicaciones multirregión y puntos finales globales. Es posible que deba cambiar a una ubicación compatible o especificar un modelo compatible.
Configurar manualmente
Para configurar Vertex AI a través de variables de entorno en lugar del asistente, por ejemplo en CI o una implementación empresarial con script, siga los pasos a continuación.1. Habilitar la API de Vertex AI
Habilite la API de Vertex AI en su proyecto de GCP:2. Solicitar acceso al modelo
Solicite acceso a los modelos Claude en Vertex AI:- Navegue al Vertex AI Model Garden
- Busque modelos “Claude”
- Solicite acceso a los modelos Claude deseados (por ejemplo, Claude Sonnet 4.6)
- Espere la aprobación (puede tomar 24-48 horas)
3. Configurar credenciales de GCP
Claude Code utiliza la autenticación estándar de Google Cloud. Para obtener más información, consulte la documentación de autenticación de Google Cloud. Claude Code v2.1.121 o posterior admite Federación de identidad de carga de trabajo basada en certificados X.509 a través de la misma cadena de credenciales de aplicación predeterminada. EstablezcaGOOGLE_APPLICATION_CREDENTIALS en la ruta de su archivo de configuración de credenciales.
Claude Code utiliza
ANTHROPIC_VERTEX_PROJECT_ID como el ID de proyecto para solicitudes de Vertex AI. Las variables de entorno GCLOUD_PROJECT y GOOGLE_CLOUD_PROJECT y el archivo de credenciales referenciado por GOOGLE_APPLICATION_CREDENTIALS tienen prioridad sobre él. Si ninguno de estos está establecido, el ID de proyecto se resuelve desde su configuración de gcloud o la cuenta de servicio adjunta.Configuración avanzada de credenciales
Claude Code admite la actualización automática de credenciales para GCP a través de la configuracióngcpAuthRefresh. Cuando Claude Code detecta que sus credenciales de GCP han expirado o no se pueden cargar, ejecuta el comando configurado para obtener nuevas credenciales antes de reintentar la solicitud.
gcpAuthRefresh en la configuración del proyecto como .claude/settings.json, el comando se ejecuta solo después de que acepte el mensaje de confianza del espacio de trabajo.
4. Configurar Claude Code
Establezca las siguientes variables de entorno:VERTEX_REGION_CLAUDE_* correspondiente. Consulte la referencia de variables de entorno para obtener la lista completa. Verifique Vertex Model Garden para determinar qué modelos admiten puntos finales globales frente a solo regionales.
Prompt caching se habilita automáticamente. Para deshabilitarlo, establezca DISABLE_PROMPT_CACHING=1. Para solicitar un TTL de caché de 1 hora en lugar del predeterminado de 5 minutos, establezca ENABLE_PROMPT_CACHING_1H=1; las escrituras de caché con un TTL de 1 hora se facturan a una tarifa más alta. Para límites de velocidad elevados, póngase en contacto con el soporte de Google Cloud. Al usar Vertex AI, los comandos /login y /logout están deshabilitados ya que la autenticación se maneja a través de credenciales de Google Cloud.
Claude Code deshabilita MCP tool search de forma predeterminada en Vertex AI, por lo que las definiciones de herramientas MCP se cargan por adelantado. Vertex AI admite búsqueda de herramientas para Claude Sonnet 4.5 y posterior y Claude Opus 4.5 y posterior. Establezca ENABLE_TOOL_SEARCH=true para habilitarlo en esos modelos. Los modelos anteriores en Vertex AI no aceptan el encabezado beta requerido, y las solicitudes fallan si habilita la búsqueda de herramientas con ellos.
5. Fijar versiones de modelo
Establezca estas variables de entorno en ID de modelo específicos de Vertex AI. SinANTHROPIC_DEFAULT_OPUS_MODEL, el alias opus en Vertex se resuelve a Opus 4.6. Establézcalo en el ID de Opus 4.7 para usar el modelo más reciente:
| Tipo de modelo | Valor predeterminado |
|---|---|
| Modelo principal | claude-sonnet-4-5@20250929 |
| Modelo pequeño/rápido | Igual que el modelo principal |
ANTHROPIC_DEFAULT_HAIKU_MODEL en un ID de modelo que esté disponible en su proyecto.
Para personalizar aún más los modelos:
Verificaciones de modelo al inicio
Cuando Claude Code se inicia con Vertex AI configurado, verifica que los modelos que pretende usar sean accesibles en su proyecto. Esta verificación requiere Claude Code v2.1.98 o posterior. Si ha fijado una versión de modelo que es más antigua que el valor predeterminado actual de Claude Code, y su proyecto puede invocar la versión más reciente, Claude Code le solicita que actualice la fijación. Aceptar escribe el nuevo ID de modelo en su archivo de configuración de usuario y reinicia Claude Code. Rechazar se recuerda hasta el próximo cambio de versión predeterminada. Si no ha fijado un modelo y el valor predeterminado actual no está disponible en su proyecto, Claude Code retrocede a la versión anterior para la sesión actual y muestra un aviso. El retroceso no se persiste. Habilite el modelo más reciente en Model Garden o fije una versión para hacer la opción permanente.Configuración de IAM
Asigne los permisos de IAM requeridos: El rolroles/aiplatform.user incluye los permisos requeridos:
aiplatform.endpoints.predict- Requerido para la invocación de modelo y conteo de tokens
Cree un proyecto de GCP dedicado para Claude Code para simplificar el seguimiento de costos y el control de acceso.
Ventana de contexto de 1M de tokens
Claude Opus 4.7, Opus 4.6 y Sonnet 4.6 admiten la ventana de contexto de 1M de tokens en Vertex AI. Claude Code habilita automáticamente la ventana de contexto extendida cuando selecciona una variante de modelo de 1M. El asistente de configuración ofrece una opción de contexto de 1M cuando fija modelos. Para habilitarlo para un modelo fijado manualmente en su lugar, agregue[1m] al ID del modelo. Consulte Fijar modelos para implementaciones de terceros para obtener detalles.
Solución de problemas
Si encuentra errores “No se pudieron cargar las credenciales predeterminadas”:- Ejecute
gcloud auth application-default loginpara configurar las credenciales predeterminadas de la aplicación - Establezca
GOOGLE_APPLICATION_CREDENTIALSen una ruta de archivo de clave de cuenta de servicio - Consulte Configurar credenciales de GCP para todas las opciones
- Verifique las cuotas actuales o solicite un aumento de cuota a través de Cloud Console
- Confirme que el modelo está habilitado en Model Garden
- Verifique que el modelo esté disponible en la ubicación que especificó. Algunos modelos se ofrecen solo en ubicaciones
globalo multirregión comoeuyus, no en regiones específicas - Si utiliza
CLOUD_ML_REGION=global, verifique que sus modelos admitan puntos finales globales en Model Garden en “Características compatibles”. Para modelos que no admiten puntos finales globales, ya sea:- Especifique un modelo compatible a través de
ANTHROPIC_MODELoANTHROPIC_DEFAULT_HAIKU_MODEL, o - Establezca una región o ubicación multirregión usando variables de entorno
VERTEX_REGION_<MODEL_NAME>
- Especifique un modelo compatible a través de
- Para puntos finales regionales, asegúrese de que el modelo principal y el modelo pequeño/rápido sean compatibles en su región seleccionada
- Considere cambiar a
CLOUD_ML_REGION=globalpara una mejor disponibilidad