Pré-requisitos
Antes de configurar Claude Code com Vertex AI, certifique-se de que você tem:- Uma conta do Google Cloud Platform (GCP) com faturamento ativado
- Um projeto GCP com a API Vertex AI ativada
- Acesso aos modelos Claude desejados (por exemplo, Claude Sonnet 4.6)
- Google Cloud SDK (
gcloud) instalado e configurado - Cota alocada na região GCP desejada
Se você está implantando Claude Code para vários usuários, fixe suas versões de modelo para evitar problemas quando Anthropic lançar novos modelos.
Configuração de Região
Claude Code pode ser usado com endpoints globais e regionais do Vertex AI.Vertex AI pode não suportar os modelos padrão do Claude Code em todas as regiões ou em endpoints globais. Você pode precisar mudar para uma região suportada, usar um endpoint regional ou especificar um modelo suportado.
Configuração
1. Ativar a API Vertex AI
Ative a API Vertex AI no seu projeto GCP:2. Solicitar acesso ao modelo
Solicite acesso aos modelos Claude no Vertex AI:- Navegue até o Vertex AI Model Garden
- Procure por modelos “Claude”
- Solicite acesso aos modelos Claude desejados (por exemplo, Claude Sonnet 4.6)
- Aguarde a aprovação (pode levar 24-48 horas)
3. Configurar credenciais GCP
Claude Code usa autenticação padrão do Google Cloud. Para mais informações, consulte a documentação de autenticação do Google Cloud.Ao autenticar, Claude Code usará automaticamente o ID do projeto da variável de ambiente
ANTHROPIC_VERTEX_PROJECT_ID. Para substituir isso, defina uma destas variáveis de ambiente: GCLOUD_PROJECT, GOOGLE_CLOUD_PROJECT ou GOOGLE_APPLICATION_CREDENTIALS.4. Configurar Claude Code
Defina as seguintes variáveis de ambiente:cache_control. Para desativá-lo, defina DISABLE_PROMPT_CACHING=1. Para limites de taxa aumentados, entre em contato com o suporte do Google Cloud. Ao usar Vertex AI, os comandos /login e /logout são desativados, pois a autenticação é tratada através das credenciais do Google Cloud.
5. Fixar versões de modelo
Defina estas variáveis de ambiente para IDs de modelo Vertex AI específicos:| Tipo de modelo | Valor padrão |
|---|---|
| Modelo primário | claude-sonnet-4-6 |
| Modelo pequeno/rápido | claude-haiku-4-5@20251001 |
Configuração de IAM
Atribua as permissões de IAM necessárias: A funçãoroles/aiplatform.user inclui as permissões necessárias:
aiplatform.endpoints.predict- Necessário para invocação de modelo e contagem de tokens
Crie um projeto GCP dedicado para Claude Code para simplificar o rastreamento de custos e controle de acesso.
Janela de contexto de 1M de tokens
Claude Opus 4.6, Sonnet 4.6, Sonnet 4.5 e Sonnet 4 suportam a janela de contexto de 1M de tokens no Vertex AI. Claude Code ativa automaticamente a janela de contexto estendida quando você seleciona uma variante de modelo 1M. Para ativar a janela de contexto de 1M para seu modelo fixado, acrescente[1m] ao ID do modelo. Consulte Fixar modelos para implantações de terceiros para detalhes.
Resolução de problemas
Se você encontrar problemas de cota:- Verifique cotas atuais ou solicite aumento de cota através do Cloud Console
- Confirme que o modelo está Ativado no Model Garden
- Verifique se você tem acesso à região especificada
- Se estiver usando
CLOUD_ML_REGION=global, verifique se seus modelos suportam endpoints globais no Model Garden em “Recursos suportados”. Para modelos que não suportam endpoints globais, faça um dos seguintes:- Especifique um modelo suportado via
ANTHROPIC_MODELouANTHROPIC_SMALL_FAST_MODEL, ou - Defina um endpoint regional usando variáveis de ambiente
VERTEX_REGION_<MODEL_NAME>
- Especifique um modelo suportado via
- Para endpoints regionais, certifique-se de que o modelo primário e o modelo pequeno/rápido são suportados em sua região selecionada
- Considere mudar para
CLOUD_ML_REGION=globalpara melhor disponibilidade