Pular para o conteúdo principal
Gateways LLM fornecem uma camada proxy centralizada entre Claude Code e provedores de modelos, frequentemente fornecendo:
  • Autenticação centralizada - Ponto único para gerenciamento de chaves de API
  • Rastreamento de uso - Monitore o uso em equipes e projetos
  • Controles de custo - Implemente orçamentos e limites de taxa
  • Registro de auditoria - Rastreie todas as interações de modelo para conformidade
  • Roteamento de modelo - Alterne entre provedores sem alterações de código

Requisitos do gateway

Para que um gateway LLM funcione com Claude Code, ele deve atender aos seguintes requisitos: Formato de API O gateway deve expor aos clientes pelo menos um dos seguintes formatos de API:
  1. Anthropic Messages: /v1/messages, /v1/messages/count_tokens
    • Deve encaminhar cabeçalhos de solicitação: anthropic-beta, anthropic-version
  2. Bedrock InvokeModel: /invoke, /invoke-with-response-stream
    • Deve preservar campos do corpo da solicitação: anthropic_beta, anthropic_version
  3. Vertex rawPredict: :rawPredict, :streamRawPredict, /count-tokens:rawPredict
    • Deve encaminhar cabeçalhos de solicitação: anthropic-beta, anthropic-version
A falha ao encaminhar cabeçalhos ou preservar campos do corpo pode resultar em funcionalidade reduzida ou incapacidade de usar recursos do Claude Code.
Claude Code determina quais recursos ativar com base no formato da API. Ao usar o formato Anthropic Messages com Bedrock ou Vertex, você pode precisar definir a variável de ambiente CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1.

Configuração

Seleção de modelo

Por padrão, Claude Code usará nomes de modelo padrão para o formato de API selecionado. Se você configurou nomes de modelo personalizados em seu gateway, use as variáveis de ambiente documentadas em Configuração de modelo para corresponder aos seus nomes personalizados.

Configuração do LiteLLM

As versões PyPI do LiteLLM 1.82.7 e 1.82.8 foram comprometidas com malware que rouba credenciais. Não instale essas versões. Se você já as instalou:
  • Remova o pacote
  • Rotacione todas as credenciais nos sistemas afetados
  • Siga as etapas de remediação em BerriAI/litellm#24518
LiteLLM é um serviço proxy de terceiros. Anthropic não endossa, mantém ou audita a segurança ou funcionalidade do LiteLLM. Este guia é fornecido para fins informativos e pode ficar desatualizado. Use por sua conta e risco.

Pré-requisitos

  • Claude Code atualizado para a versão mais recente
  • LiteLLM Proxy Server implantado e acessível
  • Acesso aos modelos Claude através do seu provedor escolhido

Configuração básica do LiteLLM

Configure Claude Code:

Métodos de autenticação

Chave de API estática
Método mais simples usando uma chave de API fixa:
# Defina no ambiente
export ANTHROPIC_AUTH_TOKEN=sk-litellm-static-key

# Ou nas configurações do Claude Code
{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "sk-litellm-static-key"
  }
}
Este valor será enviado como o cabeçalho Authorization.
Chave de API dinâmica com auxiliar
Para chaves rotativas ou autenticação por usuário:
  1. Crie um script auxiliar de chave de API:
#!/bin/bash
# ~/bin/get-litellm-key.sh

# Exemplo: Buscar chave do cofre
vault kv get -field=api_key secret/litellm/claude-code

# Exemplo: Gerar token JWT
jwt encode \
  --secret="${JWT_SECRET}" \
  --exp="+1h" \
  '{"user":"'${USER}'","team":"engineering"}'
  1. Configure as configurações do Claude Code para usar o auxiliar:
{
  "apiKeyHelper": "~/bin/get-litellm-key.sh"
}
  1. Defina o intervalo de atualização de token:
# Atualizar a cada hora (3600000 ms)
export CLAUDE_CODE_API_KEY_HELPER_TTL_MS=3600000
Este valor será enviado como cabeçalhos Authorization e X-Api-Key. O apiKeyHelper tem precedência menor que ANTHROPIC_AUTH_TOKEN ou ANTHROPIC_API_KEY.

Endpoint unificado (recomendado)

Usando o endpoint de formato Anthropic do LiteLLM:
export ANTHROPIC_BASE_URL=https://litellm-server:4000
Benefícios do endpoint unificado sobre endpoints pass-through:
  • Balanceamento de carga
  • Fallbacks
  • Suporte consistente para rastreamento de custo e rastreamento de usuário final

Endpoints pass-through específicos do provedor (alternativa)

Claude API através do LiteLLM
Usando endpoint pass-through:
export ANTHROPIC_BASE_URL=https://litellm-server:4000/anthropic
Amazon Bedrock através do LiteLLM
Usando endpoint pass-through:
export ANTHROPIC_BEDROCK_BASE_URL=https://litellm-server:4000/bedrock
export CLAUDE_CODE_SKIP_BEDROCK_AUTH=1
export CLAUDE_CODE_USE_BEDROCK=1
Google Vertex AI através do LiteLLM
Usando endpoint pass-through:
export ANTHROPIC_VERTEX_BASE_URL=https://litellm-server:4000/vertex_ai/v1
export ANTHROPIC_VERTEX_PROJECT_ID=your-gcp-project-id
export CLAUDE_CODE_SKIP_VERTEX_AUTH=1
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=us-east5
Para informações mais detalhadas, consulte a documentação do LiteLLM.

Recursos adicionais