- Autenticação centralizada - Ponto único para gerenciamento de chaves de API
- Rastreamento de uso - Monitore o uso em equipes e projetos
- Controles de custo - Implemente orçamentos e limites de taxa
- Registro de auditoria - Rastreie todas as interações de modelo para conformidade
- Roteamento de modelo - Alterne entre provedores sem alterações de código
Requisitos do gateway
Para que um gateway LLM funcione com Claude Code, ele deve atender aos seguintes requisitos: Formato de API O gateway deve expor aos clientes pelo menos um dos seguintes formatos de API:-
Anthropic Messages:
/v1/messages,/v1/messages/count_tokens- Deve encaminhar cabeçalhos de solicitação:
anthropic-beta,anthropic-version
- Deve encaminhar cabeçalhos de solicitação:
-
Bedrock InvokeModel:
/invoke,/invoke-with-response-stream- Deve preservar campos do corpo da solicitação:
anthropic_beta,anthropic_version
- Deve preservar campos do corpo da solicitação:
-
Vertex rawPredict:
:rawPredict,:streamRawPredict,/count-tokens:rawPredict- Deve encaminhar cabeçalhos de solicitação:
anthropic-beta,anthropic-version
- Deve encaminhar cabeçalhos de solicitação:
Claude Code determina quais recursos ativar com base no formato da API. Ao usar o formato Anthropic Messages com Bedrock ou Vertex, você pode precisar definir a variável de ambiente
CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1.Configuração
Seleção de modelo
Por padrão, Claude Code usará nomes de modelo padrão para o formato de API selecionado. Se você configurou nomes de modelo personalizados em seu gateway, use as variáveis de ambiente documentadas em Configuração de modelo para corresponder aos seus nomes personalizados.Configuração do LiteLLM
Pré-requisitos
- Claude Code atualizado para a versão mais recente
- LiteLLM Proxy Server implantado e acessível
- Acesso aos modelos Claude através do seu provedor escolhido
Configuração básica do LiteLLM
Configure Claude Code:Métodos de autenticação
Chave de API estática
Método mais simples usando uma chave de API fixa:Authorization.
Chave de API dinâmica com auxiliar
Para chaves rotativas ou autenticação por usuário:- Crie um script auxiliar de chave de API:
- Configure as configurações do Claude Code para usar o auxiliar:
- Defina o intervalo de atualização de token:
Authorization e X-Api-Key. O apiKeyHelper tem precedência menor que ANTHROPIC_AUTH_TOKEN ou ANTHROPIC_API_KEY.
Endpoint unificado (recomendado)
Usando o endpoint de formato Anthropic do LiteLLM:- Balanceamento de carga
- Fallbacks
- Suporte consistente para rastreamento de custo e rastreamento de usuário final