Gateways LLM fornecem uma camada proxy centralizada entre Claude Code e provedores de modelos, frequentemente fornecendo:Documentation Index
Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
- Autenticação centralizada - Ponto único para gerenciamento de chaves de API
- Rastreamento de uso - Monitore o uso em equipes e projetos
- Controles de custo - Implemente orçamentos e limites de taxa
- Registro de auditoria - Rastreie todas as interações de modelo para conformidade
- Roteamento de modelo - Alterne entre provedores sem alterações de código
Requisitos do gateway
Para que um gateway LLM funcione com Claude Code, ele deve atender aos seguintes requisitos: Formato de API O gateway deve expor aos clientes pelo menos um dos seguintes formatos de API:-
Anthropic Messages:
/v1/messages,/v1/messages/count_tokens- Deve encaminhar cabeçalhos de solicitação:
anthropic-beta,anthropic-version
- Deve encaminhar cabeçalhos de solicitação:
-
Bedrock InvokeModel:
/invoke,/invoke-with-response-stream- Deve preservar campos do corpo da solicitação:
anthropic_beta,anthropic_version
- Deve preservar campos do corpo da solicitação:
-
Vertex rawPredict:
:rawPredict,:streamRawPredict,/count-tokens:rawPredict- Deve encaminhar cabeçalhos de solicitação:
anthropic-beta,anthropic-version
- Deve encaminhar cabeçalhos de solicitação:
Claude Code determina quais recursos ativar com base no formato da API. Ao usar o formato Anthropic Messages com Bedrock ou Vertex, você pode precisar definir a variável de ambiente
CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1.| Cabeçalho | Descrição |
|---|---|
X-Claude-Code-Session-Id | Um identificador único para a sessão atual do Claude Code. Proxies podem usar isso para agregar todas as solicitações de API de uma única sessão sem analisar o corpo da solicitação. |
X-Claude-Code-Agent-Id | Identificador do subagente ou colega de trabalho que emitiu a solicitação. Seu proxy pode usar isso para atribuir o custo da API a subagentes paralelos individuais dentro de uma sessão, sem analisar o corpo da solicitação. Presente apenas para solicitações feitas por um subagente ou colega de trabalho em processo. |
X-Claude-Code-Parent-Agent-Id | Identificador do agente que gerou o agente que faz a solicitação. Use isso com X-Claude-Code-Agent-Id para atribuir custos de API entre agentes aninhados em seu proxy. Presente apenas quando o agente solicitante foi ele próprio gerado por outro agente. |
CLAUDE_CODE_ATTRIBUTION_HEADER=0 para omiti-lo.
Configuração
Seleção de modelo
Por padrão, Claude Code usa nomes de modelo padrão para o formato de API selecionado. QuandoANTHROPIC_BASE_URL aponta para um gateway que expõe o formato Anthropic Messages, Claude Code consulta o endpoint /v1/models do gateway na inicialização e adiciona os modelos retornados ao seletor /model. Defina CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 para ativar isso. A descoberta está desativada por padrão para que gateways apoiados por uma chave de API compartilhada não exponham todos os modelos que a chave pode acessar para cada usuário. Cada entrada descoberta é rotulada como “From gateway” e usa o campo display_name da resposta quando um é fornecido. Isso requer Claude Code v2.1.129 ou posterior.
A descoberta se aplica apenas ao formato Anthropic Messages. Ela não é executada para endpoints de passagem Bedrock ou Vertex, e não é executada quando ANTHROPIC_BASE_URL não está definido ou aponta para api.anthropic.com.
A solicitação de descoberta autentica da mesma forma que as solicitações de inferência: ela envia ANTHROPIC_AUTH_TOKEN como um token de portador, ou ANTHROPIC_API_KEY como o cabeçalho x-api-key quando nenhum token de autenticação está definido, junto com quaisquer cabeçalhos de ANTHROPIC_CUSTOM_HEADERS. Apenas modelos cujo ID começa com claude ou anthropic são adicionados ao seletor. Os resultados são armazenados em cache em ~/.claude/cache/gateway-models.json e atualizados a cada inicialização. Se a solicitação falhar ou o gateway não implementar /v1/models, o seletor volta para a lista em cache da inicialização anterior ou para a lista de modelos integrada.
Se seu gateway usa nomes de modelo que não correspondem ao filtro de descoberta, use as variáveis de ambiente documentadas em Configuração de modelo para adicioná-los manualmente.
Configuração do LiteLLM
Pré-requisitos
- Claude Code atualizado para a versão mais recente
- LiteLLM Proxy Server implantado e acessível
- Acesso aos modelos Claude através do seu provedor escolhido
Configuração básica do LiteLLM
Configure Claude Code:Métodos de autenticação
Chave de API estática
Método mais simples usando uma chave de API fixa:Authorization.
Chave de API dinâmica com auxiliar
Para chaves rotativas ou autenticação por usuário:- Crie um script auxiliar de chave de API:
- Configure as configurações do Claude Code para usar o auxiliar:
- Defina o intervalo de atualização de token:
Authorization e X-Api-Key. O apiKeyHelper tem precedência menor que ANTHROPIC_AUTH_TOKEN ou ANTHROPIC_API_KEY.
Endpoint unificado (recomendado)
Usando o endpoint de formato Anthropic do LiteLLM:- Balanceamento de carga
- Fallbacks
- Suporte consistente para rastreamento de custo e rastreamento de usuário final