Las puertas de enlace LLM proporcionan una capa proxy centralizada entre Claude Code y proveedores de modelos, ofreciendo:
- Autenticación centralizada - Punto único para la gestión de claves API
- Seguimiento de uso - Monitorea el uso en equipos y proyectos
- Controles de costos - Implementa presupuestos y límites de velocidad
- Registro de auditoría - Rastrea todas las interacciones del modelo para cumplimiento normativo
- Enrutamiento de modelos - Cambia entre proveedores sin cambios de código
Configuración de LiteLLM
LiteLLM es un servicio proxy de terceros. Anthropic no respalda, mantiene ni audita la seguridad o funcionalidad de LiteLLM. Esta guía se proporciona con fines informativos y puede quedar obsoleta. Úsala bajo tu propio criterio.
Requisitos previos
- Claude Code actualizado a la última versión
- Servidor proxy de LiteLLM implementado y accesible
- Acceso a modelos de Claude a través de tu proveedor elegido
Configuración básica de LiteLLM
Configura Claude Code:
Métodos de autenticación
Clave API estática
Método más simple usando una clave API fija:
# Establecer en el entorno
export ANTHROPIC_AUTH_TOKEN=sk-litellm-static-key
# O en la configuración de Claude Code
{
"env": {
"ANTHROPIC_AUTH_TOKEN": "sk-litellm-static-key"
}
}
Este valor se enviará como encabezado Authorization.
Clave API dinámica con ayudante
Para claves rotativas o autenticación por usuario:
- Crea un script ayudante de clave API:
#!/bin/bash
# ~/bin/get-litellm-key.sh
# Ejemplo: Obtener clave del almacén
vault kv get -field=api_key secret/litellm/claude-code
# Ejemplo: Generar token JWT
jwt encode \
--secret="${JWT_SECRET}" \
--exp="+1h" \
'{"user":"'${USER}'","team":"engineering"}'
- Configura la configuración de Claude Code para usar el ayudante:
{
"apiKeyHelper": "~/bin/get-litellm-key.sh"
}
- Establece el intervalo de actualización de token:
# Actualizar cada hora (3600000 ms)
export CLAUDE_CODE_API_KEY_HELPER_TTL_MS=3600000
Este valor se enviará como encabezados Authorization y X-Api-Key. El apiKeyHelper tiene menor precedencia que ANTHROPIC_AUTH_TOKEN o ANTHROPIC_API_KEY.
Punto de conexión unificado (recomendado)
Usando el punto de conexión en formato Anthropic de LiteLLM:
export ANTHROPIC_BASE_URL=https://litellm-server:4000
Beneficios del punto de conexión unificado sobre puntos de conexión de paso directo:
- Equilibrio de carga
- Conmutaciones por error
- Soporte consistente para seguimiento de costos y seguimiento de usuario final
Puntos de conexión de paso directo específicos del proveedor (alternativa)
API de Claude a través de LiteLLM
Usando punto de conexión de paso directo:
export ANTHROPIC_BASE_URL=https://litellm-server:4000/anthropic
Amazon Bedrock a través de LiteLLM
Usando punto de conexión de paso directo:
export ANTHROPIC_BEDROCK_BASE_URL=https://litellm-server:4000/bedrock
export CLAUDE_CODE_SKIP_BEDROCK_AUTH=1
export CLAUDE_CODE_USE_BEDROCK=1
Google Vertex AI a través de LiteLLM
Usando punto de conexión de paso directo:
export ANTHROPIC_VERTEX_BASE_URL=https://litellm-server:4000/vertex_ai/v1
export ANTHROPIC_VERTEX_PROJECT_ID=your-gcp-project-id
export CLAUDE_CODE_SKIP_VERTEX_AUTH=1
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=us-east5
Selección de modelo
Por defecto, los modelos utilizarán los especificados en Configuración de modelo.
Si has configurado nombres de modelo personalizados en LiteLLM, establece las variables de entorno mencionadas anteriormente en esos nombres personalizados.
Para obtener información más detallada, consulta la documentación de LiteLLM.
Recursos adicionales