Las puertas de enlace LLM proporcionan una capa proxy centralizada entre Claude Code y los proveedores de modelos, a menudo proporcionando:Documentation Index
Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
- Autenticación centralizada - Punto único para la gestión de claves API
- Seguimiento de uso - Monitorea el uso en equipos y proyectos
- Controles de costos - Implementa presupuestos y límites de velocidad
- Registro de auditoría - Rastrea todas las interacciones del modelo para cumplimiento normativo
- Enrutamiento de modelos - Cambia entre proveedores sin cambios de código
Requisitos de la puerta de enlace
Para que una puerta de enlace LLM funcione con Claude Code, debe cumplir con los siguientes requisitos: Formato de API La puerta de enlace debe exponer a los clientes al menos uno de los siguientes formatos de API:-
Anthropic Messages:
/v1/messages,/v1/messages/count_tokens- Debe reenviar encabezados de solicitud:
anthropic-beta,anthropic-version
- Debe reenviar encabezados de solicitud:
-
Bedrock InvokeModel:
/invoke,/invoke-with-response-stream- Debe preservar campos del cuerpo de la solicitud:
anthropic_beta,anthropic_version
- Debe preservar campos del cuerpo de la solicitud:
-
Vertex rawPredict:
:rawPredict,:streamRawPredict,/count-tokens:rawPredict- Debe reenviar encabezados de solicitud:
anthropic-beta,anthropic-version
- Debe reenviar encabezados de solicitud:
Claude Code determina qué características habilitar en función del formato de API. Al usar el formato Anthropic Messages con Bedrock o Vertex, es posible que necesite establecer la variable de entorno
CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1.| Encabezado | Descripción |
|---|---|
X-Claude-Code-Session-Id | Un identificador único para la sesión actual de Claude Code. Los proxies pueden usar esto para agregar todas las solicitudes de API de una sola sesión sin analizar el cuerpo de la solicitud. |
X-Claude-Code-Agent-Id | Identificador del subagente o compañero de equipo que emitió la solicitud. Su proxy puede usar esto para atribuir el costo de API a subagentes paralelos individuales dentro de una sesión, sin analizar el cuerpo de la solicitud. Presente solo para solicitudes realizadas por un subagente o compañero de equipo en proceso. |
X-Claude-Code-Parent-Agent-Id | Identificador del agente que generó el agente que realiza la solicitud. Use esto con X-Claude-Code-Agent-Id para atribuir costos de API en agentes anidados en su proxy. Presente solo cuando el agente solicitante fue generado por otro agente. |
CLAUDE_CODE_ATTRIBUTION_HEADER=0 para omitirlo.
Configuración
Selección de modelo
Por defecto, Claude Code utiliza nombres de modelo estándar para el formato de API seleccionado. CuandoANTHROPIC_BASE_URL apunta a una puerta de enlace que expone el formato de Mensajes de Anthropic, Claude Code puede consultar el punto final /v1/models de la puerta de enlace al inicio y añadir los modelos devueltos al selector /model. Establezca CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 para habilitar esto. El descubrimiento está desactivado por defecto para que las puertas de enlace respaldadas por una clave de API compartida no expongan todos los modelos a los que la clave puede acceder a cada usuario. Cada entrada descubierta se etiqueta como “Desde puerta de enlace” y utiliza el campo display_name de la respuesta cuando se proporciona uno. Esto requiere Claude Code v2.1.129 o posterior.
El descubrimiento se aplica solo al formato de Mensajes de Anthropic. No se ejecuta para puntos finales de paso a través de Bedrock o Vertex, y no se ejecuta cuando ANTHROPIC_BASE_URL no está configurado o apunta a api.anthropic.com.
La solicitud de descubrimiento se autentica de la misma manera que las solicitudes de inferencia: envía ANTHROPIC_AUTH_TOKEN como un token portador, o ANTHROPIC_API_KEY como el encabezado x-api-key cuando no hay un token de autenticación configurado, junto con cualquier encabezado de ANTHROPIC_CUSTOM_HEADERS. Solo se añaden al selector los modelos cuyo ID comienza con claude o anthropic. Los resultados se almacenan en caché en ~/.claude/cache/gateway-models.json y se actualizan en cada inicio. Si la solicitud falla o la puerta de enlace no implementa /v1/models, el selector vuelve a la lista en caché del inicio anterior o a la lista de modelos integrada.
Si su puerta de enlace utiliza nombres de modelo que no coinciden con el filtro de descubrimiento, utilice las variables de entorno documentadas en Configuración de modelo para añadirlos manualmente.
Configuración de LiteLLM
Requisitos previos
- Claude Code actualizado a la última versión
- Servidor Proxy de LiteLLM implementado y accesible
- Acceso a modelos Claude a través de tu proveedor elegido
Configuración básica de LiteLLM
Configura Claude Code:Métodos de autenticación
Clave API estática
Método más simple usando una clave API fija:Authorization.
Clave API dinámica con ayudante
Para claves rotativas o autenticación por usuario:- Crea un script ayudante de clave API:
- Configura la configuración de Claude Code para usar el ayudante:
- Establece el intervalo de actualización de token:
Authorization y X-Api-Key. El apiKeyHelper tiene menor precedencia que ANTHROPIC_AUTH_TOKEN o ANTHROPIC_API_KEY.
Punto final unificado (recomendado)
Usando el punto final de formato Anthropic de LiteLLM:- Equilibrio de carga
- Alternativas
- Soporte consistente para seguimiento de costos y seguimiento de usuario final