- Authentification centralisée - Point unique pour la gestion des clés API
- Suivi de l’utilisation - Surveiller l’utilisation entre les équipes et les projets
- Contrôles des coûts - Implémenter des budgets et des limites de débit
- Journalisation d’audit - Suivre toutes les interactions de modèle pour la conformité
- Routage des modèles - Basculer entre les fournisseurs sans modifications de code
Exigences de la passerelle
Pour qu’une passerelle LLM fonctionne avec Claude Code, elle doit répondre aux exigences suivantes : Format API La passerelle doit exposer aux clients au moins l’un des formats API suivants :-
Anthropic Messages :
/v1/messages,/v1/messages/count_tokens- Doit transférer les en-têtes de requête :
anthropic-beta,anthropic-version
- Doit transférer les en-têtes de requête :
-
Bedrock InvokeModel :
/invoke,/invoke-with-response-stream- Doit préserver les champs du corps de la requête :
anthropic_beta,anthropic_version
- Doit préserver les champs du corps de la requête :
-
Vertex rawPredict :
:rawPredict,:streamRawPredict,/count-tokens:rawPredict- Doit transférer les en-têtes de requête :
anthropic-beta,anthropic-version
- Doit transférer les en-têtes de requête :
Claude Code détermine les fonctionnalités à activer en fonction du format API. Lors de l’utilisation du format Anthropic Messages avec Bedrock ou Vertex, vous devrez peut-être définir la variable d’environnement
CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1.Configuration
Sélection du modèle
Par défaut, Claude Code utilisera les noms de modèles standard pour le format API sélectionné. Si vous avez configuré des noms de modèles personnalisés dans votre passerelle, utilisez les variables d’environnement documentées dans Configuration du modèle pour correspondre à vos noms personnalisés.Configuration de LiteLLM
Conditions préalables
- Claude Code mis à jour vers la dernière version
- Serveur proxy LiteLLM déployé et accessible
- Accès aux modèles Claude via votre fournisseur choisi
Configuration de base de LiteLLM
Configurer Claude Code :Méthodes d’authentification
Clé API statique
Méthode la plus simple utilisant une clé API fixe :Authorization.
Clé API dynamique avec assistant
Pour les clés rotatives ou l’authentification par utilisateur :- Créez un script d’assistant de clé API :
- Configurez les paramètres de Claude Code pour utiliser l’assistant :
- Définissez l’intervalle d’actualisation du jeton :
Authorization et X-Api-Key. L’apiKeyHelper a une priorité inférieure à ANTHROPIC_AUTH_TOKEN ou ANTHROPIC_API_KEY.
Point de terminaison unifié (recommandé)
Utilisant le point de terminaison au format Anthropic de LiteLLM :- Équilibrage de charge
- Basculements
- Support cohérent du suivi des coûts et du suivi des utilisateurs finaux