Passer au contenu principal
Les passerelles LLM fournissent une couche proxy centralisée entre Claude Code et les fournisseurs de modèles, offrant :
  • Authentification centralisée - Point unique pour la gestion des clés API
  • Suivi de l’utilisation - Surveillez l’utilisation entre les équipes et les projets
  • Contrôles des coûts - Implémentez des budgets et des limites de débit
  • Journalisation d’audit - Suivez toutes les interactions de modèles pour la conformité
  • Routage des modèles - Basculez entre les fournisseurs sans modifications de code

Configuration de LiteLLM

LiteLLM est un service proxy tiers. Anthropic n’approuve pas, ne maintient pas et n’audite pas la sécurité ou la fonctionnalité de LiteLLM. Ce guide est fourni à titre informatif et peut devenir obsolète. À utiliser à votre discrétion.

Prérequis

  • Claude Code mis à jour vers la dernière version
  • Serveur proxy LiteLLM déployé et accessible
  • Accès aux modèles Claude via votre fournisseur choisi

Configuration de base de LiteLLM

Configurer Claude Code :

Méthodes d’authentification

Clé API statique
Méthode la plus simple utilisant une clé API fixe :
# Définir dans l'environnement
export ANTHROPIC_AUTH_TOKEN=sk-litellm-static-key

# Ou dans les paramètres de Claude Code
{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "sk-litellm-static-key"
  }
}
Cette valeur sera envoyée en tant qu’en-tête Authorization.
Clé API dynamique avec assistant
Pour les clés rotatives ou l’authentification par utilisateur :
  1. Créez un script d’assistant de clé API :
#!/bin/bash
# ~/bin/get-litellm-key.sh

# Exemple : Récupérer la clé du coffre-fort
vault kv get -field=api_key secret/litellm/claude-code

# Exemple : Générer un jeton JWT
jwt encode \
  --secret="${JWT_SECRET}" \
  --exp="+1h" \
  '{"user":"'${USER}'","team":"engineering"}'
  1. Configurez les paramètres de Claude Code pour utiliser l’assistant :
{
  "apiKeyHelper": "~/bin/get-litellm-key.sh"
}
  1. Définissez l’intervalle d’actualisation du jeton :
# Actualiser toutes les heures (3600000 ms)
export CLAUDE_CODE_API_KEY_HELPER_TTL_MS=3600000
Cette valeur sera envoyée en tant qu’en-têtes Authorization et X-Api-Key. Le apiKeyHelper a une priorité inférieure à ANTHROPIC_AUTH_TOKEN ou ANTHROPIC_API_KEY.

Point de terminaison unifié (recommandé)

Utilisation du point de terminaison au format Anthropic de LiteLLM :
export ANTHROPIC_BASE_URL=https://litellm-server:4000
Avantages du point de terminaison unifié par rapport aux points de terminaison de transmission directe :
  • Équilibrage de charge
  • Basculements
  • Support cohérent du suivi des coûts et du suivi des utilisateurs finaux

Points de terminaison de transmission directe spécifiques au fournisseur (alternative)

API Claude via LiteLLM
Utilisation du point de terminaison de transmission directe :
export ANTHROPIC_BASE_URL=https://litellm-server:4000/anthropic
Amazon Bedrock via LiteLLM
Utilisation du point de terminaison de transmission directe :
export ANTHROPIC_BEDROCK_BASE_URL=https://litellm-server:4000/bedrock
export CLAUDE_CODE_SKIP_BEDROCK_AUTH=1
export CLAUDE_CODE_USE_BEDROCK=1
Google Vertex AI via LiteLLM
Utilisation du point de terminaison de transmission directe :
export ANTHROPIC_VERTEX_BASE_URL=https://litellm-server:4000/vertex_ai/v1
export ANTHROPIC_VERTEX_PROJECT_ID=your-gcp-project-id
export CLAUDE_CODE_SKIP_VERTEX_AUTH=1
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=us-east5

Sélection du modèle

Par défaut, les modèles utiliseront ceux spécifiés dans Configuration du modèle. Si vous avez configuré des noms de modèles personnalisés dans LiteLLM, définissez les variables d’environnement mentionnées précédemment sur ces noms personnalisés. Pour plus d’informations détaillées, consultez la documentation de LiteLLM.

Ressources supplémentaires