メインコンテンツへスキップ
LLM gatewayは、Claude Codeとモデルプロバイダー間の集中型プロキシレイヤーを提供し、以下のような機能をしばしば提供します:
  • 集中型認証 - API キー管理の単一ポイント
  • 使用状況追跡 - チームとプロジェクト全体での使用状況の監視
  • コスト管理 - 予算とレート制限の実装
  • 監査ログ - コンプライアンスのためのすべてのモデル相互作用の追跡
  • モデルルーティング - コード変更なしでプロバイダー間の切り替え

Gateway要件

LLM gatewayがClaude Codeと連携するには、以下の要件を満たす必要があります: API形式 gatewayは、クライアントに対して以下のAPI形式の少なくとも1つを公開する必要があります:
  1. Anthropic Messages: /v1/messages/v1/messages/count_tokens
    • リクエストヘッダーを転送する必要があります:anthropic-betaanthropic-version
  2. Bedrock InvokeModel: /invoke/invoke-with-response-stream
    • リクエストボディフィールドを保持する必要があります:anthropic_betaanthropic_version
  3. Vertex rawPredict: :rawPredict:streamRawPredict/count-tokens:rawPredict
    • リクエストヘッダーを転送する必要があります:anthropic-betaanthropic-version
ヘッダーの転送またはボディフィールドの保持に失敗すると、機能が低下したり、Claude Code機能を使用できなくなる可能性があります。
Claude Codeは、API形式に基づいて有効にする機能を決定します。Anthropic Messages形式をBedrocまたはVertexで使用する場合、環境変数 CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1 を設定する必要があります。

設定

モデル選択

デフォルトでは、Claude Codeは選択したAPI形式の標準モデル名を使用します。 gatewayでカスタムモデル名を設定している場合は、モデル設定に記載されている環境変数を使用して、カスタム名と一致させてください。

LiteLLM設定

LiteLLM PyPI バージョン 1.82.7 および 1.82.8 は、認証情報を盗むマルウェアで侵害されました。これらのバージョンをインストールしないでください。既にインストールしている場合:
  • パッケージを削除してください
  • 影響を受けたシステムのすべての認証情報をローテーションしてください
  • BerriAI/litellm#24518の修復手順に従ってください
LiteLLMはサードパーティのプロキシサービスです。Anthropicは、LiteLLMのセキュリティまたは機能を推奨、保守、または監査していません。このガイドは情報提供目的で提供されており、古くなる可能性があります。自己判断で使用してください。

前提条件

  • Claude Codeが最新バージョンに更新されている
  • LiteLLM Proxy Serverがデプロイされてアクセス可能
  • 選択したプロバイダーを通じてClaudeモデルへのアクセス

基本的なLiteLLMセットアップ

Claude Codeを設定する

認証方法

静的APIキー
固定APIキーを使用した最も簡単な方法:
# 環境で設定
export ANTHROPIC_AUTH_TOKEN=sk-litellm-static-key

# またはClaude Code設定で
{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "sk-litellm-static-key"
  }
}
この値は Authorization ヘッダーとして送信されます。
ヘルパーを使用した動的APIキー
キーのローテーションまたはユーザーごとの認証の場合:
  1. APIキーヘルパースクリプトを作成します:
#!/bin/bash
# ~/bin/get-litellm-key.sh

# 例:vaultからキーを取得
vault kv get -field=api_key secret/litellm/claude-code

# 例:JWTトークンを生成
jwt encode \
  --secret="${JWT_SECRET}" \
  --exp="+1h" \
  '{"user":"'${USER}'","team":"engineering"}'
  1. ヘルパーを使用するようにClaude Code設定を構成します:
{
  "apiKeyHelper": "~/bin/get-litellm-key.sh"
}
  1. トークンリフレッシュ間隔を設定します:
# 1時間ごとにリフレッシュ(3600000 ms)
export CLAUDE_CODE_API_KEY_HELPER_TTL_MS=3600000
この値は Authorization および X-Api-Key ヘッダーとして送信されます。apiKeyHelperANTHROPIC_AUTH_TOKEN または ANTHROPIC_API_KEY より優先度が低くなります。

統合エンドポイント(推奨)

LiteLLMのAnthropic形式エンドポイントを使用:
export ANTHROPIC_BASE_URL=https://litellm-server:4000
統合エンドポイントのパススルーエンドポイント上での利点:
  • ロードバランシング
  • フェイルオーバー
  • コスト追跡とエンドユーザー追跡の一貫したサポート

プロバイダー固有のパススルーエンドポイント(代替)

LiteLLMを通じたClaude API
パススルーエンドポイントを使用:
export ANTHROPIC_BASE_URL=https://litellm-server:4000/anthropic
LiteLLMを通じたAmazon Bedrock
パススルーエンドポイントを使用:
export ANTHROPIC_BEDROCK_BASE_URL=https://litellm-server:4000/bedrock
export CLAUDE_CODE_SKIP_BEDROCK_AUTH=1
export CLAUDE_CODE_USE_BEDROCK=1
LiteLLMを通じたGoogle Vertex AI
パススルーエンドポイントを使用:
export ANTHROPIC_VERTEX_BASE_URL=https://litellm-server:4000/vertex_ai/v1
export ANTHROPIC_VERTEX_PROJECT_ID=your-gcp-project-id
export CLAUDE_CODE_SKIP_VERTEX_AUTH=1
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=us-east5
詳細については、LiteLLMドキュメントを参照してください。

追加リソース