LLM gateway menyediakan lapisan proxy terpusat antara Claude Code dan penyedia model, sering kali menyediakan:Documentation Index
Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
- Autentikasi terpusat - Titik tunggal untuk manajemen kunci API
- Pelacakan penggunaan - Pantau penggunaan di seluruh tim dan proyek
- Kontrol biaya - Terapkan anggaran dan batas laju
- Pencatatan audit - Lacak semua interaksi model untuk kepatuhan
- Perutean model - Beralih antar penyedia tanpa perubahan kode
Persyaratan gateway
Agar LLM gateway dapat bekerja dengan Claude Code, gateway harus memenuhi persyaratan berikut: Format API Gateway harus mengekspos ke klien setidaknya salah satu format API berikut:-
Anthropic Messages:
/v1/messages,/v1/messages/count_tokens- Harus meneruskan header permintaan:
anthropic-beta,anthropic-version
- Harus meneruskan header permintaan:
-
Bedrock InvokeModel:
/invoke,/invoke-with-response-stream- Harus mempertahankan bidang badan permintaan:
anthropic_beta,anthropic_version
- Harus mempertahankan bidang badan permintaan:
-
Vertex rawPredict:
:rawPredict,:streamRawPredict,/count-tokens:rawPredict- Harus meneruskan header permintaan:
anthropic-beta,anthropic-version
- Harus meneruskan header permintaan:
Claude Code menentukan fitur mana yang akan diaktifkan berdasarkan format API. Saat menggunakan format Anthropic Messages dengan Bedrock atau Vertex, Anda mungkin perlu mengatur variabel lingkungan
CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1.| Header | Deskripsi |
|---|---|
X-Claude-Code-Session-Id | Pengidentifikasi unik untuk sesi Claude Code saat ini. Proxy dapat menggunakan ini untuk mengagregasi semua permintaan API dari sesi tunggal tanpa mengurai badan permintaan. |
X-Claude-Code-Agent-Id | Pengidentifikasi subagen atau rekan kerja yang mengeluarkan permintaan. Proxy Anda dapat menggunakan ini untuk mengatribusikan biaya API ke subagen paralel individual dalam sesi, tanpa mengurai badan permintaan. Hanya ada untuk permintaan yang dibuat oleh subagen atau rekan kerja dalam proses. |
X-Claude-Code-Parent-Agent-Id | Pengidentifikasi agen yang melahirkan agen yang membuat permintaan. Gunakan ini dengan X-Claude-Code-Agent-Id untuk mengatribusikan biaya API di seluruh agen bersarang dalam proxy Anda. Hanya ada ketika agen yang meminta itu sendiri dilahirkan oleh agen lain. |
CLAUDE_CODE_ATTRIBUTION_HEADER=0 untuk menghilangkannya.
Konfigurasi
Pemilihan model
Secara default, Claude Code menggunakan nama model standar untuk format API yang dipilih. KetikaANTHROPIC_BASE_URL menunjuk ke gateway yang mengekspos format Anthropic Messages, Claude Code dapat menanyakan endpoint /v1/models gateway saat startup dan menambahkan model yang dikembalikan ke pemilih /model. Atur CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 untuk mengaktifkan ini. Penemuan dimatikan secara default sehingga gateway yang didukung oleh kunci API bersama tidak menampilkan setiap model yang dapat diakses kunci ke setiap pengguna. Setiap entri yang ditemukan diberi label “From gateway” dan menggunakan field display_name dari respons ketika satu disediakan. Ini memerlukan Claude Code v2.1.129 atau lebih baru.
Penemuan hanya berlaku untuk format Anthropic Messages. Ini tidak berjalan untuk endpoint pass-through Bedrock atau Vertex, dan tidak berjalan ketika ANTHROPIC_BASE_URL tidak diatur atau menunjuk ke api.anthropic.com.
Permintaan penemuan mengautentikasi dengan cara yang sama seperti permintaan inferensi: ia mengirimkan ANTHROPIC_AUTH_TOKEN sebagai token bearer, atau ANTHROPIC_API_KEY sebagai header x-api-key ketika tidak ada token auth yang diatur, bersama dengan header apa pun dari ANTHROPIC_CUSTOM_HEADERS. Hanya model yang ID-nya dimulai dengan claude atau anthropic yang ditambahkan ke pemilih. Hasil disimpan dalam cache ke ~/.claude/cache/gateway-models.json dan disegarkan pada setiap startup. Jika permintaan gagal atau gateway tidak mengimplementasikan /v1/models, pemilih kembali ke daftar cache dari startup sebelumnya atau ke daftar model bawaan.
Jika gateway Anda menggunakan nama model yang tidak cocok dengan filter penemuan, gunakan variabel lingkungan yang didokumentasikan dalam Konfigurasi Model untuk menambahkannya secara manual.
Konfigurasi LiteLLM
Prasyarat
- Claude Code diperbarui ke versi terbaru
- LiteLLM Proxy Server diterapkan dan dapat diakses
- Akses ke model Claude melalui penyedia pilihan Anda
Pengaturan LiteLLM dasar
Konfigurasi Claude Code:Metode autentikasi
Kunci API statis
Metode paling sederhana menggunakan kunci API tetap:Authorization.
Kunci API dinamis dengan pembantu
Untuk kunci yang berputar atau autentikasi per pengguna:- Buat skrip pembantu kunci API:
- Konfigurasi pengaturan Claude Code untuk menggunakan pembantu:
- Atur interval penyegaran token:
Authorization dan X-Api-Key. apiKeyHelper memiliki prioritas lebih rendah daripada ANTHROPIC_AUTH_TOKEN atau ANTHROPIC_API_KEY.
Endpoint terpadu (direkomendasikan)
Menggunakan endpoint format Anthropic LiteLLM:- Penyeimbangan beban
- Fallback
- Dukungan konsisten untuk pelacakan biaya dan pelacakan pengguna akhir