Langsung ke konten utama

Prasyarat

Sebelum mengonfigurasi Claude Code dengan Vertex AI, pastikan Anda memiliki:
  • Akun Google Cloud Platform (GCP) dengan penagihan diaktifkan
  • Proyek GCP dengan Vertex AI API diaktifkan
  • Akses ke model Claude yang diinginkan (misalnya, Claude Sonnet 4.6)
  • Google Cloud SDK (gcloud) terinstal dan dikonfigurasi
  • Kuota dialokasikan di wilayah GCP yang diinginkan
Jika Anda menerapkan Claude Code ke beberapa pengguna, pin versi model Anda untuk mencegah kerusakan ketika Anthropic merilis model baru.

Konfigurasi Wilayah

Claude Code dapat digunakan dengan titik akhir Vertex AI global dan regional.
Vertex AI mungkin tidak mendukung model default Claude Code di semua wilayah atau di titik akhir global. Anda mungkin perlu beralih ke wilayah yang didukung, menggunakan titik akhir regional, atau menentukan model yang didukung.

Pengaturan

1. Aktifkan Vertex AI API

Aktifkan Vertex AI API di proyek GCP Anda:
# Atur ID proyek Anda
gcloud config set project YOUR-PROJECT-ID

# Aktifkan Vertex AI API
gcloud services enable aiplatform.googleapis.com

2. Minta akses model

Minta akses ke model Claude di Vertex AI:
  1. Navigasikan ke Vertex AI Model Garden
  2. Cari model “Claude”
  3. Minta akses ke model Claude yang diinginkan (misalnya, Claude Sonnet 4.6)
  4. Tunggu persetujuan (mungkin memakan waktu 24-48 jam)

3. Konfigurasi kredensial GCP

Claude Code menggunakan autentikasi Google Cloud standar. Untuk informasi lebih lanjut, lihat dokumentasi autentikasi Google Cloud.
Saat melakukan autentikasi, Claude Code akan secara otomatis menggunakan ID proyek dari variabel lingkungan ANTHROPIC_VERTEX_PROJECT_ID. Untuk menimpanya, atur salah satu variabel lingkungan ini: GCLOUD_PROJECT, GOOGLE_CLOUD_PROJECT, atau GOOGLE_APPLICATION_CREDENTIALS.

4. Konfigurasi Claude Code

Atur variabel lingkungan berikut:
# Aktifkan integrasi Vertex AI
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=global
export ANTHROPIC_VERTEX_PROJECT_ID=YOUR-PROJECT-ID

# Opsional: Nonaktifkan prompt caching jika diperlukan
export DISABLE_PROMPT_CACHING=1

# Ketika CLOUD_ML_REGION=global, timpa wilayah untuk model yang tidak didukung
export VERTEX_REGION_CLAUDE_3_5_HAIKU=us-east5

# Opsional: Timpa wilayah untuk model spesifik lainnya
export VERTEX_REGION_CLAUDE_3_5_SONNET=us-east5
export VERTEX_REGION_CLAUDE_3_7_SONNET=us-east5
export VERTEX_REGION_CLAUDE_4_0_OPUS=europe-west1
export VERTEX_REGION_CLAUDE_4_0_SONNET=us-east5
export VERTEX_REGION_CLAUDE_4_1_OPUS=europe-west1
Prompt caching didukung secara otomatis ketika Anda menentukan flag ephemeral cache_control. Untuk menonaktifkannya, atur DISABLE_PROMPT_CACHING=1. Untuk batas laju yang lebih tinggi, hubungi dukungan Google Cloud. Saat menggunakan Vertex AI, perintah /login dan /logout dinonaktifkan karena autentikasi ditangani melalui kredensial Google Cloud.

5. Pin versi model

Pin versi model spesifik untuk setiap penerapan. Jika Anda menggunakan alias model (sonnet, opus, haiku) tanpa pinning, Claude Code mungkin mencoba menggunakan versi model yang lebih baru yang tidak diaktifkan di proyek Vertex AI Anda, merusak pengguna yang ada ketika Anthropic merilis pembaruan.
Atur variabel lingkungan ini ke ID model Vertex AI spesifik:
export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-6'
export ANTHROPIC_DEFAULT_SONNET_MODEL='claude-sonnet-4-6'
export ANTHROPIC_DEFAULT_HAIKU_MODEL='claude-haiku-4-5@20251001'
Untuk ID model saat ini dan warisan, lihat Ikhtisar Model. Lihat Konfigurasi Model untuk daftar lengkap variabel lingkungan. Claude Code menggunakan model default ini ketika tidak ada variabel pinning yang diatur:
Jenis modelNilai default
Model utamaclaude-sonnet-4-6
Model kecil/cepatclaude-haiku-4-5@20251001
Untuk menyesuaikan model lebih lanjut:
export ANTHROPIC_MODEL='claude-opus-4-6'
export ANTHROPIC_SMALL_FAST_MODEL='claude-haiku-4-5@20251001'

Konfigurasi IAM

Tetapkan izin IAM yang diperlukan: Peran roles/aiplatform.user mencakup izin yang diperlukan:
  • aiplatform.endpoints.predict - Diperlukan untuk invokasi model dan penghitungan token
Untuk izin yang lebih ketat, buat peran kustom dengan hanya izin di atas. Untuk detail, lihat dokumentasi Vertex IAM.
Buat proyek GCP khusus untuk Claude Code untuk menyederhanakan pelacakan biaya dan kontrol akses.

Jendela konteks token 1M

Claude Opus 4.6, Sonnet 4.6, Sonnet 4.5, dan Sonnet 4 mendukung jendela konteks token 1M di Vertex AI. Claude Code secara otomatis mengaktifkan jendela konteks yang diperluas ketika Anda memilih varian model 1M. Untuk mengaktifkan jendela konteks 1M untuk model yang Anda pin, tambahkan [1m] ke ID model. Lihat Pin models for third-party deployments untuk detail.

Pemecahan Masalah

Jika Anda mengalami masalah kuota:
  • Periksa kuota saat ini atau minta peningkatan kuota melalui Cloud Console
Jika Anda mengalami kesalahan “model not found” 404:
  • Konfirmasi model diaktifkan di Model Garden
  • Verifikasi Anda memiliki akses ke wilayah yang ditentukan
  • Jika menggunakan CLOUD_ML_REGION=global, periksa bahwa model Anda mendukung titik akhir global di Model Garden di bawah “Supported features”. Untuk model yang tidak mendukung titik akhir global, baik:
    • Tentukan model yang didukung melalui ANTHROPIC_MODEL atau ANTHROPIC_SMALL_FAST_MODEL, atau
    • Atur titik akhir regional menggunakan variabel lingkungan VERTEX_REGION_<MODEL_NAME>
Jika Anda mengalami kesalahan 429:
  • Untuk titik akhir regional, pastikan model utama dan model kecil/cepat didukung di wilayah yang Anda pilih
  • Pertimbangkan untuk beralih ke CLOUD_ML_REGION=global untuk ketersediaan yang lebih baik

Sumber daya tambahan