前提条件
Claude Code を Vertex AI で設定する前に、以下を確認してください。- 請求が有効になっている Google Cloud Platform(GCP)アカウント
- Vertex AI API が有効になっている GCP プロジェクト
- 目的の Claude モデルへのアクセス(例:Claude Sonnet 4.6)
- Google Cloud SDK(
gcloud)がインストールされ、設定されていること - 目的の GCP リージョンに割り当てられたクォータ
Claude Code を複数のユーザーにデプロイする場合は、モデルバージョンをピン留めして、Anthropic が新しいモデルをリリースしたときの破損を防いでください。
リージョン設定
Claude Code は Vertex AI のグローバルエンドポイントと地域別エンドポイントの両方で使用できます。Vertex AI は、すべてのリージョンで Claude Code のデフォルトモデルをサポートしていない場合があります。また、グローバルエンドポイントでもサポートしていない場合があります。サポートされているリージョンに切り替えるか、地域別エンドポイントを使用するか、サポートされているモデルを指定する必要がある場合があります。
セットアップ
1. Vertex AI API を有効にする
GCP プロジェクトで Vertex AI API を有効にします。2. モデルアクセスをリクエストする
Vertex AI で Claude モデルへのアクセスをリクエストします。- Vertex AI Model Garden に移動します
- 「Claude」モデルを検索します
- 目的の Claude モデルへのアクセスをリクエストします(例:Claude Sonnet 4.6)
- 承認を待ちます(24 ~ 48 時間かかる場合があります)
3. GCP 認証情報を設定する
Claude Code は標準的な Google Cloud 認証を使用します。 詳細については、Google Cloud 認証ドキュメントを参照してください。認証時に、Claude Code は
ANTHROPIC_VERTEX_PROJECT_ID 環境変数からプロジェクト ID を自動的に使用します。これをオーバーライドするには、次の環境変数のいずれかを設定します。GCLOUD_PROJECT、GOOGLE_CLOUD_PROJECT、または GOOGLE_APPLICATION_CREDENTIALS。4. Claude Code を設定する
次の環境変数を設定します。cache_control エフェメラルフラグを指定すると自動的にサポートされます。これを無効にするには、DISABLE_PROMPT_CACHING=1 を設定します。レート制限を高くするには、Google Cloud サポートに連絡してください。Vertex AI を使用する場合、Google Cloud 認証情報を通じて認証が処理されるため、/login および /logout コマンドは無効になります。
5. モデルバージョンをピン留めする
これらの環境変数を特定の Vertex AI モデル ID に設定します。| モデルタイプ | デフォルト値 |
|---|---|
| プライマリモデル | claude-sonnet-4-6 |
| 小型/高速モデル | claude-haiku-4-5@20251001 |
IAM 設定
必要な IAM 権限を割り当てます。roles/aiplatform.user ロールには、必要な権限が含まれています。
aiplatform.endpoints.predict- モデル呼び出しとトークンカウントに必要
Claude Code 用に専用の GCP プロジェクトを作成して、コスト追跡とアクセス制御を簡素化してください。
100 万トークンコンテキストウィンドウ
Claude Opus 4.6、Sonnet 4.6、Sonnet 4.5、および Sonnet 4 は、Vertex AI で100 万トークンコンテキストウィンドウをサポートしています。Claude Code は、100 万トークンモデルバリアントを選択すると、拡張コンテキストウィンドウを自動的に有効にします。 ピン留めされたモデルの 100 万トークンコンテキストウィンドウを有効にするには、モデル ID に[1m] を追加します。詳細については、サードパーティデプロイメント用のモデルをピン留めするを参照してください。
トラブルシューティング
クォータの問題が発生した場合:- Cloud Console を通じて現在のクォータを確認するか、クォータ増加をリクエストしてください
- Model Garden でモデルが有効になっていることを確認してください
- 指定されたリージョンへのアクセス権があることを確認してください
CLOUD_ML_REGION=globalを使用している場合、Model Garden の「サポートされている機能」でモデルがグローバルエンドポイントをサポートしていることを確認してください。グローバルエンドポイントをサポートしていないモデルの場合は、以下のいずれかを実行してください。ANTHROPIC_MODELまたはANTHROPIC_SMALL_FAST_MODELを通じてサポートされているモデルを指定するか、VERTEX_REGION_<MODEL_NAME>環境変数を使用して地域別エンドポイントを設定してください
- 地域別エンドポイントの場合、プライマリモデルと小型/高速モデルが選択したリージョンでサポートされていることを確認してください
CLOUD_ML_REGION=globalに切り替えて、より良い可用性を得ることを検討してください