このページでは、Google Cloud で Claude apps gateway を実行する 1 つの方法を説明します。この設定は、サポートされている本番環境デプロイメントではなく、カスタマー管理インフラストラクチャの実装例です。各部分がどのように組み合わさるかを確認してから、自分の環境に適応させてください。プラットフォーム非依存の要件については、デプロイメントガイドを参照してください。
oidc ブロックのみが変わります。IdP ごとの詳細については、ID プロバイダーのセットアップを参照してください。
構築内容
- ゲートウェイコンテナを実行する Cloud Run サービスまたは GKE Deployment
- ゲートウェイイメージ用の Artifact Registry リポジトリ
- ゲートウェイのストア用のプライベート IP のみの Cloud SQL for PostgreSQL インスタンス
gateway.yaml、JWT 署名キー、OIDC クライアントシークレット、および Postgres URL 用の Secret Manager シークレットroles/aiplatform.userを持つ Service account、Cloud Run に直接アタッチされるか、GKE 上で Workload Identity 経由でバインドされます- Cloud Run 上の Internal Application Load Balancer、または GKE 上のクラス
gce-internalの内部 GKE Ingress(HTTPS 用)
前提条件
- 課金が有効になっている GCP プロジェクトと、上記のリソースを作成する権限
gcloud auth loginで認証されたgcloudCLI、およびローカルにインストールされた Docker- GKE トラック用:
kubectl、および以下のウォークスルーで作成された VPC 上の GKE クラスタ - Model Garden で必要な Claude モデルへのアクセス、それらを公開している地域内
- リダイレクト URI が
https://<gateway-host>/oauth/callbackの Google Workspace OAuth 2.0 ウェブアプリケーションクライアント。ID プロバイダーのセットアップを参照してください - ゲートウェイ用の TLS ホスト名。通常はロードバランサーを指すプライベート DNS 名
ゲートウェイをデプロイする
以下のステップは、gcloud コマンドで完全なデプロイメントをプロビジョニングします。
API を有効にする
ウォークスルーで使用するサービス API を有効にします:必要な API はデプロイメントパスによって異なります:
computeおよびservicenetworking:プライベート IP Cloud SQL パス用run:Cloud Run のみcontainer:GKE のみ
Service account を作成して IAM を付与する
ゲートウェイは Agent Platform を呼び出す権限を持つ専用 service account として実行されます。VPC 経由で Cloud SQL に到達するパスワードユーザーなので、Cloud SQL IAM ロールは不要です:次に、Model Garden でプロジェクト用に Claude モデルを有効にします。モデルは特定の地域に公開されるため、各モデルカードを確認してください。
イメージをビルドして Artifact Registry にプッシュする
コンテナイメージ要件に従ってイメージをビルドし、
linux-x64 glibc バイナリを使用してプッシュします:Cloud SQL for PostgreSQL をプロビジョニングする
Private Services Access 経由で VPC 上にインスタンスを作成し、パブリック IP がないようにします。これは Cloud Run または GKE ランタイムは、この VPC 上にあるか、この VPC にルーティングされている必要があります。
constraints/sql.restrictPublicIp が適用されているプロジェクトも満たします:gateway.yaml を書き込む
upstreams ブロックは auth: {} で Agent Platform を指すため、ゲートウェイはランタイム service account からの Application Default Credentials 経由で認証します。すべてのフィールドについては、設定リファレンスを参照してください。2 つの listen フィールドはゲートウェイの前にあるものに依存します:public_url:Cloud Run または GKE Ingress の背後で必須。ゲートウェイは IdPredirect_uriと検出ドキュメントをこの値からのみビルドし、X-Forwarded-*ヘッダーからは決してビルドしません。trusted_proxies:フロントエンドのソース範囲。ゲートウェイは TCP ピアがこのリストにある場合にのみX-Forwarded-Forを尊重し、信頼できるホップを超えてチェーンを歩くため、IP ごとのサインイン レート制限と監査イベントはロードバランサーの IP ではなく開発者 IP を記録します。
trusted_proxies を設定します。クラス gce の外部 GKE Ingress はリストされていません。パブリック転送ルールアドレスをプロビジョニングし、/login プライベートネットワークチェックがこれを拒否します。| フロントエンド | trusted_proxies |
|---|---|
| ロードバランサーなしで直接到達する Cloud Run | [169.254.0.0/16] |
| Cloud Run の前の Internal Application Load Balancer | 169.254.0.0/16 プラスプロキシのみサブネットの CIDR |
GKE 内部 Ingress、クラス gce-internal | プロキシのみサブネットの CIDR |
gateway.yaml
Google id_tokens は
groups クレームを含みません。Google Workspace を IdP として managed.policies でグループベースのポリシーを使用するには、oidc.google_groups を設定します。これは Admin SDK Directory API を使用してドメイン全体の委任を持つ service account を使用して各ユーザーのグループを検索します。これなしで、代わりに email_domain で一致させます。Secret Manager にシークレットを保存する
4 つのシークレットを作成し、
シークレットがコンテナに到達する方法はトラックによって異なります:
claude-gateway service account に roles/secretmanager.secretAccessor を付与します:| シークレット | ソース |
|---|---|
gateway-jwt-secret | openssl rand -base64 32 |
gateway-oidc-client-secret | Google Cloud Console → OAuth クライアント |
gateway-postgres-url | Cloud SQL ステップからの $GATEWAY_POSTGRES_URL |
gateway-config | 前のステップからの完全な gateway.yaml |
- GKE では Secret Manager CSI ドライバー経由で
/secretsにマウントされ、gateway.yamlは${file:/secrets/...}を参照します。 - Cloud Run では複数のシークレットを 1 つのディレクトリにマウントできないため、
gateway.yamlはファイルとしてマウントされ、他の 3 つは環境変数として注入されるため、gateway.yamlは代わりに${GATEWAY_JWT_SECRET}、${OIDC_CLIENT_SECRET}、および${GATEWAY_POSTGRES_URL}を参照します。
デプロイする
- Cloud Run
- GKE
以下のコマンドは内部ロードバランサーの背後で本番環境用にデプロイします。Direct VPC egress(
--network、--subnet、および --vpc-egress=private-ranges-only 経由)により、サービスは Cloud SQL プライベート IP に直接到達できます。Agent Platform エンドポイントおよび accounts.google.com への公開エグレスは VPC を通さずにインターネットに直接移動するため、Cloud NAT は不要です。invoker IAM チェックはオープンまたは無効にする必要があります。ゲートウェイは独自の OIDC を実行し、そのクライアントは GCP トークンを持たないため、Cloud Run の invoker チェックは認証されていないリクエストを許可する必要があります。ゲートウェイの OIDC サインインは、コンテナに到達すると allowed_email_domains でゲートウェイがどのドメインがサインインできるかを制御して、リクエストを認証します。2 つのフラグが認証されていないリクエストを許可します:--no-invoker-iam-check:管理するallUsersバインディングなしでチェックを無効にし、Domain Restricted Sharing の下で機能します--allow-unauthenticated:allUsersにrun.invokerロールを付与します。組織が--no-invoker-iam-checkを許可しない場合はこれを使用します
--ingress 経由のイングレス制限は invoker チェックから独立した別のレイヤーです。サービスを企業ネットワークに制限するために設定したままにしておきます。デフォルトでは、Cloud Run *.run.app URL はパブリックアドレスに解決され、/login プライベートネットワークチェックがこれを拒否します。2 つのトポロジーは開発者にプライベートに解決可能なホスト名を提供し、Cloud Run はどちらもプロビジョニングしません:- Internal Application Load Balancer、上記のデプロイコマンドが想定するトポロジー:
--ingress=internal-and-cloud-load-balancingでデプロイし、サービスの前に内部 Application Load Balancer をプロビジョニングして内部 DNS 名と証明書を使用し、listen.public_urlをそのホスト名に設定します。 - ロードバランサーなしの内部のみイングレス:
--ingress=internalでデプロイし、listen.public_urlを*.run.appURL(以下のリファレンスアセットのデフォルト)のままにします。*.run.appがプライベートに解決するには、ネットワークチームが既に Google API 用の Private Service Connect エンドポイント、*.run.appをそれに解決する Cloud DNS プライベートゾーン、およびそのエンドポイントへのオンプレミスルーティングを運用している必要があります。
<public_url>/oauth/callback に更新します。public_url を変更した後に再デプロイします。ゲートウェイはその設定からのみパブリックオリジンをビルドし、X-Forwarded-Host および X-Forwarded-Proto を無視するためです。X-Forwarded-For は listen.trusted_proxies が設定されている場合にのみクライアント IP に対して尊重されます。ゲートウェイ URL を開発者マシンにプッシュする
ゲートウェイは実行されていますが、開発者は
/login からゲートウェイ URL がマシンに配置されるまでそれに到達できません。MDM 経由で各デバイスにデプロイする管理設定ファイルで forceLoginMethod および forceLoginGatewayUrl を設定します。開発者が手動で選択できるログインピッカーのゲートウェイオプションはありません。Terraform リファレンス
リファレンスデプロイメントアセットはこのページの Cloud Run トラックを自動化します。設定とイメージアセットは両方のトラックに適用されます:setup.sh:API の有効化から最初のデプロイまで、完全な Cloud Run パスを歩く冪等なgcloudプロビジョナーterraform/:インフラストラクチャアズコードとしての同じデプロイメント。greenfield デプロイ用:Artifact Registry リポジトリを作成するための対象適用、次にイメージをビルドしてプッシュ、次に完全適用gateway.yaml.exampleおよび distroless ランタイムイメージ用のDockerfile
internal にするため、ロードバランサーは不要です。このページの本番環境の背後の ALB デプロイメントに一致させるには、INGRESS=internal-and-cloud-load-balancing で setup.sh を実行するか、Terraform 変数 ingress を INGRESS_TRAFFIC_INTERNAL_LOAD_BALANCER に設定します。アーティファクトは invoker レイヤーもデフォルトで allUsers run.invoker 付与にするため、このページのウォークスルーの --no-invoker-iam-check ではなく逆です。どちらでも機能し、選択は組織のポリシー制約に依存します。
アセットは実装例として提供されており、サポートされている本番環境アーティファクトではありません。環境に合わせてレビューして適応させてください。
トラブルシューティング
ゲートウェイブートとログインエラーについては、プラットフォーム非依存のトラブルシューティングテーブルを参照してください。以下のエントリは Google Cloud に固有です。| 症状 | 原因 | 修正 |
|---|---|---|
Cloud Run がコンテナに到達する前に 403 Forbidden を返す | invoker IAM チェックがまだ有効 | --no-invoker-iam-check でデプロイするか、--allow-unauthenticated で allUsers に run.invoker ロールを付与します |
--no-invoker-iam-check が invoker_iam_disabled is not currently available で拒否される | constraints/run.managed.requireInvokerIam でブロック | --allow-unauthenticated を使用します。constraints/iam.allowedPolicyMemberDomains 経由の Domain Restricted Sharing もそれをブロックする場合は、GKE トラックを使用します。これはネットワークレイヤーでゲートウェイを公開し、allUsers バインディングはありません。 |
デプロイ時に Container manifest type … must support amd64/linux | イメージが非 amd64 ホストでビルドされたか、buildx が OCI イメージインデックスを発行した | --platform=linux/amd64 --provenance=false でビルドします |
| ゲートウェイブートが Cloud Run で Postgres 接続タイムアウトエラーで終了 | Service が VPC にアタッチされていないか、Cloud SQL がその VPC にプライベート IP がない。ストアは 5 秒後に待機を停止します | Direct VPC egress 用に --network および --subnet でデプロイし、Cloud SQL インスタンスを --no-assign-ip および --network で同じ VPC を指すように作成します |
Agent Platform リクエストが 403 PERMISSION_DENIED を返す | ランタイムが claude-gateway service account を使用していないか、モデルが Model Garden でプロジェクト用に有効になっていない | Cloud Run で --service-account を設定するか、GKE で Workload Identity をバインドし、各 Claude モデルを Model Garden でターゲット地域用に有効にします |
| ストリーミング応答が固定期間後に切断される | フロントエンドリクエストタイムアウト:GKE Ingress の背後のロードバランサーバックエンドサービスはデフォルトで 30 秒、Cloud Run は 300 秒 | GKE で timeoutSec を上げた BackendConfig をアタッチするか、Cloud Run で --timeout=3600 でデプロイします |
次のステップ
- 設定リファレンス:すべての
gateway.yamlオプション(managed.policiesおよびtelemetryを含む) - デプロイメントと運用:IdP セットアップ、ヘルスチェック、JWT シークレットローテーション、アップグレード、およびセキュリティモデル
- Claude apps gateway 概要:クイックスタートと開発者の接続