跳轉到主要內容
本頁面介紹在 Google Cloud 上執行 Claude 應用程式閘道的一種方式。此配置是客戶管理基礎設施的工作範例,而非受支援的生產部署;使用它來了解各個部分如何組合在一起,然後再根據您自己的環境進行調整。如需平台無關的需求,請參閱部署指南
此範例在 Google Cloud 上配置 Claude 應用程式閘道,使用 Google Cloud 的 Agent Platform 作為模型上游,並使用 Cloud Run 或 GKE 進行運算。Google Workspace 是範例身分提供者 (IdP),但任何符合 OpenID Connect (OIDC) 的 IdP 都可以使用;只有 oidc 區塊會改變。如需各個 IdP 的詳細資訊,請參閱身分提供者設定

您將建立的內容

Google Cloud 上 Claude 應用程式閘道的圖表:Claude Code 用戶端透過 HTTPS 連接到閘道(Cloud Run 或 GKE),閘道在 VPC 內執行,旁邊有一個私有 IP Cloud SQL 資料庫用於工作階段狀態。閘道透過 OIDC 針對 Google Workspace 簽署使用者,從 Secret Manager 讀取配置和祕密,將模型請求轉發到 Agent Platform,並在部署時從 Artifact Registry 提取其映像。
參考配置會配置:
  • 執行閘道容器的 Cloud Run 服務或 GKE Deployment
  • 用於閘道映像的 Artifact Registry 儲存庫
  • Cloud SQL for PostgreSQL 執行個體,僅限私有 IP,用於閘道的儲存
  • Secret Manager 祕密,用於 gateway.yaml、JWT 簽署金鑰、OIDC 用戶端祕密和 Postgres URL
  • 服務帳戶,具有 roles/aiplatform.user,直接附加到 Cloud Run 或透過 GKE 上的 Workload Identity 繫結
  • 內部應用程式負載平衡器(在 Cloud Run 上),或在 GKE 上使用 gce-internal 類別的內部 GKE Ingress,用於 HTTPS

先決條件

  • 啟用計費的 GCP 專案,以及建立上述資源的權限
  • gcloud CLI(使用 gcloud auth login 驗證)和本機安裝的 Docker
  • 對於 GKE 路徑:kubectl 和在下面逐步解說中建立的 VPC 上的 GKE 叢集
  • 在 Model Garden 中存取您需要的 Claude 模型,在發佈這些模型的區域中
  • Google Workspace OAuth 2.0 網路應用程式用戶端,重新導向 URI 為 https://<gateway-host>/oauth/callback;請參閱身分提供者設定
  • 閘道的 TLS 主機名稱,通常是指向負載平衡器的內部 DNS 名稱
設定專案和區域一次:
export PROJECT_ID=<your-project>
export REGION=us-east5   # a region where the Claude models you need are published in Model Garden
gcloud config set project "$PROJECT_ID"

部署閘道

下面的步驟使用 gcloud 命令配置完整部署。
1

啟用 API

啟用逐步解說使用的服務 API:
gcloud services enable \
  aiplatform.googleapis.com \
  artifactregistry.googleapis.com \
  sqladmin.googleapis.com \
  secretmanager.googleapis.com \
  iamcredentials.googleapis.com \
  iam.googleapis.com \
  compute.googleapis.com \
  servicenetworking.googleapis.com \
  run.googleapis.com \
  container.googleapis.com
您需要的 API 取決於部署路徑:
  • computeservicenetworking:私有 IP Cloud SQL 路徑所需
  • run:僅限 Cloud Run
  • container:僅限 GKE
2

建立服務帳戶並授予 IAM

閘道以專用服務帳戶執行,具有呼叫 Agent Platform 的權限。它透過 VPC 使用密碼使用者到達 Cloud SQL,因此不需要 Cloud SQL IAM 角色:
gcloud iam service-accounts create claude-gateway --display-name="Claude apps gateway"
SA="claude-gateway@${PROJECT_ID}.iam.gserviceaccount.com"

gcloud projects add-iam-policy-binding "$PROJECT_ID" \
  --member="serviceAccount:${SA}" --role="roles/aiplatform.user" --condition=None
然後在 Model Garden 中為專案啟用 Claude 模型;模型發佈到特定區域,因此請檢查每個模型卡。
3

建立映像並推送到 Artifact Registry

根據容器映像需求建立映像,使用 linux-x64 glibc 二進位檔,並推送它:
gcloud artifacts repositories create claude-gateway \
  --repository-format=docker --location="$REGION"
gcloud auth configure-docker "${REGION}-docker.pkg.dev" --quiet

# Cloud Run requires linux/amd64. --provenance=false avoids a buildx OCI
# image index that Cloud Run rejects.
docker build --platform=linux/amd64 --provenance=false \
  -t "${REGION}-docker.pkg.dev/${PROJECT_ID}/claude-gateway/gateway:<version>" .
docker push "${REGION}-docker.pkg.dev/${PROJECT_ID}/claude-gateway/gateway:<version>"
4

配置 Cloud SQL for PostgreSQL

透過 Private Services Access 在 VPC 上建立執行個體,使其沒有公用 IP;這也滿足強制執行 constraints/sql.restrictPublicIp 的專案:
VPC=cc-gateway-vpc
gcloud compute networks create "$VPC" --subnet-mode=custom
gcloud compute networks subnets create cc-gateway-subnet \
  --network="$VPC" --region="$REGION" --range=10.0.0.0/24

# Private Services Access: one-time per VPC
gcloud compute addresses create "google-managed-services-${VPC}" \
  --global --purpose=VPC_PEERING --prefix-length=16 --network="$VPC"
gcloud services vpc-peerings connect \
  --service=servicenetworking.googleapis.com \
  --ranges="google-managed-services-${VPC}" --network="$VPC"

gcloud sql instances create claude-gateway-db \
  --database-version=POSTGRES_16 --tier=db-g1-small --region="$REGION" \
  --network="projects/${PROJECT_ID}/global/networks/${VPC}" --no-assign-ip
gcloud sql databases create claude_gateway --instance=claude-gateway-db
PGPASS="$(openssl rand -hex 24)"
gcloud sql users create gateway --instance=claude-gateway-db --password="$PGPASS"

PRIVATE_IP="$(gcloud sql instances describe claude-gateway-db \
  --format='value(ipAddresses[0].ipAddress)')"
GATEWAY_POSTGRES_URL="postgres://gateway:${PGPASS}@${PRIVATE_IP}:5432/claude_gateway?sslmode=require"
Cloud Run 或 GKE 執行時必須在此 VPC 上或路由到此 VPC。
5

撰寫 gateway.yaml

upstreams 區塊使用 auth: {} 指向 Agent Platform,因此閘道透過執行時服務帳戶的應用程式預設認證進行驗證。如需每個欄位,請參閱配置參考兩個 listen 欄位取決於什麼在閘道前面:
  • public_url:在 Cloud Run 或 GKE Ingress 後面時為必需。閘道僅從此值建立 IdP redirect_uri 和其探索文件,絕不從 X-Forwarded-* 標頭建立。
  • trusted_proxies:前端的來源範圍。閘道僅在 TCP 對等在此清單中時才接受 X-Forwarded-For,然後在受信任的躍點之後遍歷鏈,因此每個 IP 登入速率限制和稽核事件會記錄開發人員 IP 而不是負載平衡器的 IP。
設定 trusted_proxies 以符合您的前端。gce 類別的外部 GKE Ingress 未列出:它配置公用轉送規則位址,/login 私人網路檢查會拒絕該位址。
前端trusted_proxies
直接到達的 Cloud Run,無負載平衡器[169.254.0.0/16]
Cloud Run 前面的內部應用程式負載平衡器169.254.0.0/16 加上您的僅限代理子網路的 CIDR
GKE 內部 Ingress,類別 gce-internal您的僅限代理子網路的 CIDR
下面的範例使用內部負載平衡器前面的 Cloud Run 值。
gateway.yaml
listen:
  host: 0.0.0.0
  port: 8080
  public_url: https://claude-gateway.internal.example.com
  trusted_proxies: [169.254.0.0/16, <your-proxy-only-subnet-cidr>]

oidc:
  issuer: https://accounts.google.com
  client_id: <your-oauth-client-id>
  client_secret: ${OIDC_CLIENT_SECRET}           # GKE: ${file:/secrets/oidc-client-secret}
  allowed_email_domains: [example.com]
  # Google ignores offline_access; these yield refresh tokens:
  scopes: [openid, profile, email]
  extra_auth_params: { access_type: offline, prompt: consent }

session:
  jwt_secret: ${GATEWAY_JWT_SECRET}              # GKE: ${file:/secrets/jwt-secret}

store:
  postgres_url: ${GATEWAY_POSTGRES_URL}          # GKE: ${file:/secrets/postgres-url}

upstreams:
  - provider: vertex
    region: <your-region>                        # must match $REGION
    project_id: <your-project>
    auth: {} # ADC via the runtime service account
Google id_tokens 不包含 groups 聲明。若要在 managed.policies 中使用基於群組的原則,並以 Google Workspace 作為 IdP,請配置 oidc.google_groups,它使用具有網域範圍委派的服務帳戶透過 Admin SDK Directory API 查詢每個使用者的群組。沒有它,改為符合 email_domain
6

在 Secret Manager 中儲存祕密

建立四個祕密並授予 roles/secretmanager.secretAccessorclaude-gateway 服務帳戶:
祕密來源
gateway-jwt-secretopenssl rand -base64 32
gateway-oidc-client-secretGoogle Cloud Console → OAuth 用戶端
gateway-postgres-urlCloud SQL 步驟中的 $GATEWAY_POSTGRES_URL
gateway-config前一步驟中的完整 gateway.yaml
祕密到達容器的方式因路徑而異:
  • 在 GKE 上,它們透過 Secret Manager CSI 驅動程式掛載為檔案,gateway.yaml 參考 ${file:/secrets/...}
  • 在 Cloud Run 上,它無法將多個祕密掛載到一個目錄中,gateway.yaml 掛載為檔案,其他三個注入為環境變數,因此 gateway.yaml 改為參考 ${GATEWAY_JWT_SECRET}${OIDC_CLIENT_SECRET}${GATEWAY_POSTGRES_URL}
7

部署

下面的命令在內部負載平衡器後面部署用於生產。
gcloud run deploy claude-gateway \
  --image="${REGION}-docker.pkg.dev/${PROJECT_ID}/claude-gateway/gateway:<version>" \
  --region="$REGION" \
  --service-account="claude-gateway@${PROJECT_ID}.iam.gserviceaccount.com" \
  --min-instances=1 \
  --timeout=3600 \
  --ingress=internal-and-cloud-load-balancing \
  --network="$VPC" --subnet=cc-gateway-subnet --vpc-egress=private-ranges-only \
  --set-secrets=/etc/claude/gateway.yaml=gateway-config:latest,GATEWAY_JWT_SECRET=gateway-jwt-secret:latest,OIDC_CLIENT_SECRET=gateway-oidc-client-secret:latest,GATEWAY_POSTGRES_URL=gateway-postgres-url:latest \
  --no-invoker-iam-check
直接 VPC 出口(透過 --network--subnet--vpc-egress=private-ranges-only)讓服務直接到達 Cloud SQL 私有 IP。對 Agent Platform 端點和 accounts.google.com 的公用出口直接進入網際網路,而不是透過 VPC,因此不需要 Cloud NAT。呼叫者 IAM 檢查必須開啟或停用。閘道執行自己的 OIDC,其用戶端不攜帶 GCP 令牌,因此 Cloud Run 的呼叫者檢查必須允許未驗證的請求。閘道的 OIDC 登入在請求到達容器後驗證請求,使用 allowed_email_domains 限制哪些網域可以登入。兩個旗標允許未驗證的請求:
  • --no-invoker-iam-check:停用檢查,無需管理 allUsers 繫結,並在網域受限共用下工作
  • --allow-unauthenticated:授予 allUsers run.invoker 角色;如果您的組織不允許 --no-invoker-iam-check,請使用它
透過 --ingress 的入口限制是與呼叫者檢查獨立的單獨層;保持設定以將服務限制在您的公司網路。預設情況下,Cloud Run *.run.app URL 解析為公用位址,/login 私人網路檢查會拒絕該位址。兩個拓撲為開發人員提供私人可解析的主機名稱,Cloud Run 都不為您配置:
  • 內部應用程式負載平衡器,上面部署命令假設的拓撲:使用 --ingress=internal-and-cloud-load-balancing 部署,在服務前面配置內部應用程式負載平衡器,具有內部 DNS 名稱和憑證,並將 listen.public_url 設定為該主機名稱。
  • 僅限內部入口,無負載平衡器:使用 --ingress=internal 部署,並將 listen.public_url 保留為 *.run.app URL,下面參考資產中的預設值。若要 *.run.app 私下解析,您的網路團隊必須已經為 Google API 操作 Private Service Connect 端點、解析 *.run.app 到它的 Cloud DNS 私人區域,以及到該端點的內部部署路由。
Google 的 Cloud Run 私人網路指南涵蓋兩個選項都需要的基礎設施。一旦閘道在私人主機名稱上提供服務,驗證登入;在此之前,從 Cloud Run 中的日誌確認容器已啟動。在第一次登入之前,將 OAuth 用戶端的授權重新導向 URI 更新為 <public_url>/oauth/callback。變更 public_url 後重新部署,因為閘道僅從該設定建立其公用來源,並忽略 X-Forwarded-HostX-Forwarded-Proto。僅當設定 listen.trusted_proxies 時,才接受 X-Forwarded-For 用於用戶端 IP。
8

將閘道 URL 推送到開發人員機器

閘道現在正在執行,但開發人員在透過 MDM 部署的受管設定檔中設定 forceLoginMethodforceLoginGatewayUrl 之前,無法從 /login 到達它。沒有閘道選項供開發人員在登入選擇器中手動選擇。

Terraform 參考

參考部署資產自動化本頁面上的 Cloud Run 路徑;配置和映像資產適用於兩個路徑:
  • setup.sh:一個冪等 gcloud 配置程式,遍歷完整的 Cloud Run 路徑,從啟用 API 到第一次部署
  • terraform/:相同的部署作為基礎設施即程式碼,用於綠地部署:針對性應用以建立 Artifact Registry 儲存庫,然後建立和推送映像,然後完整應用
  • gateway.yaml.example 和用於 distroless 執行時映像的 Dockerfile
工件預設 Cloud Run 入口為 internal,因此不需要負載平衡器。若要符合本頁面的生產後 ALB 部署,使用 INGRESS=internal-and-cloud-load-balancing 執行 setup.sh,或將 Terraform 變數 ingress 設定為 INGRESS_TRAFFIC_INTERNAL_LOAD_BALANCER。工件也預設呼叫者層為 allUsers run.invoker 授予,而不是 --no-invoker-iam-check,與本頁面逐步解說相反;兩者都有效,選擇取決於您的組織的原則限制。 資產作為工作範例提供,而非受支援的生產工件;檢查並根據您的環境調整它們。

疑難排解

如需閘道啟動和登入錯誤,請參閱平台無關的疑難排解表。下面的項目特定於 Google Cloud。
症狀原因修正
Cloud Run 在到達容器之前返回 403 Forbidden呼叫者 IAM 檢查仍然啟用使用 --no-invoker-iam-check 部署,或使用 --allow-unauthenticated 授予 allUsers run.invoker 角色
--no-invoker-iam-check 被拒絕,出現 invoker_iam_disabled is not currently availableconstraints/run.managed.requireInvokerIam 阻止使用 --allow-unauthenticated。如果透過 constraints/iam.allowedPolicyMemberDomains 的網域受限共用也阻止了它,請使用 GKE 路徑,它在網路層公開閘道,無需 allUsers 繫結。
部署時 Container manifest type … must support amd64/linux映像在非 amd64 主機上建立,或 buildx 發出了 OCI 映像索引使用 --platform=linux/amd64 --provenance=false 建立
閘道啟動在 Cloud Run 上以 Postgres 連線逾時錯誤退出服務未附加到 VPC,或 Cloud SQL 在該 VPC 上沒有私有 IP;儲存在 5 秒後停止等待使用 --network--subnet 部署以進行直接 VPC 出口,並使用 --no-assign-ip 和指向相同 VPC 的 --network 建立 Cloud SQL 執行個體
Agent Platform 請求返回 403 PERMISSION_DENIED執行時未使用 claude-gateway 服務帳戶,或模型未在 Model Garden 中為專案啟用在 Cloud Run 上設定 --service-account 或在 GKE 上繫結 Workload Identity,並在 Model Garden 中為目標區域啟用每個 Claude 模型
串流回應在固定持續時間後切斷前端請求超時:GKE Ingress 後面的負載平衡器後端服務預設為 30 秒,Cloud Run 預設為 300 秒在 GKE 上附加具有提高 timeoutSec 的 BackendConfig,或在 Cloud Run 上使用 --timeout=3600 部署

後續步驟