Documentation Index
Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
前置条件
在使用 Vertex AI 配置 Claude Code 之前,请确保您拥有:- 启用了计费的 Google Cloud Platform (GCP) 账户
- 启用了 Vertex AI API 的 GCP 项目
- 对所需 Claude 模型的访问权限(例如,Claude Sonnet 4.6)
- 已安装并配置的 Google Cloud SDK (
gcloud) - 在所需 GCP 区域中分配的配额
使用 Vertex AI 登录
如果您拥有 Google Cloud 凭证并想开始通过 Vertex AI 使用 Claude Code,登录向导会引导您完成整个过程。您需要在每个项目中完成一次 GCP 端的前置条件;向导会处理 Claude Code 端的事务。Vertex AI 设置向导需要 Claude Code v2.1.98 或更高版本。运行
claude --version 来检查。在您的 GCP 项目中启用 Claude 模型
为您的项目启用 Vertex AI API,然后在 Vertex AI Model Garden 中请求访问您想要的 Claude 模型。有关您的账户需要的权限,请参阅 IAM 配置。
按照向导提示进行操作
选择您如何向 Google Cloud 进行身份验证:来自
gcloud 的应用默认凭证、服务账户密钥文件或已在您的环境中的凭证。向导会检测您的项目和区域,验证您的项目可以调用哪些 Claude 模型,并让您固定它们。它将结果保存到您的用户设置文件的 env 块中,因此您无需自己导出环境变量。/setup-vertex 来重新打开向导并更改您的凭证、项目、区域或模型固定。
区域配置
Claude Code 支持 Vertex AI 全局、多区域和区域端点。将CLOUD_ML_REGION 设置为 global、多区域位置(如 eu 或 us)或特定区域(如 us-east5)。Claude Code 为每种形式选择正确的 Vertex AI 主机名,包括多区域位置的 aiplatform.eu.rep.googleapis.com 和 aiplatform.us.rep.googleapis.com 主机。
手动设置
要通过环境变量而不是向导配置 Vertex AI,例如在 CI 或脚本化企业推出中,请按照下面的步骤进行。1. 启用 Vertex AI API
在您的 GCP 项目中启用 Vertex AI API:2. 请求模型访问权限
请求访问 Vertex AI 中的 Claude 模型:- 导航到 Vertex AI Model Garden
- 搜索”Claude”模型
- 请求访问所需的 Claude 模型(例如,Claude Sonnet 4.6)
- 等待批准(可能需要 24-48 小时)
3. 配置 GCP 凭证
Claude Code 使用标准的 Google Cloud 身份验证。 有关更多信息,请参阅 Google Cloud 身份验证文档。 Claude Code v2.1.121 或更高版本通过相同的应用默认凭证链支持基于 X.509 证书的工作负载身份联合。将GOOGLE_APPLICATION_CREDENTIALS 设置为您的凭证配置文件的路径。
Claude Code 使用
ANTHROPIC_VERTEX_PROJECT_ID 作为 Vertex AI 请求的项目 ID。GCLOUD_PROJECT 和 GOOGLE_CLOUD_PROJECT 环境变量以及 GOOGLE_APPLICATION_CREDENTIALS 引用的凭证文件优先于它。如果这些都未设置,项目 ID 将从您的 gcloud 配置或附加的服务账户解析。高级凭证配置
Claude Code 通过gcpAuthRefresh 设置支持 GCP 的自动凭证刷新。当 Claude Code 检测到您的 GCP 凭证已过期或无法加载时,它会运行配置的命令以在重试请求之前获取新凭证。
.claude/settings.json)中设置 gcpAuthRefresh,该命令仅在您接受工作区信任提示后运行。
4. 配置 Claude Code
设置以下环境变量:VERTEX_REGION_CLAUDE_* 变量。有关完整列表,请参阅环境变量参考。检查 Vertex Model Garden 以确定哪些模型支持全局端点与仅区域端点。
Prompt caching 会自动启用。要禁用它,请设置 DISABLE_PROMPT_CACHING=1。要请求 1 小时的缓存 TTL 而不是 5 分钟的默认值,请设置 ENABLE_PROMPT_CACHING_1H=1;具有 1 小时 TTL 的缓存写入按更高费率计费。如需提高速率限制,请联系 Google Cloud 支持。使用 Vertex AI 时,/login 和 /logout 命令被禁用,因为身份验证通过 Google Cloud 凭证处理。
Claude Code 在 Vertex AI 上默认禁用 MCP tool search,因此 MCP 工具定义会预先加载。Vertex AI 支持 Claude Sonnet 4.5 及更高版本以及 Claude Opus 4.5 及更高版本的工具搜索。设置 ENABLE_TOOL_SEARCH=true 以在这些模型上启用它。Vertex AI 上的早期模型不接受所需的 beta 标头,如果您对它们启用工具搜索,请求将失败。
5. 固定模型版本
将这些环境变量设置为特定的 Vertex AI 模型 ID。 如果没有ANTHROPIC_DEFAULT_OPUS_MODEL,Vertex 上的 opus 别名会解析为 Opus 4.6。将其设置为 Opus 4.7 ID 以使用最新模型:
| 模型类型 | 默认值 |
|---|---|
| 主模型 | claude-sonnet-4-5@20250929 |
| 小型/快速模型 | 与主模型相同 |
ANTHROPIC_DEFAULT_HAIKU_MODEL 设置为在您的项目中可用的模型 ID。
要进一步自定义模型:
启动模型检查
当 Claude Code 启动并配置了 Vertex AI 时,它会验证它打算使用的模型在您的项目中是否可访问。此检查需要 Claude Code v2.1.98 或更高版本。 如果您固定了一个比当前 Claude Code 默认值更旧的模型版本,并且您的项目可以调用较新版本,Claude Code 会提示您更新固定。接受会将新的模型 ID 写入您的用户设置文件并重启 Claude Code。拒绝会被记住,直到下一个默认版本更改。 如果您没有固定模型,并且当前默认值在您的项目中不可用,Claude Code 会在当前会话中回退到之前的版本并显示通知。回退不会被持久化。在 Model Garden 中启用较新的模型或固定一个版本以使选择永久化。IAM 配置
分配所需的 IAM 权限:roles/aiplatform.user 角色包括所需的权限:
aiplatform.endpoints.predict- 模型调用和令牌计数所需
为 Claude Code 创建专用的 GCP 项目,以简化成本跟踪和访问控制。
1M token context window
Claude Opus 4.7、Opus 4.6 和 Sonnet 4.6 在 Vertex AI 上支持 1M token context window。当您选择 1M 模型变体时,Claude Code 会自动启用扩展 context window。 设置向导在固定模型时提供 1M context 选项。要为手动固定的模型启用它,请在模型 ID 后附加[1m]。有关详细信息,请参阅为第三方部署固定模型。
故障排除
如果您遇到”无法加载默认凭证”错误:- 运行
gcloud auth application-default login来设置应用默认凭证 - 将
GOOGLE_APPLICATION_CREDENTIALS设置为服务账户密钥文件路径 - 查看 配置 GCP 凭证 了解所有选项
- 通过 Cloud Console 检查当前配额或请求增加配额
- 确认模型在 Model Garden 中已启用
- 验证该模型在您指定的位置可用。某些模型仅在
global或多区域位置(如eu和us)上提供,而不是在特定区域 - 如果使用
CLOUD_ML_REGION=global,请检查您的模型是否在 Model Garden 中的”支持的功能”下支持全局端点。对于不支持全局端点的模型,请执行以下任一操作:- 通过
ANTHROPIC_MODEL或ANTHROPIC_DEFAULT_HAIKU_MODEL指定支持的模型,或 - 使用
VERTEX_REGION_<MODEL_NAME>环境变量设置区域或多区域位置
- 通过
- 对于区域端点,请确保主模型和小型/快速模型在您选择的区域中受支持
- 考虑切换到
CLOUD_ML_REGION=global以获得更好的可用性