Documentation Index
Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
필수 요구사항
Vertex AI를 사용하여 Claude Code를 구성하기 전에 다음을 확인하십시오:- 청구가 활성화된 Google Cloud Platform(GCP) 계정
- Vertex AI API가 활성화된 GCP 프로젝트
- 원하는 Claude 모델에 대한 액세스(예: Claude Sonnet 4.6)
- Google Cloud SDK(
gcloud) 설치 및 구성 - 원하는 GCP 지역에 할당된 할당량
Vertex AI로 로그인
Google Cloud 자격증명이 있고 Vertex AI를 통해 Claude Code 사용을 시작하려면 로그인 마법사가 이를 안내합니다. GCP 측 필수 요구사항을 프로젝트당 한 번 완료하면 마법사가 Claude Code 측을 처리합니다.Vertex AI 설정 마법사는 Claude Code v2.1.98 이상이 필요합니다.
claude --version을 실행하여 확인하십시오.GCP 프로젝트에서 Claude 모델 활성화
프로젝트에 대해 Vertex AI API를 활성화한 다음 Vertex AI Model Garden에서 원하는 Claude 모델에 대한 액세스를 요청합니다. 계정에 필요한 권한은 IAM 구성을 참조하십시오.
Claude Code를 시작하고 Vertex AI 선택
claude를 실행합니다. 로그인 프롬프트에서 3rd-party platform을 선택한 다음 Google Vertex AI를 선택합니다.마법사 프롬프트 따르기
Google Cloud에 인증하는 방법을 선택합니다:
gcloud의 Application Default Credentials, 서비스 계정 키 파일 또는 환경에 이미 있는 자격증명. 마법사는 프로젝트와 지역을 감지하고, 프로젝트가 호출할 수 있는 Claude 모델을 확인하며, 이를 고정할 수 있게 합니다. 결과를 사용자 설정 파일의 env 블록에 저장하므로 환경 변수를 직접 내보낼 필요가 없습니다./setup-vertex를 실행하여 마법사를 다시 열고 자격증명, 프로젝트, 지역 또는 모델 고정을 변경할 수 있습니다.
지역 구성
Claude Code는 Vertex AI 전역, 다중 지역 및 지역 엔드포인트를 지원합니다.CLOUD_ML_REGION을 global, eu 또는 us와 같은 다중 지역 위치 또는 us-east5와 같은 특정 지역으로 설정합니다. Claude Code는 aiplatform.eu.rep.googleapis.com 및 aiplatform.us.rep.googleapis.com 호스트를 포함한 다중 지역 위치에 대해 각 형식에 맞는 올바른 Vertex AI 호스트명을 선택합니다.
수동 설정
마법사 대신 환경 변수를 통해 Vertex AI를 구성하려면(예: CI 또는 스크립트된 엔터프라이즈 롤아웃의 경우) 아래 단계를 따르십시오.1. Vertex AI API 활성화
GCP 프로젝트에서 Vertex AI API를 활성화합니다:2. 모델 액세스 요청
Vertex AI에서 Claude 모델에 대한 액세스를 요청합니다:- Vertex AI Model Garden으로 이동합니다
- “Claude” 모델을 검색합니다
- 원하는 Claude 모델에 대한 액세스를 요청합니다(예: Claude Sonnet 4.6)
- 승인을 기다립니다(24-48시간이 소요될 수 있습니다)
3. GCP 자격증명 구성
Claude Code는 표준 Google Cloud 인증을 사용합니다. 자세한 내용은 Google Cloud 인증 설명서를 참조하십시오. Claude Code v2.1.121 이상은 동일한 Application Default Credentials 체인을 통해 X.509 인증서 기반 Workload Identity Federation을 지원합니다.GOOGLE_APPLICATION_CREDENTIALS를 자격증명 구성 파일의 경로로 설정합니다.
Claude Code는 Vertex AI 요청에 대해
ANTHROPIC_VERTEX_PROJECT_ID를 프로젝트 ID로 사용합니다. GCLOUD_PROJECT 및 GOOGLE_CLOUD_PROJECT 환경 변수와 GOOGLE_APPLICATION_CREDENTIALS에서 참조하는 자격증명 파일이 이를 우선합니다. 이 중 어느 것도 설정되지 않으면 프로젝트 ID는 gcloud 구성 또는 연결된 서비스 계정에서 확인됩니다.고급 자격증명 구성
Claude Code는gcpAuthRefresh 설정을 통해 GCP에 대한 자동 자격증명 새로 고침을 지원합니다. Claude Code가 GCP 자격증명이 만료되었거나 로드할 수 없음을 감지하면 요청을 다시 시도하기 전에 구성된 명령을 실행하여 새 자격증명을 얻습니다.
.claude/settings.json과 같은 프로젝트 설정에서 gcpAuthRefresh를 설정하면 워크스페이스 신뢰 프롬프트를 수락한 후에만 명령이 실행됩니다.
4. Claude Code 구성
다음 환경 변수를 설정합니다:VERTEX_REGION_CLAUDE_* 변수가 있습니다. 전체 목록은 환경 변수 참조를 참조하십시오. Vertex Model Garden에서 어떤 모델이 전역 엔드포인트를 지원하는지 또는 지역 전용인지 확인하십시오.
Prompt caching은 자동으로 활성화됩니다. 이를 비활성화하려면 DISABLE_PROMPT_CACHING=1을 설정하십시오. 기본 5분 대신 1시간 캐시 TTL을 요청하려면 ENABLE_PROMPT_CACHING_1H=1을 설정하십시오. 1시간 TTL을 사용한 캐시 쓰기는 더 높은 요금으로 청구됩니다. 높은 속도 제한을 위해 Google Cloud 지원팀에 문의하십시오. Vertex AI를 사용할 때 /login 및 /logout 명령은 Google Cloud 자격증명을 통해 인증이 처리되므로 비활성화됩니다.
Claude Code는 MCP tool search를 Vertex AI에서 기본적으로 비활성화합니다. 따라서 모든 MCP 도구 정의는 미리 로드됩니다. Vertex AI는 Claude Sonnet 4.5 이상 및 Claude Opus 4.5 이상에 대해 도구 검색을 지원합니다. 이러한 모델에서 도구 검색을 활성화하려면 ENABLE_TOOL_SEARCH=true를 설정하십시오. Vertex AI의 이전 모델은 필요한 베타 헤더를 허용하지 않으며, 이러한 모델에서 도구 검색을 활성화하면 요청이 실패합니다.
5. 모델 버전 고정
이러한 환경 변수를 특정 Vertex AI 모델 ID로 설정합니다.ANTHROPIC_DEFAULT_OPUS_MODEL이 없으면 Vertex의 opus 별칭이 Opus 4.6으로 확인됩니다. 최신 모델을 사용하려면 Opus 4.7 ID로 설정합니다:
| 모델 유형 | 기본값 |
|---|---|
| 주 모델 | claude-sonnet-4-5@20250929 |
| 소형/빠른 모델 | 주 모델과 동일 |
ANTHROPIC_DEFAULT_HAIKU_MODEL을 프로젝트에서 사용 가능한 모델 ID로 설정합니다.
모델을 추가로 사용자 정의하려면:
시작 모델 확인
Claude Code가 Vertex AI로 구성되어 시작할 때 사용하려는 모델이 프로젝트에서 액세스 가능한지 확인합니다. 이 확인에는 Claude Code v2.1.98 이상이 필요합니다. 현재 Claude Code 기본값보다 오래된 모델 버전을 고정했고 프로젝트가 최신 버전을 호출할 수 있으면 Claude Code는 고정을 업데이트하라는 메시지를 표시합니다. 수락하면 새 모델 ID를 사용자 설정 파일에 쓰고 Claude Code를 다시 시작합니다. 거절하면 다음 기본 버전 변경까지 기억됩니다. 모델을 고정하지 않았고 현재 기본값을 프로젝트에서 사용할 수 없으면 Claude Code는 현재 세션에 대해 이전 버전으로 폴백하고 알림을 표시합니다. 폴백은 유지되지 않습니다. Model Garden에서 최신 모델을 활성화하거나 버전을 고정하여 선택을 영구적으로 만듭니다.IAM 구성
필요한 IAM 권한을 할당합니다:roles/aiplatform.user 역할에는 필요한 권한이 포함됩니다:
aiplatform.endpoints.predict- 모델 호출 및 토큰 계산에 필요
비용 추적 및 액세스 제어를 단순화하기 위해 Claude Code용 전용 GCP 프로젝트를 만듭니다.
1M 토큰 context window
Claude Opus 4.7, Opus 4.6 및 Sonnet 4.6은 Vertex AI에서 1M 토큰 context window를 지원합니다. Claude Code는 1M 모델 변형을 선택할 때 확장된 context window를 자동으로 활성화합니다. 설정 마법사는 모델을 고정할 때 1M context 옵션을 제공합니다. 수동으로 고정된 모델에 대해 대신 활성화하려면 모델 ID에[1m]을 추가합니다. 자세한 내용은 타사 배포를 위한 모델 고정을 참조하십시오.
문제 해결
“기본 자격증명을 로드할 수 없음” 오류가 발생하는 경우:gcloud auth application-default login을 실행하여 Application Default Credentials를 설정합니다GOOGLE_APPLICATION_CREDENTIALS를 서비스 계정 키 파일 경로로 설정합니다- 모든 옵션은 GCP 자격증명 구성을 참조하세요
- Cloud Console을 통해 현재 할당량을 확인하거나 할당량 증가를 요청합니다
- Model Garden에서 모델이 활성화되어 있는지 확인합니다
- 지정된 위치에서 모델을 사용할 수 있는지 확인합니다. 일부 모델은 특정 지역이 아닌
global또는eu및us와 같은 다중 지역 위치에서만 제공됩니다 CLOUD_ML_REGION=global을 사용하는 경우 Model Garden의 “지원되는 기능” 아래에서 모델이 전역 엔드포인트를 지원하는지 확인합니다. 전역 엔드포인트를 지원하지 않는 모델의 경우:ANTHROPIC_MODEL또는ANTHROPIC_DEFAULT_HAIKU_MODEL을 통해 지원되는 모델을 지정하거나,VERTEX_REGION_<MODEL_NAME>환경 변수를 사용하여 지역 또는 다중 지역 위치를 설정합니다
- 지역 엔드포인트의 경우 주 모델과 소형/빠른 모델이 선택한 지역에서 지원되는지 확인합니다
CLOUD_ML_REGION=global로 전환하여 더 나은 가용성을 고려합니다