필수 요구사항
Vertex AI를 사용하여 Claude Code를 구성하기 전에 다음을 확인하십시오:- 청구가 활성화된 Google Cloud Platform(GCP) 계정
- Vertex AI API가 활성화된 GCP 프로젝트
- 원하는 Claude 모델에 대한 액세스(예: Claude Sonnet 4.6)
- Google Cloud SDK(
gcloud) 설치 및 구성 - 원하는 GCP 지역에 할당된 할당량
Claude Code를 여러 사용자에게 배포하는 경우, Anthropic이 새 모델을 출시할 때 중단을 방지하기 위해 모델 버전을 고정하십시오.
지역 구성
Claude Code는 Vertex AI 전역 및 지역 엔드포인트 모두에서 사용할 수 있습니다.설정
1. Vertex AI API 활성화
GCP 프로젝트에서 Vertex AI API를 활성화합니다:2. 모델 액세스 요청
Vertex AI에서 Claude 모델에 대한 액세스를 요청합니다:- Vertex AI Model Garden으로 이동합니다
- “Claude” 모델을 검색합니다
- 원하는 Claude 모델에 대한 액세스를 요청합니다(예: Claude Sonnet 4.6)
- 승인을 기다립니다(24-48시간이 소요될 수 있습니다)
3. GCP 자격증명 구성
Claude Code는 표준 Google Cloud 인증을 사용합니다. 자세한 내용은 Google Cloud 인증 설명서를 참조하십시오.인증할 때 Claude Code는
ANTHROPIC_VERTEX_PROJECT_ID 환경 변수에서 프로젝트 ID를 자동으로 사용합니다. 이를 재정의하려면 다음 환경 변수 중 하나를 설정하십시오: GCLOUD_PROJECT, GOOGLE_CLOUD_PROJECT 또는 GOOGLE_APPLICATION_CREDENTIALS.4. Claude Code 구성
다음 환경 변수를 설정합니다:cache_control ephemeral 플래그를 지정할 때 자동으로 지원됩니다. 이를 비활성화하려면 DISABLE_PROMPT_CACHING=1을 설정하십시오. 높은 속도 제한을 위해 Google Cloud 지원팀에 문의하십시오. Vertex AI를 사용할 때 /login 및 /logout 명령은 Google Cloud 자격증명을 통해 인증이 처리되므로 비활성화됩니다.
5. 모델 버전 고정
이러한 환경 변수를 특정 Vertex AI 모델 ID로 설정합니다:| 모델 유형 | 기본값 |
|---|---|
| 주 모델 | claude-sonnet-4-6 |
| 소형/빠른 모델 | claude-haiku-4-5@20251001 |
IAM 구성
필요한 IAM 권한을 할당합니다:roles/aiplatform.user 역할에는 필요한 권한이 포함됩니다:
aiplatform.endpoints.predict- 모델 호출 및 토큰 계산에 필요
비용 추적 및 액세스 제어를 단순화하기 위해 Claude Code용 전용 GCP 프로젝트를 만듭니다.
1M 토큰 context window
Claude Opus 4.6, Sonnet 4.6, Sonnet 4.5 및 Sonnet 4는 Vertex AI에서 1M 토큰 context window를 지원합니다. Claude Code는 1M 모델 변형을 선택할 때 확장된 context window를 자동으로 활성화합니다. 고정된 모델에 대해 1M context window를 활성화하려면 모델 ID에[1m]을 추가합니다. 자세한 내용은 타사 배포를 위한 모델 고정을 참조하십시오.
문제 해결
할당량 문제가 발생하는 경우:- Cloud Console을 통해 현재 할당량을 확인하거나 할당량 증가를 요청합니다
- Model Garden에서 모델이 활성화되어 있는지 확인합니다
- 지정된 지역에 액세스할 수 있는지 확인합니다
CLOUD_ML_REGION=global을 사용하는 경우 Model Garden의 “지원되는 기능” 아래에서 모델이 전역 엔드포인트를 지원하는지 확인합니다. 전역 엔드포인트를 지원하지 않는 모델의 경우:ANTHROPIC_MODEL또는ANTHROPIC_SMALL_FAST_MODEL을 통해 지원되는 모델을 지정하거나,VERTEX_REGION_<MODEL_NAME>환경 변수를 사용하여 지역 엔드포인트를 설정합니다
- 지역 엔드포인트의 경우 주 모델과 소형/빠른 모델이 선택한 지역에서 지원되는지 확인합니다
CLOUD_ML_REGION=global로 전환하여 더 나은 가용성을 고려합니다