메인 콘텐츠로 건너뛰기
LLM gateway는 Claude Code와 모델 공급자 간의 중앙 집중식 프록시 계층을 제공하며, 종종 다음을 제공합니다:
  • 중앙 집중식 인증 - API 키 관리를 위한 단일 지점
  • 사용량 추적 - 팀 및 프로젝트 전체의 사용량 모니터링
  • 비용 제어 - 예산 및 속도 제한 구현
  • 감사 로깅 - 규정 준수를 위한 모든 모델 상호작용 추적
  • 모델 라우팅 - 코드 변경 없이 공급자 간 전환

Gateway 요구사항

LLM gateway가 Claude Code와 함께 작동하려면 다음 요구사항을 충족해야 합니다: API 형식 Gateway는 클라이언트에 다음 API 형식 중 최소 하나를 노출해야 합니다:
  1. Anthropic Messages: /v1/messages, /v1/messages/count_tokens
    • 요청 헤더를 전달해야 함: anthropic-beta, anthropic-version
  2. Bedrock InvokeModel: /invoke, /invoke-with-response-stream
    • 요청 본문 필드를 보존해야 함: anthropic_beta, anthropic_version
  3. Vertex rawPredict: :rawPredict, :streamRawPredict, /count-tokens:rawPredict
    • 요청 헤더를 전달해야 함: anthropic-beta, anthropic-version
헤더를 전달하지 않거나 본문 필드를 보존하지 않으면 기능이 감소하거나 Claude Code 기능을 사용할 수 없을 수 있습니다.
Claude Code는 API 형식을 기반으로 활성화할 기능을 결정합니다. Bedrock 또는 Vertex와 함께 Anthropic Messages 형식을 사용할 때 환경 변수 CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1을 설정해야 할 수 있습니다.

구성

모델 선택

기본적으로 Claude Code는 선택한 API 형식에 대해 표준 모델 이름을 사용합니다. Gateway에서 사용자 정의 모델 이름을 구성한 경우 모델 구성에 문서화된 환경 변수를 사용하여 사용자 정의 이름과 일치시킵니다.

LiteLLM 구성

LiteLLM은 제3자 프록시 서비스입니다. Anthropic은 LiteLLM의 보안 또는 기능을 보증, 유지 관리 또는 감사하지 않습니다. 이 가이드는 정보 제공 목적으로 제공되며 오래될 수 있습니다. 자신의 판단에 따라 사용하십시오.

필수 조건

  • 최신 버전으로 업데이트된 Claude Code
  • 배포되고 액세스 가능한 LiteLLM Proxy Server
  • 선택한 공급자를 통한 Claude 모델 액세스

기본 LiteLLM 설정

Claude Code 구성:

인증 방법

정적 API 키
고정 API 키를 사용한 가장 간단한 방법:
# 환경에서 설정
export ANTHROPIC_AUTH_TOKEN=sk-litellm-static-key

# 또는 Claude Code 설정에서
{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "sk-litellm-static-key"
  }
}
이 값은 Authorization 헤더로 전송됩니다.
헬퍼를 사용한 동적 API 키
회전하는 키 또는 사용자별 인증의 경우:
  1. API 키 헬퍼 스크립트를 만듭니다:
#!/bin/bash
# ~/bin/get-litellm-key.sh

# 예: 자격 증명 모음에서 키 가져오기
vault kv get -field=api_key secret/litellm/claude-code

# 예: JWT 토큰 생성
jwt encode \
  --secret="${JWT_SECRET}" \
  --exp="+1h" \
  '{"user":"'${USER}'","team":"engineering"}'
  1. 헬퍼를 사용하도록 Claude Code 설정을 구성합니다:
{
  "apiKeyHelper": "~/bin/get-litellm-key.sh"
}
  1. 토큰 새로고침 간격을 설정합니다:
# 1시간마다 새로고침 (3600000 ms)
export CLAUDE_CODE_API_KEY_HELPER_TTL_MS=3600000
이 값은 AuthorizationX-Api-Key 헤더로 전송됩니다. apiKeyHelperANTHROPIC_AUTH_TOKEN 또는 ANTHROPIC_API_KEY보다 우선순위가 낮습니다.

통합 엔드포인트 (권장)

LiteLLM의 Anthropic 형식 엔드포인트 사용:
export ANTHROPIC_BASE_URL=https://litellm-server:4000
통합 엔드포인트의 통과 엔드포인트 대비 이점:
  • 로드 밸런싱
  • 폴백
  • 비용 추적 및 최종 사용자 추적에 대한 일관된 지원

공급자별 통과 엔드포인트 (대안)

LiteLLM을 통한 Claude API
통과 엔드포인트 사용:
export ANTHROPIC_BASE_URL=https://litellm-server:4000/anthropic
LiteLLM을 통한 Amazon Bedrock
통과 엔드포인트 사용:
export ANTHROPIC_BEDROCK_BASE_URL=https://litellm-server:4000/bedrock
export CLAUDE_CODE_SKIP_BEDROCK_AUTH=1
export CLAUDE_CODE_USE_BEDROCK=1
LiteLLM을 통한 Google Vertex AI
통과 엔드포인트 사용:
export ANTHROPIC_VERTEX_BASE_URL=https://litellm-server:4000/vertex_ai/v1
export ANTHROPIC_VERTEX_PROJECT_ID=your-gcp-project-id
export CLAUDE_CODE_SKIP_VERTEX_AUTH=1
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=us-east5
더 자세한 정보는 LiteLLM 문서를 참조하십시오.

추가 리소스