메인 콘텐츠로 건너뛰기
Claude Code는 각 상호작용마다 토큰을 소비합니다. 평균 비용은 개발자당 하루에 6이며,906이며, 90%의 사용자는 일일 비용이 12 이하로 유지됩니다. 팀 사용의 경우, Claude Code는 API 토큰 소비량에 따라 요금을 청구합니다. 평균적으로 Claude Code는 Sonnet 4.5로 개발자당 월 약 $100-200의 비용이 들지만, 사용자가 실행 중인 인스턴스 수와 자동화에서 사용 중인지 여부에 따라 큰 편차가 있습니다.

비용 추적

/cost 명령 사용

/cost 명령은 Claude Max 및 Pro 구독자를 위한 것이 아닙니다.
/cost 명령은 현재 세션에 대한 상세한 토큰 사용 통계를 제공합니다:
Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

추가 추적 옵션

Claude Console에서 과거 사용량을 확인하고(관리자 또는 청구 역할 필요) Claude Code 워크스페이스에 대해 워크스페이스 지출 한도를 설정합니다(관리자 역할 필요).
Claude Code를 Claude Console 계정으로 처음 인증할 때, “Claude Code”라는 워크스페이스가 자동으로 생성됩니다. 이 워크스페이스는 조직의 모든 Claude Code 사용에 대한 중앙 집중식 비용 추적 및 관리를 제공합니다. 이 워크스페이스에 대해 API 키를 생성할 수 없습니다 - Claude Code 인증 및 사용 전용입니다.

팀을 위한 비용 관리

Claude API를 사용할 때, 전체 Claude Code 워크스페이스 지출을 제한할 수 있습니다. 구성하려면 이 지침을 따르세요. 관리자는 이 지침을 따라 비용 및 사용량 보고를 볼 수 있습니다. Bedrock 및 Vertex에서 Claude Code는 클라우드에서 메트릭을 전송하지 않습니다. 비용 메트릭을 얻기 위해 여러 대규모 엔터프라이즈는 LiteLLM을 사용한다고 보고했으며, 이는 회사가 키별 지출을 추적하도록 도와주는 오픈소스 도구입니다. 이 프로젝트는 Anthropic과 무관하며 보안을 감시하지 않았습니다.

속도 제한 권장사항

팀을 위해 Claude Code를 설정할 때, 조직 규모에 따른 사용자당 TPM(분당 토큰) 및 RPM(분당 요청) 권장사항을 고려하세요:
팀 규모사용자당 TPM사용자당 RPM
1-5 사용자200k-300k5-7
5-20 사용자100k-150k2.5-3.5
20-50 사용자50k-75k1.25-1.75
50-100 사용자25k-35k0.62-0.87
100-500 사용자15k-20k0.37-0.47
500+ 사용자10k-15k0.25-0.35
예를 들어, 200명의 사용자가 있는 경우, 각 사용자에 대해 20k TPM을 요청하거나 총 400만 TPM(200*20,000 = 400만)을 요청할 수 있습니다. 팀 규모가 커질수록 사용자당 TPM이 감소하는 이유는 더 큰 조직에서 더 적은 수의 사용자가 Claude Code를 동시에 사용할 것으로 예상되기 때문입니다. 이러한 속도 제한은 개별 사용자 수준이 아닌 조직 수준에서 적용되므로, 다른 사용자가 적극적으로 서비스를 사용하지 않을 때 개별 사용자는 일시적으로 계산된 할당량보다 더 많이 소비할 수 있습니다.
비정상적으로 높은 동시 사용(예: 대규모 그룹과의 라이브 교육 세션)이 예상되는 경우, 사용자당 더 높은 TPM 할당이 필요할 수 있습니다.

토큰 사용량 감소

  • 대화 압축:
    • Claude는 컨텍스트가 95% 용량을 초과할 때 기본적으로 자동 압축을 사용합니다
    • 자동 압축 토글: /config를 실행하고 “Auto-compact enabled”로 이동합니다
    • 컨텍스트가 커질 때 /compact를 수동으로 사용합니다
    • 사용자 정의 지침 추가: /compact Focus on code samples and API usage
    • CLAUDE.md에 추가하여 압축을 사용자 정의합니다:
      # Summary instructions
      
      When you are using compact, please focus on test output and code changes
      
  • 구체적인 쿼리 작성: 불필요한 스캔을 유발하는 모호한 요청을 피합니다
  • 복잡한 작업 분해: 큰 작업을 집중된 상호작용으로 분할합니다
  • 작업 간 기록 지우기: /clear를 사용하여 컨텍스트를 재설정합니다
비용은 다음을 기반으로 크게 달라질 수 있습니다:
  • 분석 중인 코드베이스의 크기
  • 쿼리의 복잡성
  • 검색 또는 수정 중인 파일 수
  • 대화 기록의 길이
  • 대화 압축 빈도

백그라운드 토큰 사용량

Claude Code는 유휴 상태에서도 일부 백그라운드 기능에 토큰을 사용합니다:
  • 대화 요약: claude --resume 기능을 위해 이전 대화를 요약하는 백그라운드 작업
  • 명령 처리: /cost와 같은 일부 명령은 상태를 확인하기 위해 요청을 생성할 수 있습니다
이러한 백그라운드 프로세스는 활성 상호작용 없이도 적은 양의 토큰(일반적으로 세션당 $0.04 미만)을 소비합니다.

버전 변경 및 업데이트 추적

현재 버전 정보

현재 Claude Code 버전 및 설치 세부 정보를 확인하려면:
claude doctor
이 명령은 버전, 설치 유형 및 시스템 정보를 표시합니다.

Claude Code 동작 변경 이해

Claude Code는 비용 보고를 포함한 기능 작동 방식을 변경할 수 있는 정기적인 업데이트를 받습니다:
  • 버전 추적: claude doctor를 사용하여 현재 버전을 확인합니다
  • 동작 변경: /cost와 같은 기능은 버전 간에 정보를 다르게 표시할 수 있습니다
  • 문서 접근: Claude는 항상 최신 문서에 접근할 수 있으므로 현재 기능 동작을 설명하는 데 도움이 될 수 있습니다

비용 보고가 변경될 때

비용이 표시되는 방식에 변화가 있음을 알 수 있는 경우(/cost 명령이 다른 정보를 표시하는 경우):
  1. 버전 확인: claude doctor를 실행하여 현재 버전을 확인합니다
  2. 문서 참조: Claude에게 현재 기능 동작에 대해 직접 문의하세요. 최신 문서에 접근할 수 있습니다
  3. 지원 연락: 특정 청구 질문의 경우, Console 계정을 통해 Anthropic 지원에 문의합니다
팀 배포의 경우, 더 광범위한 롤아웃 전에 사용 패턴을 확립하기 위해 작은 파일럿 그룹으로 시작하는 것을 권장합니다.