메인 콘텐츠로 건너뛰기
빠른 모드는 연구 미리보기 상태입니다. 피드백에 따라 기능, 가격 책정 및 가용성이 변경될 수 있습니다.
빠른 모드는 Claude Opus 4.6을 위한 고속 구성으로, 토큰당 더 높은 비용으로 모델을 2.5배 빠르게 만듭니다. 빠른 반복이나 라이브 디버깅과 같은 대화형 작업에서 속도가 필요할 때 /fast로 켜고, 비용이 지연 시간보다 중요할 때 끕니다. 빠른 모드는 다른 모델이 아닙니다. 비용 효율성보다 속도를 우선시하는 다른 API 구성을 사용하는 동일한 Opus 4.6을 사용합니다. 동일한 품질과 기능을 얻으며, 응답만 더 빠릅니다.
빠른 모드는 Claude Code v2.1.36 이상이 필요합니다. claude --version으로 버전을 확인합니다.
알아야 할 사항:
  • Claude Code CLI에서 /fast를 사용하여 빠른 모드를 전환합니다. Claude Code VS Code 확장 프로그램에서도 /fast를 통해 사용할 수 있습니다.
  • Opus 4.6의 빠른 모드 가격은 $30/150 MTok부터 시작합니다. 빠른 모드는 2월 16일 태평양 표준시 오후 11:59까지 모든 요금제에 대해 50% 할인으로 제공됩니다.
  • 구독 요금제(Pro/Max/Team/Enterprise)의 모든 Claude Code 사용자 및 Claude Console에서 사용할 수 있습니다.
  • 구독 요금제(Pro/Max/Team/Enterprise)의 Claude Code 사용자의 경우, 빠른 모드는 추가 사용을 통해서만 사용 가능하며 구독 요금제 사용량 제한에 포함되지 않습니다.
이 페이지에서는 빠른 모드 전환, 비용 트레이드오프, 빠른 모드 사용 시기, 요구사항, 세션별 옵트인속도 제한 처리에 대해 설명합니다.

빠른 모드 전환

다음 중 한 가지 방법으로 빠른 모드를 전환합니다:
  • /fast를 입력하고 Tab을 눌러 켜거나 끕니다
  • 사용자 설정 파일에서 "fastMode": true를 설정합니다
기본적으로 빠른 모드는 세션 간에 유지됩니다. 관리자는 빠른 모드를 각 세션마다 재설정하도록 구성할 수 있습니다. 자세한 내용은 세션별 옵트인 필요를 참조합니다. 최상의 비용 효율성을 위해 대화 중간에 전환하기보다는 세션 시작 시 빠른 모드를 활성화합니다. 자세한 내용은 비용 트레이드오프 이해를 참조합니다. 빠른 모드를 활성화하면:
  • 다른 모델을 사용 중인 경우 Claude Code가 자동으로 Opus 4.6으로 전환됩니다
  • 확인 메시지가 표시됩니다: “Fast mode ON”
  • 빠른 모드가 활성화된 동안 프롬프트 옆에 작은 아이콘이 나타납니다
  • 언제든지 /fast를 다시 실행하여 빠른 모드가 켜져 있는지 꺼져 있는지 확인합니다
/fast를 다시 실행하여 빠른 모드를 비활성화하면 Opus 4.6에 유지됩니다. 모델이 이전 모델로 되돌아가지 않습니다. 다른 모델로 전환하려면 /model을 사용합니다.

비용 트레이드오프 이해

빠른 모드는 표준 Opus 4.6보다 토큰당 가격이 높습니다:
모드입력 (MTok)출력 (MTok)
Opus 4.6의 빠른 모드 (<200K)$30$150
Opus 4.6의 빠른 모드 (>200K)$60$225
빠른 모드는 1M 토큰 확장 컨텍스트 윈도우와 호환됩니다. 대화 중간에 빠른 모드로 전환하면 전체 대화 컨텍스트에 대해 전체 빠른 모드 캐시되지 않은 입력 토큰 가격을 지불합니다. 이는 처음부터 빠른 모드를 활성화했을 경우보다 더 많은 비용이 듭니다.

빠른 모드 사용 시기 결정

빠른 모드는 응답 지연 시간이 비용보다 중요한 대화형 작업에 가장 적합합니다:
  • 코드 변경에 대한 빠른 반복
  • 라이브 디버깅 세션
  • 긴급 마감이 있는 시간에 민감한 작업
표준 모드는 다음에 더 적합합니다:
  • 속도가 덜 중요한 장기 자동 작업
  • 배치 처리 또는 CI/CD 파이프라인
  • 비용에 민감한 워크로드

빠른 모드 대 노력 수준

빠른 모드와 노력 수준 모두 응답 속도에 영향을 미치지만 방식이 다릅니다:
설정효과
빠른 모드동일한 모델 품질, 낮은 지연 시간, 높은 비용
낮은 노력 수준더 적은 생각 시간, 더 빠른 응답, 복잡한 작업에서 잠재적으로 낮은 품질
둘 다 결합할 수 있습니다: 간단한 작업에서 최대 속도를 위해 낮은 노력 수준과 함께 빠른 모드를 사용합니다.

요구사항

빠른 모드는 다음 모두를 필요로 합니다:
  • 타사 클라우드 제공자에서 사용 불가: 빠른 모드는 Amazon Bedrock, Google Vertex AI 또는 Microsoft Azure Foundry에서 사용할 수 없습니다. 빠른 모드는 Anthropic Console API 및 추가 사용을 사용하는 Claude 구독 요금제를 통해 사용할 수 있습니다.
  • 추가 사용 활성화: 계정에 추가 사용이 활성화되어 있어야 하며, 이를 통해 요금제의 포함된 사용량을 초과하여 청구할 수 있습니다. 개인 계정의 경우 Console 청구 설정에서 활성화합니다. Teams 및 Enterprise의 경우 관리자가 조직에 대해 추가 사용을 활성화해야 합니다.
빠른 모드 사용량은 요금제에 남은 사용량이 있더라도 추가 사용으로 직접 청구됩니다. 이는 빠른 모드 토큰이 요금제의 포함된 사용량에 포함되지 않으며 첫 번째 토큰부터 빠른 모드 요금으로 청구됨을 의미합니다.
  • Teams 및 Enterprise의 관리자 활성화: 빠른 모드는 Teams 및 Enterprise 조직에 대해 기본적으로 비활성화됩니다. 사용자가 액세스할 수 있으려면 관리자가 명시적으로 빠른 모드를 활성화해야 합니다.
관리자가 조직에 대해 빠른 모드를 활성화하지 않은 경우 /fast 명령은 “Fast mode has been disabled by your organization.”을 표시합니다.

조직에 대해 빠른 모드 활성화

관리자는 다음에서 빠른 모드를 활성화할 수 있습니다: 빠른 모드를 완전히 비활성화하는 또 다른 옵션은 CLAUDE_CODE_DISABLE_FAST_MODE=1을 설정하는 것입니다. 환경 변수를 참조합니다.

세션별 옵트인 필요

기본적으로 빠른 모드는 세션 간에 유지됩니다: 사용자가 빠른 모드를 활성화하면 향후 세션에서도 켜져 있습니다. Teams 또는 Enterprise 요금제의 관리자는 관리되는 설정 또는 서버 관리 설정에서 fastModePerSessionOptIntrue로 설정하여 이를 방지할 수 있습니다. 이로 인해 각 세션이 빠른 모드가 꺼진 상태로 시작되며, 사용자가 /fast로 명시적으로 활성화해야 합니다.
{
  "fastModePerSessionOptIn": true
}
이는 사용자가 여러 동시 세션을 실행하는 조직에서 비용을 제어하는 데 유용합니다. 사용자는 속도가 필요할 때 /fast로 빠른 모드를 활성화할 수 있지만 각 새 세션의 시작 시 재설정됩니다. 사용자의 빠른 모드 기본 설정은 여전히 저장되므로 이 설정을 제거하면 기본 지속 동작이 복원됩니다.

속도 제한 처리

빠른 모드는 표준 Opus 4.6과 별도의 속도 제한을 가집니다. 빠른 모드 속도 제한에 도달하거나 추가 사용 크레딧이 부족할 때:
  1. 빠른 모드가 자동으로 표준 Opus 4.6으로 폴백됩니다
  2. 아이콘이 회색으로 변하여 쿨다운을 나타냅니다
  3. 표준 속도 및 가격으로 계속 작업합니다
  4. 쿨다운이 만료되면 빠른 모드가 자동으로 다시 활성화됩니다
쿨다운을 기다리지 않고 빠른 모드를 수동으로 비활성화하려면 /fast를 다시 실행합니다.

연구 미리보기

빠른 모드는 연구 미리보기 기능입니다. 이는 다음을 의미합니다:
  • 기능은 피드백에 따라 변경될 수 있습니다
  • 가용성 및 가격 책정은 변경될 수 있습니다
  • 기본 API 구성이 진화할 수 있습니다
일반적인 Anthropic 지원 채널을 통해 문제 또는 피드백을 보고합니다.

참고 항목