메인 콘텐츠로 건너뛰기

Documentation Index

Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt

Use this file to discover all available pages before exploring further.

Claude Code CLI에서 입력하는 대신 프롬프트를 말씀하세요. 음성이 프롬프트 입력으로 실시간 전사되므로 같은 메시지에서 음성과 입력을 혼합할 수 있습니다. /voice로 받아쓰기를 활성화한 다음, 말하는 동안 키를 누르고 있거나 한 번 탭하여 시작하고 다시 탭하여 전송합니다.
음성 받아쓰기에는 Claude Code v2.1.69 이상이 필요합니다. 탭 모드에는 v2.1.116 이상이 필요합니다. claude --version으로 버전을 확인하세요.

요구 사항

음성 받아쓰기는 기록된 오디오를 Anthropic의 서버로 스트리밍하여 전사합니다. 오디오는 로컬에서 처리되지 않습니다. 음성 텍스트 변환 서비스는 Claude.ai 계정으로 인증할 때만 사용 가능하며, Claude Code가 Anthropic API 키, Amazon Bedrock, Google Vertex AI 또는 Microsoft Foundry를 직접 사용하도록 구성된 경우에는 사용할 수 없습니다. 전사는 Claude 메시지나 토큰을 소비하지 않으며 /usage에 표시된 한도에 포함되지 않습니다. Anthropic이 데이터를 처리하는 방법은 데이터 사용을 참조하세요. 음성 받아쓰기는 또한 로컬 마이크 접근이 필요하므로 웹의 Claude Code 또는 SSH 세션과 같은 원격 환경에서는 작동하지 않습니다. WSL에서 음성 받아쓰기는 오디오 접근을 위해 WSLg가 필요하며, 이는 Windows 10 또는 11의 Microsoft Store에서 설치된 WSL2에 포함되어 있습니다. WSLg를 사용할 수 없는 경우(예: WSL1), 대신 기본 Windows에서 Claude Code를 실행하세요. 오디오 녹음은 macOS, Linux 및 Windows의 기본 제공 네이티브 모듈을 사용합니다. Linux에서 네이티브 모듈을 로드할 수 없으면 Claude Code는 ALSA utils의 arecord 또는 SoX의 rec으로 폴백합니다. 둘 다 사용할 수 없으면 /voice는 패키지 관리자에 대한 설치 명령을 출력합니다. Claude Code VS Code 확장도 동일한 Claude.ai 계정 요구 사항으로 음성 받아쓰기를 지원합니다. SSH, Dev Containers 및 Codespaces를 포함한 VS Code Remote 세션에서는 사용할 수 없습니다. 마이크가 로컬 머신에 있고 확장이 원격 호스트에서 실행되기 때문입니다.

음성 받아쓰기 활성화

/voice를 실행하여 받아쓰기를 활성화합니다. 처음 활성화할 때 Claude Code는 마이크 확인을 실행합니다. macOS에서는 터미널에 대한 시스템 마이크 권한 프롬프트를 트리거합니다(이전에 부여되지 않은 경우).
/voice
Voice mode enabled (hold). Hold Space to record. Dictation language: en (/config to change).
/voice는 선택적 모드 인수를 허용합니다:
명령효과
/voice켜거나 끄기, 현재 모드 유지
/voice hold누르고 있기 모드에서 활성화
/voice tap탭 모드에서 활성화
/voice off비활성화
음성 받아쓰기는 세션 간에 유지됩니다. /voice를 실행하는 대신 사용자 설정 파일에서 직접 설정하세요:
{
  "voice": {
    "enabled": true,
    "mode": "tap"
  }
}
음성 받아쓰기가 활성화되어 있는 동안 입력 바닥글은 프롬프트가 비어 있을 때 hold Space to speak 힌트를 표시합니다. 힌트는 현재 voice:pushToTalk 바인딩을 반영하며, 받아쓰기 키를 다시 바인딩하면 업데이트됩니다. 힌트 텍스트는 두 모드 모두에서 동일하며, 사용자 정의 상태 줄이 구성된 경우 나타나지 않습니다. 전사는 두 모드 모두에서 코딩 어휘에 맞게 조정됩니다. regex, OAuth, JSONlocalhost와 같은 일반적인 개발 용어가 올바르게 인식되며, 현재 프로젝트 이름과 git 분기 이름이 자동으로 인식 힌트로 추가됩니다.

누르고 있기로 녹음

누르고 있기 모드는 푸시 투 토크입니다: 키를 누르고 있는 동안 녹음이 실행되고 놓으면 중지됩니다. 이것이 기본 모드입니다. Space를 누르고 있어서 녹음을 시작합니다. Claude Code는 터미널에서 빠른 키 반복 이벤트를 감시하여 누르고 있는 키를 감지하므로 녹음이 시작되기 전에 짧은 워밍업이 있습니다. 바닥글은 워밍업 중에 keep holding…을 표시한 다음 녹음이 활성화되면 실시간 파형으로 전환됩니다. 처음 몇 개의 키 반복 문자는 워밍업 중에 입력으로 입력되며 녹음이 활성화될 때 자동으로 제거됩니다. 단일 Space 탭은 여전히 공백을 입력합니다. 누르고 있기 감지는 빠른 반복에서만 트리거되기 때문입니다.
워밍업을 건너뛰려면 /voice tap으로 탭 모드로 전환하거나 받아쓰기 키를 다시 바인딩하여 meta+k와 같은 수정자 조합을 사용하세요. 수정자 조합은 첫 번째 키 누름에서 녹음을 시작합니다.
음성이 프롬프트에 말하는 동안 나타나며, 전사가 완료될 때까지 흐려집니다. Space를 놓아서 녹음을 중지하고 텍스트를 완료합니다. 전사는 커서 위치에 삽입되고 커서는 삽입된 텍스트의 끝에 유지되므로 입력과 받아쓰기를 어떤 순서로든 혼합할 수 있습니다. Space를 다시 누르고 있어서 다른 녹음을 추가하거나 먼저 커서를 이동하여 프롬프트의 다른 곳에 음성을 삽입하세요:
> refactor the auth middleware to ▮
  # hold Space, speak "use the new token validation helper"
> refactor the auth middleware to use the new token validation helper▮
기본적으로 키를 놓으면 전사를 삽입하고 Enter를 누를 때까지 기다립니다. voice 설정 객체에서 "autoSubmit": true를 설정하여 전사가 최소 3단어 이상이면 키를 놓을 때 프롬프트를 자동으로 전송합니다.

탭하여 녹음 및 전송

탭 모드는 단일 키 누름으로 녹음을 전환합니다: 한 번 탭하여 시작하고, 말한 다음, 다시 탭하여 프롬프트를 전송합니다. 워밍업이 없으며 키를 누르고 있을 필요가 없습니다. /voice tap으로 탭 모드를 활성화합니다. 프롬프트 입력이 비어 있으면 Space를 탭하여 녹음을 시작합니다. 바닥글은 녹음 중에 실시간 파형을 표시합니다. Space를 다시 탭하여 중지합니다. Claude Code는 전사를 삽입하고 전사가 최소 3단어 이상이면 프롬프트를 자동으로 제출합니다. 더 짧은 전사는 삽입되지만 제출되지 않으므로 실수로 탭해도 단어가 전송되지 않습니다. 첫 번째 탭은 프롬프트 입력이 비어 있을 때만 녹음을 시작하므로 메시지를 작성하는 동안 여전히 공백을 정상적으로 입력할 수 있습니다. 두 번째 탭은 입력 내용에 관계없이 녹음을 중지합니다. 녹음은 또한 15초의 침묵 또는 2분 총 시간 후 자동으로 중지됩니다.

받아쓰기 언어 변경

음성 받아쓰기는 Claude의 응답 언어를 제어하는 동일한 language 설정을 사용합니다. 해당 설정이 비어 있으면 받아쓰기는 기본적으로 영어입니다. VS Code 확장에서 language가 비어 있으면 받아쓰기는 VS Code의 accessibility.voice.speechLanguage 설정을 사용한 후 기본적으로 영어로 설정됩니다.
언어코드
체코어cs
덴마크어da
네덜란드어nl
영어en
프랑스어fr
독일어de
그리스어el
힌디어hi
인도네시아어id
이탈리아어it
일본어ja
한국어ko
노르웨이어no
폴란드어pl
포르투갈어pt
러시아어ru
스페인어es
스웨덴어sv
터키어tr
우크라이나어uk
/config에서 또는 설정에서 직접 언어를 설정합니다. BCP 47 언어 코드 또는 언어 이름을 사용할 수 있습니다:
{
  "language": "japanese"
}
language 설정이 지원되는 목록에 없으면 /voice는 활성화할 때 경고하고 받아쓰기를 위해 영어로 폴백합니다. Claude의 텍스트 응답은 이 폴백의 영향을 받지 않습니다.

받아쓰기 키 다시 바인딩

받아쓰기 키는 Chat 컨텍스트에서 voice:pushToTalk에 바인딩되고 기본값은 Space입니다. 동일한 바인딩이 누르고 있기 및 탭 모드를 모두 제어합니다. ~/.claude/keybindings.json에서 다시 바인딩하세요:
{
  "bindings": [
    {
      "context": "Chat",
      "bindings": {
        "meta+k": "voice:pushToTalk",
        "space": null
      }
    }
  ]
}
"space": null을 설정하면 기본 바인딩이 제거됩니다. 두 키를 모두 활성화하려면 생략하세요. 누르고 있기 모드에서는 v와 같은 단순 문자 키 바인딩을 피하세요. 누르고 있기 감지는 키 반복에 의존하고 문자는 워밍업 중에 프롬프트로 입력되기 때문입니다. Space를 사용하거나 meta+k와 같은 수정자 조합을 사용하여 워밍업 없이 첫 번째 키 누름에서 녹음을 시작하세요. 탭 모드에는 워밍업이 없으므로 대부분의 키가 작동합니다. 일부 키는 터미널 애플리케이션에 전달되지 않으며 전혀 바인딩할 수 없습니다. 예를 들어, Caps Lock을 바인딩하려고 하면 오류가 표시됩니다. 전체 키바인딩 구문 및 예약된 단축키 목록은 키보드 단축키 사용자 정의를 참조하세요.

문제 해결

음성 받아쓰기가 활성화되지 않거나 녹음되지 않을 때의 일반적인 문제:
  • Voice mode requires a Claude.ai account: API 키 또는 타사 공급자로 인증되었습니다. /login을 실행하여 Claude.ai 계정으로 로그인하세요.
  • Microphone access is denied: 시스템 설정에서 터미널에 마이크 권한을 부여하세요. macOS에서는 시스템 설정 → 개인정보 보호 및 보안 → 마이크로 이동하여 터미널 앱을 활성화한 다음 /voice를 다시 실행하세요. Windows에서는 설정 → 개인정보 보호 및 보안 → 마이크로 이동하여 데스크톱 앱에 대한 마이크 접근을 켜세요. 그런 다음 /voice를 다시 실행하세요. 터미널이 macOS 설정에 나열되지 않으면 macOS 마이크 설정에 나열되지 않은 터미널을 참조하세요.
  • Linux에서 No audio recording tool found: 네이티브 오디오 모듈을 로드할 수 없고 폴백이 설치되지 않았습니다. 오류 메시지에 표시된 명령으로 SoX를 설치하세요. 예: sudo apt-get install sox.
  • Voice mode could not find a working audio recorder in WSL: WSLg는 ALSA 장치가 아닌 PulseAudio를 통해 오디오를 라우팅하므로 SoX는 PulseAudio 백엔드가 명시적으로 설치되어야 합니다. sudo apt install sox libsox-fmt-pulse를 실행하세요. sox만 설치하면 ALSA 백엔드가 함께 설치되는데, WSL에서는 /dev/snd 장치가 없기 때문에 녹음할 수 없습니다.
  • Voice input is failing repeatedly and has been paused: 음성 받아쓰기가 여러 번 시작 실패를 겪었고 하나가 성공할 때까지 새 세션 시도를 중단했습니다. 이는 일반적으로 이 호스트의 마이크 또는 오디오 스택이 오디오를 캡처할 수 없음을 의미합니다. 예를 들어 헤드리스 서버, 오디오 패스스루가 없는 원격 셸 또는 거부된 마이크 권한이 있습니다. 작동하는 입력 장치를 확인하고 위의 항목에서 근본 원인을 해결한 다음 음성을 다시 트리거하세요.
  • 누르고 있기 모드에서 Space를 누르고 있어도 아무것도 일어나지 않음: 누르고 있는 동안 프롬프트 입력을 봅니다. 공백이 계속 누적되면 음성 받아쓰기가 꺼져 있을 가능성이 높습니다. /voice hold를 실행하여 활성화하세요. 1~2개의 공백만 나타나고 그 다음 아무것도 없으면 음성 받아쓰기는 켜져 있지만 누르고 있기 감지가 트리거되지 않습니다. 누르고 있기 감지는 터미널이 키 반복 이벤트를 보내야 하므로 OS 수준에서 키 반복이 비활성화되면 누르고 있는 키를 감지할 수 없습니다. 키 반복 요구 사항을 피하려면 /voice tap으로 탭 모드로 전환하세요.
  • 탭 모드에서 Space를 탭하면 녹음 대신 공백을 입력함: 첫 번째 탭은 프롬프트 입력이 비어 있을 때만 녹음을 시작합니다. 먼저 입력을 지우거나 /voice tap을 실행하여 탭 모드에 있는지 확인하세요.
  • No audio detected from microphone: 녹음이 시작되었지만 침묵을 캡처했습니다. 올바른 입력 장치가 시스템 기본값으로 설정되어 있고 입력 수준이 음소거되거나 0에 가깝지 않은지 확인하세요. Windows에서는 설정 → 시스템 → 사운드 → 입력을 열고 마이크를 선택하세요. macOS에서는 시스템 설정 → 사운드 → 입력을 열어보세요.
  • No speech detected: 오디오가 전사 서비스에 도달했지만 단어가 인식되지 않았습니다. 마이크에 더 가깝게 말하고, 배경 소음을 줄이고, 받아쓰기 언어가 말하는 언어와 일치하는지 확인하세요.
  • 전사가 왜곡되었거나 잘못된 언어임: 받아쓰기는 기본적으로 영어입니다. 다른 언어로 받아쓰기하는 경우 먼저 /config에서 설정하세요. 받아쓰기 언어 변경을 참조하세요.

macOS 마이크 설정에 나열되지 않은 터미널

터미널 앱이 시스템 설정 → 개인정보 보호 및 보안 → 마이크 아래에 나타나지 않으면 활성화할 수 있는 토글이 없습니다. 터미널의 권한 상태를 재설정하여 다음 /voice 실행이 새로운 macOS 권한 프롬프트를 트리거하도록 합니다.
1

터미널의 마이크 권한 재설정

tccutil reset Microphone <bundle-id>를 실행하고, <bundle-id>를 터미널의 식별자로 바꾸세요: 기본 제공 터미널의 경우 com.apple.Terminal, iTerm2의 경우 com.googlecode.iterm2. 다른 터미널의 경우 osascript -e 'id of app "AppName"'으로 식별자를 조회하세요.
번들 ID 없이 tccutil reset Microphone을 실행할 수 있지만 Mac의 모든 앱(Zoom 또는 Slack과 같은 앱 포함)에서 마이크 접근을 취소합니다. 각 앱은 다음 사용 시 접근을 다시 요청해야 하므로 활성 통화 중에 실행하지 마세요.
2

터미널 종료 및 다시 시작

macOS는 이미 실행 중인 프로세스를 다시 프롬프트하지 않습니다. 창을 닫기만 하지 말고 Cmd+Q로 터미널 앱을 종료한 다음 다시 열어보세요.
3

새로운 프롬프트 트리거

Claude Code를 시작하고 /voice를 실행합니다. macOS가 마이크 접근을 요청합니다. 허용하세요.

참고 항목