Claude Code CLI でプロンプトを入力する代わりに、話して入力できます。音声はプロンプト入力にリアルタイムで文字起こしされるため、同じメッセージ内で音声と入力を混在させることができます。Documentation Index
Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
/voice で音声ディクテーションを有効にしてから、キーを押しながら話すか、1 回タップして開始し、もう 1 回タップして送信します。
音声ディクテーションには Claude Code v2.1.69 以降が必要です。タップモードには v2.1.116 以降が必要です。
claude --version でバージョンを確認してください。要件
音声ディクテーションは、記録された音声を Anthropic のサーバーにストリーミングして文字起こしします。音声はローカルで処理されません。音声テキスト変換サービスは Claude.ai アカウントで認証した場合にのみ利用可能であり、Claude Code が Anthropic API キー、Amazon Bedrock、Google Vertex AI、または Microsoft Foundry を直接使用するように設定されている場合は利用できません。文字起こしは Claude メッセージやトークンを消費せず、/usage に表示される制限にはカウントされません。Anthropic がデータをどのように処理するかについては、データ使用を参照してください。
音声ディクテーションはローカルマイクへのアクセスも必要なため、Web 上の Claude Codeや SSH セッションなどのリモート環境では機能しません。WSL では、音声ディクテーションは音声アクセスのために WSLg が必要です。WSLg は Windows 10 または 11 の Microsoft Store からインストールされた WSL2 に含まれています。WSL1 など WSLg が利用できない場合は、代わりにネイティブ Windows で Claude Code を実行してください。
音声録音は macOS、Linux、Windows のビルトイン ネイティブ モジュールを使用します。Linux では、ネイティブ モジュールが読み込めない場合、Claude Code は ALSA utils の arecord または SoX の rec にフォールバックします。どちらも利用できない場合、/voice はパッケージ マネージャーのインストール コマンドを出力します。
Claude Code VS Code 拡張機能も、同じ Claude.ai アカウント要件で音声ディクテーションをサポートしています。SSH、Dev Containers、Codespaces などの VS Code Remote セッションでは利用できません。マイクはローカル マシンにあり、拡張機能はリモート ホストで実行されるためです。
音声ディクテーションを有効にする
/voice を実行して音声ディクテーションを有効にします。初めて有効にするときは、Claude Code はマイク チェックを実行します。macOS では、ターミナルにマイク権限がまだ付与されていない場合、システム マイク権限プロンプトがトリガーされます。
/voice はオプションのモード引数を受け入れます。
音声ディクテーションはセッション間で保持されます。/voice を実行する代わりに、ユーザー設定ファイルで直接設定します。
hold Space to speak ヒントが表示されます。ヒント テキストは現在の voice:pushToTalk バインディングを反映し、ディクテーション キーを再バインドする場合は更新されます。ヒント テキストは両方のモードで同じであり、カスタム ステータス ラインを設定している場合は表示されません。
文字起こしは両方のモードでコーディング語彙用に調整されています。regex、OAuth、JSON、localhost などの一般的な開発用語は正しく認識され、現在のプロジェクト名と git ブランチ名は認識ヒントとして自動的に追加されます。
長押しして録音
長押しモードはプッシュツートーク機能です。キーを押している間は録音が実行され、キーを離すと停止します。これはデフォルト モードです。Space を長押しして録音を開始します。Claude Code はターミナルからの高速キー リピート イベントを監視することでキーの長押しを検出するため、録音が開始される前に短いウォームアップがあります。フッターはウォームアップ中に keep holding… を表示し、録音がアクティブになるとライブ波形に切り替わります。
最初の数個のキー リピート文字はウォームアップ中に入力に入力され、録音がアクティブになると自動的に削除されます。単一の Space タップはスペースを入力します。長押し検出は高速リピートでのみトリガーされるためです。
音声はプロンプトに話すときに表示され、文字起こしが確定されるまで薄く表示されます。Space を離して録音を停止し、テキストを確定します。文字起こしはカーソル位置に挿入され、カーソルは挿入されたテキストの末尾に留まるため、任意の順序で入力と音声ディクテーションを混在させることができます。Space を再度長押しして別の録音を追加するか、カーソルを最初に移動して、プロンプト内の別の場所に音声を挿入します。
Enter を押すのを待ちます。voice 設定オブジェクトで "autoSubmit": true を設定して、文字起こしが少なくとも 3 語以上の場合、キーを離すときにプロンプトを自動的に送信します。
タップして録音して送信
タップモードは単一のキープレスで録音を切り替えます。1 回タップして開始し、話してから、もう 1 回タップしてプロンプトを送信します。ウォームアップはなく、キーを押し続ける必要はありません。/voice tap でタップモードを有効にします。プロンプト入力が空の場合、Space をタップして録音を開始します。フッターは録音中にライブ波形を表示します。Space をもう 1 回タップして停止します。Claude Code は文字起こしを挿入し、文字起こしが少なくとも 3 語以上の場合、プロンプトを自動的に送信します。短い文字起こしは挿入されますが送信されないため、誤ったタップは単語を送信しません。
最初のタップはプロンプト入力が空の場合にのみ録音を開始するため、メッセージを作成しながら通常どおりスペースを入力できます。2 番目のタップは入力内容に関係なく録音を停止します。15 秒以上の無音または 2 分間の合計の後、録音も自動的に停止します。
音声ディクテーション言語を変更する
音声ディクテーションは、Claude の応答言語を制御する同じlanguage 設定を使用します。その設定が空の場合、音声ディクテーションはデフォルトで英語になります。VS Code 拡張機能では、language が空の場合、音声ディクテーションは VS Code の accessibility.voice.speechLanguage 設定を使用してから、デフォルトで英語になります。
サポートされている音声ディクテーション言語
サポートされている音声ディクテーション言語
| 言語 | コード |
|---|---|
| チェコ語 | cs |
| デンマーク語 | da |
| オランダ語 | nl |
| 英語 | en |
| フランス語 | fr |
| ドイツ語 | de |
| ギリシャ語 | el |
| ヒンディー語 | hi |
| インドネシア語 | id |
| イタリア語 | it |
| 日本語 | ja |
| 韓国語 | ko |
| ノルウェー語 | no |
| ポーランド語 | pl |
| ポルトガル語 | pt |
| ロシア語 | ru |
| スペイン語 | es |
| スウェーデン語 | sv |
| トルコ語 | tr |
| ウクライナ語 | uk |
/config で言語を設定するか、設定で直接設定します。BCP 47 言語コードまたは言語名のいずれかを使用できます。
language 設定がサポートされているリストにない場合、/voice は有効化時に警告を表示し、音声ディクテーションの場合は英語にフォールバックします。Claude のテキスト応答はこのフォールバックの影響を受けません。
音声ディクテーション キーをリバインドする
音声ディクテーション キーはChat コンテキストの voice:pushToTalk にバインドされ、デフォルトは Space です。同じバインディングは長押しモードとタップモードの両方を制御します。~/.claude/keybindings.jsonでリバインドします。
"space": null を設定するとデフォルト バインディングが削除されます。両方のキーをアクティブにしたい場合は省略します。
長押しモードでは、v などのベア文字キーへのバインディングを避けてください。長押し検出はキー リピートに依存し、文字はウォームアップ中にプロンプトに入力されるためです。Space を使用するか、meta+k などの修飾子の組み合わせを使用して、ウォームアップなしで最初のキープレスで録音を開始します。タップモードにはウォームアップがないため、ほとんどのキーが機能します。
一部のキーはターミナル アプリケーションに配信されず、まったくバインドできません。たとえば、Caps Lock をバインドしようとするとエラーが表示されます。完全なキーバインディング構文と予約済みショートカットのリストについては、キーボード ショートカットをカスタマイズするを参照してください。
トラブルシューティング
音声ディクテーションがアクティブにならないか、記録されない場合の一般的な問題:Voice mode requires a Claude.ai account: API キーまたはサードパーティ プロバイダーで認証しています。/loginを実行して Claude.ai アカウントでサインインしてください。Microphone access is denied: システム設定でターミナルにマイク権限を付与してください。macOS では、[システム設定] → [プライバシーとセキュリティ] → [マイク]に移動し、ターミナル アプリを有効にしてから、/voiceを再度実行してください。Windows では、[設定] → [プライバシーとセキュリティ] → [マイク]に移動し、デスクトップ アプリのマイク アクセスをオンにしてから、/voiceを再度実行してください。ターミナルが macOS 設定に表示されていない場合は、Terminal not listed in macOS Microphone settingsを参照してください。- Linux で
No audio recording tool found: ネイティブ オーディオ モジュールが読み込めず、フォールバックがインストールされていません。エラー メッセージに表示されているコマンド(例:sudo apt-get install sox)で SoX をインストールしてください。 Voice mode could not find a working audio recorder in WSL: WSLg は PulseAudio ではなく ALSA デバイスを経由してオーディオをルーティングするため、SoX は PulseAudio バックエンドを明示的にインストールする必要があります。sudo apt install sox libsox-fmt-pulseを実行してください。soxだけをインストールすると ALSA バックエンドが引き込まれますが、WSL には/dev/sndデバイスがないため、WSL で記録することはできません。Voice input is failing repeatedly and has been paused: 音声ディクテーションが複数回の起動失敗に遭遇し、1 つが成功するまで新しいセッションの試行を停止しました。これは通常、このホストのマイクまたはオーディオ スタックがオーディオをキャプチャできないことを意味します。例えば、ヘッドレス サーバー、オーディオ パススルーのないリモート シェル、またはマイク権限が拒否されている場合です。動作する入力デバイスを確認し、上記のエントリから根本原因を修正してから、音声を再度トリガーしてください。- 長押しモードで
Spaceを長押ししても何も起こらない: プロンプト入力を監視しながら長押ししてください。スペースが蓄積し続ける場合、音声ディクテーションはおそらくオフです。/voice holdを実行して有効にしてください。1 つまたは 2 つのスペースだけが表示されて何も起こらない場合、音声ディクテーションはオンですが、長押し検出がトリガーされていません。長押し検出はターミナルがキー リピート イベントを送信することが必要なため、OS レベルでキー リピートが無効になっている場合、押されたキーを検出できません。/voice tapでタップモードに切り替えて、キー リピート要件を回避してください。 - タップモードで
Spaceをタップするとスペースが入力される代わりに記録される: 最初のタップはプロンプト入力が空の場合にのみ録音を開始します。入力を最初にクリアするか、/voice tapを実行してタップモードであることを確認してください。 No audio detected from microphone: 録音が開始されましたが、無音がキャプチャされました。正しい入力デバイスがシステム デフォルトとして設定されており、その入力レベルがミュートされていないか、ゼロに近くないことを確認してください。Windows では、[設定] → [システム] → [サウンド] → [入力]を開き、マイクを選択してください。macOS では、[システム設定] → [サウンド] → [入力]を開いてください。No speech detected: オーディオは文字起こしサービスに到達しましたが、単語は認識されませんでした。マイクに近づいて話し、背景ノイズを減らし、ディクテーション言語が話している言語と一致することを確認してください。- 文字起こしが乱れているか、間違った言語である: ディクテーションはデフォルトで英語です。別の言語でディクテーションしている場合は、最初に
/configで設定してください。ディクテーション言語を変更するを参照してください。
Terminal not listed in macOS Microphone settings
ターミナル アプリが [システム設定] → [プライバシーとセキュリティ] → [マイク]に表示されない場合、有効にできるトグルはありません。ターミナルのマイク権限状態をリセットして、次の/voice 実行が新しい macOS 権限プロンプトをトリガーするようにしてください。
ターミナルのマイク権限をリセットする
tccutil reset Microphone <bundle-id> を実行してください。<bundle-id> をターミナルの識別子に置き換えてください。組み込みターミナルの場合は com.apple.Terminal、iTerm2 の場合は com.googlecode.iterm2。その他のターミナルについては、osascript -e 'id of app "AppName"' で識別子を検索してください。関連項目
- キーボード ショートカットをカスタマイズする:
voice:pushToTalkおよび他の CLI キーボード アクションをリバインドする - 設定を構成する:
voice、language、およびその他の設定キーの完全なリファレンス - インタラクティブ モード: キーボード ショートカット、入力モード、およびセッション コントロール
- コマンド:
/voice、/config、およびその他すべてのコマンドのリファレンス