Sprechen Sie Ihre Eingabeaufforderungen, anstatt sie in der Claude Code CLI einzutippen. Ihre Sprache wird live in die Eingabeaufforderung transkribiert, sodass Sie Sprache und Tippen in derselben Nachricht mischen können. Aktivieren Sie die Erfassung mitDocumentation Index
Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
/voice, halten Sie dann entweder eine Taste gedrückt, während Sie sprechen, oder tippen Sie einmal zum Starten und erneut zum Senden.
Die Spracherfassung erfordert Claude Code v2.1.69 oder später. Der Tap-Modus erfordert v2.1.116 oder später. Überprüfen Sie Ihre Version mit
claude --version.Anforderungen
Die Spracherfassung streamt Ihre aufgenommene Audiodatei an Anthropic-Server zur Transkription. Audio wird nicht lokal verarbeitet. Der Sprache-zu-Text-Dienst ist nur verfügbar, wenn Sie sich mit einem Claude.ai-Konto authentifizieren, und ist nicht verfügbar, wenn Claude Code für die Verwendung eines Anthropic API-Schlüssels direkt, Amazon Bedrock, Google Vertex AI oder Microsoft Foundry konfiguriert ist. Die Transkription verbraucht keine Claude-Nachrichten oder Token und wird nicht auf die in/usage angezeigten Limits angerechnet. Siehe Datennutzung für Informationen darüber, wie Anthropic Ihre Daten verarbeitet.
Die Spracherfassung benötigt auch lokalen Mikrofonzugriff, daher funktioniert sie nicht in Remote-Umgebungen wie Claude Code im Web oder SSH-Sitzungen. In WSL erfordert die Spracherfassung WSLg für Audiozugriff. WSLg ist in WSL2 enthalten, wenn es unter Windows 10 oder 11 aus dem Microsoft Store installiert wird. Wenn WSLg nicht verfügbar ist, beispielsweise unter WSL1, führen Sie Claude Code stattdessen nativ unter Windows aus.
Die Audioaufnahme verwendet ein integriertes natives Modul unter macOS, Linux und Windows. Unter Linux wird Claude Code auf arecord aus ALSA-Dienstprogrammen oder rec aus SoX zurückgreifen, wenn das native Modul nicht geladen werden kann. Wenn keines verfügbar ist, gibt /voice einen Installationsbefehl für Ihren Paketmanager aus.
Die Claude Code VS Code-Erweiterung unterstützt auch Spracherfassung mit derselben Claude.ai-Kontoanforderung. Sie ist nicht in VS Code Remote-Sitzungen verfügbar, einschließlich SSH, Dev Containers und Codespaces, da sich das Mikrofon auf Ihrem lokalen Computer befindet und die Erweiterung auf dem Remote-Host ausgeführt wird.
Spracherfassung aktivieren
Führen Sie/voice aus, um die Erfassung zu aktivieren. Beim ersten Aktivieren führt Claude Code eine Mikrofonprüfung durch. Unter macOS wird dies die Systemmikrofonberechtigungsaufforderung für Ihr Terminal auslösen, falls diese noch nie gewährt wurde.
/voice akzeptiert ein optionales Modusargument:
| Befehl | Effekt |
|---|---|
/voice | Ein- oder ausschalten, aktuellen Modus beibehalten |
/voice hold | Im Halten-Modus aktivieren |
/voice tap | Im Tippen-Modus aktivieren |
/voice off | Deaktivieren |
/voice auszuführen:
hold Space to speak-Hinweis an, wenn die Eingabeaufforderung leer ist. Der Hinweis spiegelt Ihre aktuelle voice:pushToTalk-Bindung wider und wird aktualisiert, wenn Sie die Erfassungstaste neu zuordnen. Der Hinweistext ist in beiden Modi gleich und wird nicht angezeigt, wenn Sie eine benutzerdefinierte Statuszeile konfiguriert haben.
Die Transkription ist in beiden Modi auf Codierungsvokabular abgestimmt. Häufige Entwicklungsbegriffe wie regex, OAuth, JSON und localhost werden korrekt erkannt, und Ihr aktueller Projektname und Git-Branch-Name werden automatisch als Erkennungshinweise hinzugefügt.
Halten zum Aufnehmen
Der Halten-Modus ist Push-to-Talk: Die Aufnahme läuft, während Sie die Taste halten, und stoppt, wenn Sie sie loslassen. Dies ist der Standardmodus. Halten SieSpace gedrückt, um die Aufnahme zu starten. Claude Code erkennt eine gehaltene Taste, indem es schnelle Tastenwiederholungsereignisse von Ihrem Terminal überwacht, daher gibt es eine kurze Aufwärmphase, bevor die Aufnahme beginnt. Die Fußzeile zeigt keep holding… während der Aufwärmphase an und wechselt dann zu einer Live-Wellenform, sobald die Aufnahme aktiv ist.
Die ersten paar Tastenwiederholungszeichen werden während der Aufwärmphase in die Eingabe eingegeben und werden automatisch entfernt, wenn die Aufnahme aktiviert wird. Ein einzelnes Space-Tippen gibt immer noch ein Leerzeichen ein, da die Halten-Erkennung nur bei schneller Wiederholung ausgelöst wird.
Ihre Sprache erscheint in der Eingabeaufforderung, während Sie sprechen, abgeblendet, bis das Transkript finalisiert ist. Lassen Sie Space los, um die Aufnahme zu stoppen und den Text zu finalisieren. Das Transkript wird an Ihrer Cursorposition eingefügt und der Cursor bleibt am Ende des eingefügten Textes, sodass Sie Tippen und Erfassung in beliebiger Reihenfolge mischen können. Halten Sie Space erneut gedrückt, um eine weitere Aufnahme anzufügen, oder verschieben Sie den Cursor zuerst, um Sprache an anderer Stelle in der Eingabeaufforderung einzufügen:
Enter drücken. Legen Sie "autoSubmit": true im voice-Einstellungsobjekt fest, um die Eingabeaufforderung automatisch zu senden, wenn Sie die Taste loslassen, solange das Transkript mindestens drei Wörter lang ist.
Tippen zum Aufnehmen und Senden
Der Tippen-Modus schaltet die Aufnahme mit einem einzelnen Tastendruck um: Tippen Sie einmal zum Starten, sprechen Sie, dann tippen Sie erneut zum Senden der Eingabeaufforderung. Es gibt keine Aufwärmphase und Sie müssen die Taste nicht gedrückt halten. Aktivieren Sie den Tippen-Modus mit/voice tap. Wenn die Eingabeaufforderung leer ist, tippen Sie auf Space, um die Aufnahme zu starten. Die Fußzeile zeigt eine Live-Wellenform während der Aufnahme. Tippen Sie erneut auf Space, um zu stoppen. Claude Code fügt das Transkript ein und sendet die Eingabeaufforderung automatisch, wenn das Transkript mindestens drei Wörter lang ist. Kürzere Transkripte werden eingefügt, aber nicht gesendet, daher sendet ein versehentliches Tippen kein einzelnes Wort.
Das erste Tippen startet die Aufnahme nur, wenn die Eingabeaufforderung leer ist, sodass Sie immer noch normal Leerzeichen eingeben können, während Sie eine Nachricht verfassen. Das zweite Tippen stoppt die Aufnahme unabhängig vom Eingabeinhalt. Die Aufnahme stoppt auch automatisch nach 15 Sekunden Stille oder zwei Minuten insgesamt.
Ändern Sie die Erfassungssprache
Die Spracherfassung verwendet die gleichelanguage-Einstellung, die die Antwortsprache von Claude steuert. Wenn diese Einstellung leer ist, wird die Erfassung standardmäßig auf Englisch eingestellt. In der VS Code-Erweiterung wird die Erfassung, wenn language leer ist, die accessibility.voice.speechLanguage-Einstellung von VS Code verwenden, bevor sie auf Englisch zurückfällt.
Unterstützte Erfassungssprachen
Unterstützte Erfassungssprachen
| Sprache | Code |
|---|---|
| Tschechisch | cs |
| Dänisch | da |
| Niederländisch | nl |
| Englisch | en |
| Französisch | fr |
| Deutsch | de |
| Griechisch | el |
| Hindi | hi |
| Indonesisch | id |
| Italienisch | it |
| Japanisch | ja |
| Koreanisch | ko |
| Norwegisch | no |
| Polnisch | pl |
| Portugiesisch | pt |
| Russisch | ru |
| Spanisch | es |
| Schwedisch | sv |
| Türkisch | tr |
| Ukrainisch | uk |
/config fest oder direkt in den Einstellungen. Sie können entweder den BCP 47-Sprachcode oder den Sprachnamen verwenden:
language-Einstellung nicht in der unterstützten Liste enthalten ist, warnt Sie /voice beim Aktivieren und fällt für die Erfassung auf Englisch zurück. Clauds Textantworten sind von diesem Fallback nicht betroffen.
Binden Sie die Erfassungstaste neu
Die Erfassungstaste ist anvoice:pushToTalk im Chat-Kontext gebunden und wird standardmäßig auf Space eingestellt. Die gleiche Bindung steuert sowohl den Halten- als auch den Tippen-Modus. Binden Sie sie in ~/.claude/keybindings.json neu:
"space": null entfernt die Standardbindung. Lassen Sie es weg, wenn Sie beide Tasten aktiv haben möchten.
Im Halten-Modus vermeiden Sie das Binden einer bloßen Buchstabentaste wie v, da die Halten-Erkennung auf Tastenwiederholung angewiesen ist und der Buchstabe während der Aufwärmphase in die Eingabeaufforderung eingegeben wird. Verwenden Sie Space oder eine Modifikatorkombination wie meta+k, um die Aufnahme beim ersten Tastendruck ohne Aufwärmphase zu starten. Der Tippen-Modus hat keine Aufwärmphase, daher funktioniert jede Taste.
Einige Tasten werden nicht an Terminalanwendungen übermittelt und können überhaupt nicht gebunden werden. Beispielsweise zeigt Caps Lock einen Fehler an, wenn Sie versuchen, es zu binden. Siehe Tastaturkürzel anpassen für die vollständige Tastenbindungssyntax und die Liste der reservierten Tastenkombinationen.
Fehlerbehebung
Häufige Probleme, wenn die Spracherfassung nicht aktiviert wird oder nicht aufnimmt:Voice mode requires a Claude.ai account: Sie sind mit einem API-Schlüssel oder einem Drittanbieter authentifiziert. Führen Sie/loginaus, um sich mit einem Claude.ai-Konto anzumelden.Microphone access is denied: Gewähren Sie Ihrem Terminal in den Systemeinstellungen Mikrofonberechtigung. Unter macOS gehen Sie zu Systemeinstellungen → Datenschutz & Sicherheit → Mikrofon und aktivieren Sie Ihre Terminal-App, führen Sie dann/voiceerneut aus. Unter Windows gehen Sie zu Einstellungen → Datenschutz & Sicherheit → Mikrofon und aktivieren Sie den Mikrofonzugriff für Desktop-Apps, führen Sie dann/voiceerneut aus. Wenn Ihr Terminal nicht in den macOS-Einstellungen aufgeführt ist, siehe Terminal nicht in macOS-Mikrofoneinstellungen aufgeführt.No audio recording tool foundunter Linux: Das native Audiomodul konnte nicht geladen werden und kein Fallback ist installiert. Installieren Sie SoX mit dem im Fehlermeldung angezeigten Befehl, z. B.sudo apt-get install sox.Voice mode could not find a working audio recorder in WSL: WSLg leitet Audio über PulseAudio statt über ein ALSA-Gerät weiter, daher muss das PulseAudio-Backend von SoX explizit installiert werden. Führen Siesudo apt install sox libsox-fmt-pulseaus. Die Installation vonsoxallein zieht das ALSA-Backend mit sich, das unter WSL nicht aufnehmen kann, da es kein/dev/snd-Gerät gibt.Voice input is failing repeatedly and has been paused: Die Spracherfassung ist mehrmals hintereinander fehlgeschlagen und hat versucht, neue Sitzungen zu stoppen, bis eine erfolgreich ist. Dies bedeutet normalerweise, dass das Mikrofon oder der Audiostapel auf diesem Host keinen Audio erfassen kann, z. B. ein Server ohne Kopfhörer, eine Remote-Shell ohne Audio-Durchleitung oder eine verweigerte Mikrofonberechtigung. Bestätigen Sie ein funktionierendes Eingabegerät, beheben Sie die zugrunde liegende Ursache aus den obigen Einträgen und lösen Sie dann die Spracherfassung erneut aus.- Nichts passiert, wenn Sie
Spaceim Halten-Modus halten: Beobachten Sie die Eingabeaufforderung, während Sie halten. Wenn sich Leerzeichen weiter ansammeln, ist die Spracherfassung wahrscheinlich aus; führen Sie/voice holdaus, um sie zu aktivieren. Wenn nur ein oder zwei Leerzeichen erscheinen und dann nichts, ist die Spracherfassung an, aber die Halten-Erkennung wird nicht ausgelöst. Die Halten-Erkennung erfordert, dass Ihr Terminal Tastenwiederholungsereignisse sendet, daher kann es eine gehaltene Taste nicht erkennen, wenn die Tastenwiederholung auf Betriebssystemebene deaktiviert ist. Wechseln Sie mit/voice tapzum Tippen-Modus, um die Tastenwiederholungsanforderung zu vermeiden. - Das Tippen auf
Spacegibt ein Leerzeichen ein, anstatt im Tippen-Modus aufzunehmen: Das erste Tippen startet die Aufnahme nur, wenn die Eingabeaufforderung leer ist. Löschen Sie zuerst die Eingabe, oder überprüfen Sie, dass Sie im Tippen-Modus sind, indem Sie/voice tapausführen. No audio detected from microphone: Die Aufnahme wurde gestartet, aber es wurde Stille erfasst. Bestätigen Sie, dass das richtige Eingabegerät als Systemstandard eingestellt ist und dass sein Eingabepegel nicht stummgeschaltet oder nahe Null ist. Unter Windows öffnen Sie Einstellungen → System → Sound → Eingabe und wählen Sie Ihr Mikrofon aus. Unter macOS öffnen Sie Systemeinstellungen → Sound → Eingabe.No speech detected: Audio erreichte den Transkriptionsdienst, aber es wurden keine Wörter erkannt. Sprechen Sie näher zum Mikrofon, reduzieren Sie Hintergrundgeräusche und bestätigen Sie, dass Ihre Erfassungssprache der Sprache entspricht, die Sie sprechen.- Transkription ist verzerrt oder in der falschen Sprache: Die Erfassung wird standardmäßig auf Englisch eingestellt. Wenn Sie in einer anderen Sprache erfassen, legen Sie sie zuerst in
/configfest. Siehe Ändern Sie die Erfassungssprache.
Terminal nicht in macOS-Mikrofoneinstellungen aufgeführt
Wenn Ihre Terminal-App nicht unter Systemeinstellungen → Datenschutz & Sicherheit → Mikrofon angezeigt wird, gibt es keinen Schalter, den Sie aktivieren können. Setzen Sie den Berechtigungsstatus für Ihr Terminal zurück, damit die nächste/voice-Ausführung eine neue macOS-Berechtigungsaufforderung auslöst.
Setzen Sie die Mikrofonberechtigung für Ihr Terminal zurück
Führen Sie
tccutil reset Microphone <bundle-id> aus und ersetzen Sie <bundle-id> durch die Kennung Ihres Terminals: com.apple.Terminal für das integrierte Terminal oder com.googlecode.iterm2 für iTerm2. Für andere Terminals suchen Sie die Kennung mit osascript -e 'id of app "AppName"'.Beenden Sie Ihr Terminal und starten Sie es neu
macOS wird einen Prozess, der bereits ausgeführt wird, nicht erneut auffordern. Beenden Sie die Terminal-App mit Cmd+Q, nicht nur schließen Sie ihre Fenster, öffnen Sie sie dann erneut.
Siehe auch
- Tastaturkürzel anpassen: Binden Sie
voice:pushToTalkund andere CLI-Tastaturaktionen neu - Einstellungen konfigurieren: Vollständige Referenz für
voice,languageund andere Einstellungsschlüssel - Interaktiver Modus: Tastaturkürzel, Eingabemodi und Sitzungssteuerungen
- Befehle: Referenz für
/voice,/configund alle anderen Befehle