Modellkonfiguration

Verfügbare Modelle

Für die model-Einstellung in Claude Code können Sie konfigurieren:

Einen Modellalias
Einen Modellnamen
- Anthropic API: Einen vollständigen Modellnamen
- Bedrock: ein Inference-Profil-ARN
- Foundry: einen Bereitstellungsnamen
- Vertex: einen Versionsnamen

ANTHROPIC_BASE_URL ändert, wohin Anfragen gesendet werden, nicht welches Modell sie beantwortet. Um Claude durch ein LLM-Gateway zu leiten, siehe LLM-Gateway-Konfiguration.

Modellaliase

Modellaliase bieten eine bequeme Möglichkeit, Modelleinstellungen auszuwählen, ohne sich genaue Versionsnummern merken zu müssen:

Modellalias	Verhalten
`default`	Spezieller Wert, der jede Modellüberschreibung löscht und auf das empfohlene Modell für Ihren Kontotyp zurückgesetzt wird. Ist selbst kein Modellalias
`best`	Verwendet das leistungsfähigste verfügbare Modell, derzeit gleichwertig mit `opus`
`sonnet`	Verwendet das neueste Sonnet-Modell für tägliche Codierungsaufgaben
`opus`	Verwendet das neueste Opus-Modell für komplexe Reasoning-Aufgaben
`haiku`	Verwendet das schnelle und effiziente Haiku-Modell für einfache Aufgaben
`sonnet[1m]`	Verwendet Sonnet mit einem 1-Million-Token-Kontextfenster für lange Sitzungen
`opus[1m]`	Verwendet Opus mit einem 1-Million-Token-Kontextfenster für lange Sitzungen
`opusplan`	Spezieller Modus, der `opus` während des Plan Mode verwendet und dann zu `sonnet` für die Ausführung wechselt

Bei der Anthropic API und Claude Platform on AWS wird opus zu Opus 4.7 und sonnet zu Sonnet 4.6 aufgelöst. Bei Bedrock, Vertex und Foundry wird opus zu Opus 4.6 und sonnet zu Sonnet 4.5 aufgelöst; neuere Modelle sind bei diesen Anbietern verfügbar, indem Sie den vollständigen Modellnamen explizit auswählen oder ANTHROPIC_DEFAULT_OPUS_MODEL oder ANTHROPIC_DEFAULT_SONNET_MODEL setzen. Aliase verweisen auf die empfohlene Version für Ihren Anbieter und werden im Laufe der Zeit aktualisiert. Um eine bestimmte Version zu fixieren, verwenden Sie den vollständigen Modellnamen (z. B. claude-opus-4-7) oder setzen Sie die entsprechende Umgebungsvariable wie ANTHROPIC_DEFAULT_OPUS_MODEL.

Opus 4.7 erfordert Claude Code v2.1.111 oder später. Führen Sie claude update aus, um zu aktualisieren.

Einstellung Ihres Modells

Sie können Ihr Modell auf mehrere Arten konfigurieren, aufgelistet nach Priorität:

Während der Sitzung - Verwenden Sie /model <alias|name>, um sofort zu wechseln, oder führen Sie /model ohne Argument aus, um die Auswahl zu öffnen. Die Auswahl fordert zur Bestätigung auf, wenn das Gespräch vorherige Ausgaben hat, da die nächste Antwort den vollständigen Verlauf ohne zwischengespeicherten Kontext erneut liest
Beim Start - Starten Sie mit claude --model <alias|name>
Umgebungsvariable - Setzen Sie ANTHROPIC_MODEL=<alias|name>
Einstellungen - Konfigurieren Sie dauerhaft in Ihrer Einstellungsdatei mit dem model-Feld.

Ihre /model-Auswahl wird in den Benutzereinstellungen gespeichert und bleibt über Neustarts hinweg erhalten. Ab v2.1.117 schreibt Claude Code Ihre Auswahl auch in .claude/settings.local.json, wenn die .claude/settings.json des Projekts ein anderes Modell festlegt, damit sie nach einem Neustart in diesem Projekt weiterhin gilt. Verwaltete Einstellungen haben Vorrang und werden beim nächsten Start erneut angewendet. Das --model-Flag und die ANTHROPIC_MODEL-Umgebungsvariable gelten nur für die Sitzung, mit der Sie sie starten, und werden nicht gespeichert. Um verschiedene Modelle in verschiedenen Terminals gleichzeitig auszuführen, starten Sie jedes mit seinem eigenen --model-Flag, anstatt mit /model zu wechseln. Wenn das aktive Modell beim Start aus Projekt- oder verwalteten Einstellungen stammt und nicht aus Ihrer eigenen Auswahl, zeigt der Startheader an, welche Einstellungsdatei es festgelegt hat. Führen Sie /model aus, um es für die aktuelle Sitzung zu überschreiben. Beispielverwendung:

# Mit Opus starten
claude --model opus

# Während der Sitzung zu Sonnet wechseln
/model sonnet

Beispiel-Einstellungsdatei:

{
    "permissions": {
        ...
    },
    "model": "opus"
}

Modellauswahl einschränken

Enterprise-Administratoren können availableModels in verwalteten oder Richtlinieneinstellungen verwenden, um einzuschränken, welche Modelle Benutzer auswählen können. Wenn availableModels gesetzt ist, können Benutzer nicht über /model, das --model-Flag oder die ANTHROPIC_MODEL-Umgebungsvariable zu Modellen wechseln, die nicht in der Liste enthalten sind.

{
  "availableModels": ["sonnet", "haiku"]
}

Standardmodell-Verhalten

Die Option „Standard” in der Modellauswahl wird von availableModels nicht beeinflusst. Sie bleibt immer verfügbar und stellt den Laufzeit-Standard des Systems dar, basierend auf dem Abonnement-Tier des Benutzers. Auch mit availableModels: [] können Benutzer Claude Code weiterhin mit dem Standardmodell für ihren Tier verwenden.

Kontrollieren Sie das Modell, auf dem Benutzer ausgeführt werden

Die model-Einstellung ist eine anfängliche Auswahl, keine Erzwingung. Sie legt fest, welches Modell aktiv ist, wenn eine Sitzung startet, aber Benutzer können weiterhin /model öffnen und „Standard” auswählen, das unabhängig davon auf den Systemstandard für ihren Tier aufgelöst wird, was model gesetzt ist. Um die Modellerfahrung vollständig zu kontrollieren, kombinieren Sie drei Einstellungen:

availableModels: schränkt ein, welche benannten Modelle Benutzer wechseln können
model: legt die anfängliche Modellauswahl fest, wenn eine Sitzung startet
ANTHROPIC_DEFAULT_SONNET_MODEL / ANTHROPIC_DEFAULT_OPUS_MODEL / ANTHROPIC_DEFAULT_HAIKU_MODEL: steuern, worauf sich die Option „Standard” und die Aliase sonnet, opus und haiku auflösen

Dieses Beispiel startet Benutzer auf Sonnet 4.5, begrenzt die Auswahl auf Sonnet und Haiku und fixiert „Standard” auf Sonnet 4.5 statt auf die neueste Version:

{
  "model": "claude-sonnet-4-5",
  "availableModels": ["claude-sonnet-4-5", "haiku"],
  "env": {
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
  }
}

Ohne den env-Block würde ein Benutzer, der „Standard” in der Auswahl auswählt, die neueste Sonnet-Version erhalten und damit die Versionsfixierung in model und availableModels umgehen.

Merge-Verhalten

Wenn availableModels auf mehreren Ebenen gesetzt ist, z. B. in Benutzereinstellungen und Projekteinstellungen, werden Arrays zusammengeführt und dedupliziert. Um eine strikte Zulassungsliste durchzusetzen, setzen Sie availableModels in verwalteten oder Richtlinieneinstellungen, die die höchste Priorität haben.

Mantle-Modell-IDs

Wenn der Bedrock Mantle-Endpunkt aktiviert ist, werden Einträge in availableModels, die mit anthropic. beginnen, als benutzerdefinierte Optionen zur /model-Auswahl hinzugefügt und zum Mantle-Endpunkt weitergeleitet. Dies ist eine Ausnahme zu der in Modelle für Drittanbieter-Bereitstellungen fixieren beschriebenen Alias-Only-Übereinstimmung. Die Einstellung schränkt die Auswahl weiterhin auf aufgelistete Einträge ein, daher fügen Sie die Standard-Aliase zusammen mit allen Mantle-IDs ein.

Spezielles Modellverhalten

`default`-Modelleinstellung

Das Verhalten von default hängt von Ihrem Kontotyp ab:

Max und Team Premium: Standard ist Opus 4.7
Pro, Team Standard, Enterprise und Anthropic API: Standard ist Sonnet 4.6
Bedrock, Vertex und Foundry: Standard ist Sonnet 4.5

Claude Code kann automatisch auf Sonnet zurückfallen, wenn Sie einen Nutzungsschwellenwert mit Opus erreichen.

Am 23. April 2026 wird das Standardmodell für Enterprise-Pay-as-you-go- und Anthropic-API-Benutzer zu Opus 4.7 geändert. Um einen anderen Standard beizubehalten, setzen Sie ANTHROPIC_MODEL oder das model-Feld in Server-verwalteten Einstellungen.

`opusplan`-Modelleinstellung

Der opusplan-Modellalias bietet einen automatisierten Hybrid-Ansatz:

Im Plan-Modus - Verwendet opus für komplexes Reasoning und Architekturentscheidungen
Im Ausführungsmodus - Wechselt automatisch zu sonnet für Code-Generierung und Implementierung

Dies gibt Ihnen das Beste aus beiden Welten: Opus’s überlegenes Reasoning für die Planung und Sonnets Effizienz für die Ausführung. Die Plan-Modus-Opus-Phase wird mit dem Standard-200K-Kontextfenster ausgeführt. Die in Erweiterter Kontext beschriebene automatische 1M-Aktualisierung gilt für die opus-Modelleinstellung und erstreckt sich nicht auf opusplan.

Anpassung des Aufwandsniveaus

Aufwandsniveaus steuern adaptives Reasoning, das das Modell entscheiden lässt, ob und wie viel es bei jedem Schritt basierend auf der Aufgabenkomplexität denken soll. Niedrigerer Aufwand ist schneller und günstiger für unkomplizierte Aufgaben, während höherer Aufwand tieferes Reasoning für komplexe Probleme bietet. Aufwand wird auf Opus 4.7, Opus 4.6 und Sonnet 4.6 unterstützt. Die verfügbaren Ebenen hängen vom Modell ab:

Modell	Ebenen
Opus 4.7	`low`, `medium`, `high`, `xhigh`, `max`
Opus 4.6 und Sonnet 4.6	`low`, `medium`, `high`, `max`

Wenn Sie eine Ebene setzen, die das aktive Modell nicht unterstützt, greift Claude Code auf die höchste unterstützte Ebene bei oder unter der von Ihnen gesetzten zurück. Zum Beispiel wird xhigh auf Opus 4.6 als high ausgeführt. Ab v2.1.117 ist der Standard-Aufwand xhigh auf Opus 4.7 und high auf Opus 4.6 und Sonnet 4.6. Wenn Sie Opus 4.7 zum ersten Mal ausführen, wendet Claude Code xhigh an, auch wenn Sie zuvor ein anderes Aufwandsniveau für Opus 4.6 oder Sonnet 4.6 gesetzt haben. Führen Sie /effort erneut aus, um nach dem Wechsel ein anderes Niveau zu wählen. low, medium, high und xhigh bleiben über Sitzungen hinweg erhalten. max bietet das tiefste Reasoning ohne Einschränkung bei der Token-Ausgabe und gilt nur für die aktuelle Sitzung, außer wenn es über die CLAUDE_CODE_EFFORT_LEVEL-Umgebungsvariable gesetzt wird.

Wählen Sie ein Aufwandsniveau

Jede Ebene tauscht Token-Ausgabe gegen Fähigkeit. Der Standard eignet sich für die meisten Codierungsaufgaben; passen Sie an, wenn Sie ein anderes Gleichgewicht wünschen.

Ebene	Wann man es verwendet
`low`	Reservieren Sie für kurze, begrenzte, latenzempfindliche Aufgaben, die nicht intelligenzempfindlich sind
`medium`	Reduziert Token-Nutzung für kostensensitive Arbeiten, die etwas Intelligenz opfern können
`high`	Balanciert Token-Nutzung und Intelligenz. Verwenden Sie als Minimum für intelligenzempfindliche Arbeiten oder um Token-Ausgabe relativ zu `xhigh` zu reduzieren
`xhigh`	Beste Ergebnisse für die meisten Codierungs- und Agentenaufgaben. Empfohlener Standard bei Opus 4.7
`max`	Kann die Leistung bei anspruchsvollen Aufgaben verbessern, kann aber abnehmende Erträge zeigen und ist anfällig für Überdenken. Testen Sie vor breiter Übernahme

Die Aufwandsskala ist pro Modell kalibriert, daher stellt der gleiche Ebenenname nicht den gleichen zugrunde liegenden Wert über Modelle hinweg dar.

Verwenden Sie ultrathink für einmaliges tiefes Reasoning

Fügen Sie ultrathink überall in Ihrem Prompt ein, um tieferes Reasoning bei diesem Durchgang anzufordern, ohne Ihre Sitzungsaufwandseinstellung zu ändern. Claude Code erkennt das Schlüsselwort und fügt eine In-Context-Anweisung hinzu. Das an die API gesendete Aufwandsniveau bleibt unverändert. Andere Phrasen wie „think”, „think hard” und „think more” werden als gewöhnlicher Prompt-Text weitergeleitet und werden nicht als Schlüsselwörter erkannt.

Setzen Sie das Aufwandsniveau

Sie können Aufwand durch eine der folgenden Methoden ändern:

/effort: Führen Sie /effort ohne Argumente aus, um einen interaktiven Schieberegler zu öffnen, /effort gefolgt von einem Ebenennamen, um ihn direkt zu setzen, oder /effort auto, um auf den Modellstandard zurückzusetzen
In /model: Verwenden Sie die Pfeiltasten nach links/rechts, um den Aufwand-Schieberegler anzupassen, wenn Sie ein Modell auswählen
--effort-Flag: Übergeben Sie einen Ebenennamen, um ihn für eine einzelne Sitzung beim Starten von Claude Code zu setzen
Umgebungsvariable: Setzen Sie CLAUDE_CODE_EFFORT_LEVEL auf einen Ebenennamen oder auto
Einstellungen: Setzen Sie effortLevel auf low, medium, high oder xhigh in Ihrer Einstellungsdatei. max ist nur für Sitzungen und wird hier nicht akzeptiert
Skill- und Subagent-Frontmatter: Setzen Sie effort in einer Skill- oder Subagent-Markdown-Datei, um das Aufwandsniveau zu überschreiben, wenn dieser Skill oder Subagent ausgeführt wird

Die Umgebungsvariable hat Vorrang vor allen anderen Methoden, dann Ihre konfigurierte Ebene, dann der Modellstandard. Frontmatter-Aufwand gilt, wenn dieser Skill oder Subagent aktiv ist, und überschreibt die Sitzungsebene, aber nicht die Umgebungsvariable. Der Aufwand-Schieberegler erscheint in /model, wenn ein unterstütztes Modell ausgewählt ist. Das aktuelle Aufwandsniveau wird auch neben dem Logo und dem Spinner angezeigt, z. B. „with low effort”, damit Sie bestätigen können, welche Einstellung aktiv ist, ohne /model zu öffnen.

Adaptives Reasoning und feste Thinking-Budgets

Adaptives Reasoning macht Thinking bei jedem Schritt optional, daher kann Claude schneller auf Routine-Prompts reagieren und tieferes Denken für Schritte reservieren, die davon profitieren. Wenn Sie möchten, dass Claude häufiger oder seltener denkt als das aktuelle Niveau erzeugt, können Sie dies direkt in Ihrem Prompt oder in CLAUDE.md sagen; das Modell reagiert auf diese Anleitung innerhalb seiner Aufwandseinstellung. Opus 4.7 verwendet immer adaptives Reasoning. Der Modus mit festem Thinking-Budget und CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING gelten nicht dafür. Bei Opus 4.6 und Sonnet 4.6 können Sie CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 setzen, um zum vorherigen festen Thinking-Budget zurückzukehren, das von MAX_THINKING_TOKENS gesteuert wird. Siehe Umgebungsvariablen.

Erweitertes Thinking

Erweitertes Thinking ist das Reasoning, das Claude vor der Antwort ausgibt. Bei Modellen, die adaptives Reasoning unterstützen, ist das Aufwandsniveau die primäre Kontrolle dafür, wie viel Thinking stattfindet; die folgenden Einstellungen schalten Thinking ein oder aus und steuern, wie es angezeigt wird.

Kontrolle	Wie man es setzt
Umschalter für die aktuelle Sitzung	Drücken Sie `Option+T` auf macOS oder `Alt+T` auf Windows und Linux
Setzen Sie den globalen Standard	Führen Sie `/config` aus und schalten Sie den Thinking-Modus um. Gespeichert als `alwaysThinkingEnabled` in `~/.claude/settings.json`
Deaktivieren Sie unabhängig vom Aufwand	Setzen Sie `MAX_THINKING_TOKENS=0`. Andere Werte gelten nur mit einem festen Thinking-Budget

Die Thinking-Ausgabe ist standardmäßig zusammengeklappt. Drücken Sie Ctrl+O, um den ausführlichen Modus umzuschalten und das Reasoning als grauer kursiver Text zu sehen. Interaktive Sitzungen auf der Anthropic API erhalten standardmäßig redigierte Thinking-Blöcke, daher setzen Sie showThinkingSummaries: true in Einstellungen, wenn Sie die vollständigen Zusammenfassungen verfügbar haben möchten, wenn Sie erweitern. Ihnen werden alle generierten Thinking-Token berechnet, auch wenn sie zusammengeklappt oder redigiert sind.

Erweiterter Kontext

Opus 4.7, Opus 4.6 und Sonnet 4.6 unterstützen ein 1-Million-Token-Kontextfenster für lange Sitzungen mit großen Codebases. Die Verfügbarkeit variiert je nach Modell und Plan. Bei Max-, Team- und Enterprise-Plänen wird Opus automatisch auf 1M-Kontext ohne zusätzliche Konfiguration aktualisiert. Dies gilt für beide Team Standard- und Team Premium-Plätze. Sonnet mit 1M-Kontext ist nicht Teil der automatischen Aktualisierung und erfordert zusätzliche Nutzung bei jedem Abonnementplan, einschließlich Max.

Plan	Opus mit 1M-Kontext	Sonnet mit 1M-Kontext
Max, Team und Enterprise	Im Abonnement enthalten	Erfordert zusätzliche Nutzung
Pro	Erfordert zusätzliche Nutzung	Erfordert zusätzliche Nutzung
API und Pay-as-you-go	Vollständiger Zugriff	Vollständiger Zugriff

Um 1M-Kontext vollständig zu deaktivieren, setzen Sie CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Dies entfernt 1M-Modellvarianten aus der Modellauswahl. Siehe Umgebungsvariablen. Das 1M-Kontextfenster verwendet Standard-Modellpreise ohne Aufschlag für Token über 200K. Für Pläne, bei denen erweiterter Kontext in Ihrem Abonnement enthalten ist, bleibt die Nutzung von Ihrem Abonnement abgedeckt. Für Pläne, die über zusätzliche Nutzung auf erweiterten Kontext zugreifen, werden Token zur zusätzlichen Nutzung abgerechnet. Wenn Ihr Konto 1M-Kontext unterstützt, erscheint die Option in der Modellauswahl (/model) in den neuesten Versionen von Claude Code. Wenn Sie sie nicht sehen, versuchen Sie, Ihre Sitzung neu zu starten. Sie können auch das [1m]-Suffix mit Modellaliasen oder vollständigen Modellnamen verwenden:

# Verwenden Sie den opus[1m]- oder sonnet[1m]-Alias
/model opus[1m]
/model sonnet[1m]

# Oder fügen Sie [1m] an einen vollständigen Modellnamen an
/model claude-opus-4-7[1m]

Überprüfung Ihres aktuellen Modells

Sie können sehen, welches Modell Sie derzeit verwenden, auf mehrere Arten:

In der Statuszeile (falls konfiguriert)
In /status, das auch Ihre Kontoinformationen anzeigt.

Benutzerdefinierte Modelloption hinzufügen

Verwenden Sie ANTHROPIC_CUSTOM_MODEL_OPTION, um einen einzelnen benutzerdefinierten Eintrag zur /model-Auswahl hinzuzufügen, ohne die integrierten Aliase zu ersetzen. Dies ist nützlich zum Testen von Modell-IDs, die Claude Code standardmäßig nicht auflistet. Für LLM-Gateway-Bereitstellungen kann Claude Code die Auswahl vom /v1/models-Endpunkt des Gateways auffüllen, wenn CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 gesetzt ist. Daher ist diese Variable nur erforderlich, wenn die Erkennung deaktiviert ist oder das gewünschte Modell nicht zurückgibt. Siehe LLM-Gateway-Modellauswahl. Dieses Beispiel setzt alle drei Variablen, um eine Gateway-gesteuerte Opus-Bereitstellung auswählbar zu machen:

export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"

Der benutzerdefinierte Eintrag erscheint am unteren Ende der /model-Auswahl. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME und ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION sind optional. Wenn weggelassen, wird die Modell-ID als Name verwendet und die Beschreibung wird standardmäßig auf Custom model (<model-id>) gesetzt. Claude Code überspringt die Validierung für die Modell-ID, die in ANTHROPIC_CUSTOM_MODEL_OPTION gesetzt ist, daher können Sie jeden String verwenden, den Ihr API-Endpunkt akzeptiert.

Umgebungsvariablen

Sie können die folgenden Umgebungsvariablen verwenden, die vollständige Modellnamen (oder Äquivalente für Ihren API-Anbieter) sein müssen, um die Modellnamen zu steuern, auf die die Aliase verweisen.

Umgebungsvariable	Beschreibung
`ANTHROPIC_DEFAULT_OPUS_MODEL`	Das Modell, das für `opus` verwendet werden soll, oder für `opusplan`, wenn Plan Mode aktiv ist.
`ANTHROPIC_DEFAULT_SONNET_MODEL`	Das Modell, das für `sonnet` verwendet werden soll, oder für `opusplan`, wenn Plan Mode nicht aktiv ist.
`ANTHROPIC_DEFAULT_HAIKU_MODEL`	Das Modell, das für `haiku` verwendet werden soll, oder Hintergrundfunktionalität
`CLAUDE_CODE_SUBAGENT_MODEL`	Das Modell, das für Subagents verwendet werden soll

Hinweis: ANTHROPIC_SMALL_FAST_MODEL ist veraltet zugunsten von ANTHROPIC_DEFAULT_HAIKU_MODEL.

Modelle für Drittanbieter-Bereitstellungen fixieren

Beim Bereitstellen von Claude Code über Bedrock, Vertex AI, Foundry oder Claude Platform on AWS sollten Sie Modellversionen vor dem Rollout für Benutzer fixieren. Ohne Fixierung verwendet Claude Code Modellaliase (sonnet, opus, haiku), die zur neuesten Version aufgelöst werden. Wenn Anthropic ein neues Modell veröffentlicht, das noch nicht in einem Benutzerkonto aktiviert ist, sehen Bedrock- und Vertex AI-Benutzer einen Hinweis und greifen für diese Sitzung auf die vorherige Version zurück, während Foundry-Benutzer Fehler sehen, da Foundry keine entsprechende Startprüfung hat.

Setzen Sie alle drei Modell-Umgebungsvariablen auf spezifische Versions-IDs als Teil Ihres anfänglichen Setups. Das Fixieren ermöglicht es Ihnen, zu kontrollieren, wann Ihre Benutzer zu einem neuen Modell wechseln.

Verwenden Sie die folgenden Umgebungsvariablen mit versionsspezifischen Modell-IDs für Ihren Anbieter:

Anbieter	Beispiel
Bedrock	`export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-7'`
Vertex AI	`export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7'`
Foundry	`export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7'`

Wenden Sie das gleiche Muster auf ANTHROPIC_DEFAULT_SONNET_MODEL und ANTHROPIC_DEFAULT_HAIKU_MODEL an. Für aktuelle und ältere Modell-IDs über alle Anbieter hinweg siehe Modellübersicht. Um Benutzer auf eine neue Modellversion zu aktualisieren, aktualisieren Sie diese Umgebungsvariablen und stellen Sie erneut bereit. Um erweiterten Kontext für ein fixiertes Modell zu aktivieren, fügen Sie [1m] an die Modell-ID in ANTHROPIC_DEFAULT_OPUS_MODEL oder ANTHROPIC_DEFAULT_SONNET_MODEL an:

export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7[1m]'

Das [1m]-Suffix wendet das 1M-Kontextfenster auf alle Verwendungen dieses Alias an, einschließlich opusplan. Claude Code entfernt das Suffix, bevor die Modell-ID an Ihren Anbieter gesendet wird. Fügen Sie [1m] nur an, wenn das zugrunde liegende Modell 1M-Kontext unterstützt, z. B. Opus 4.7 oder Sonnet 4.6.

Die settings.availableModels-Zulassungsliste gilt weiterhin bei Verwendung von Drittanbieter-Anbietern. Die Filterung stimmt mit dem Modellalias (opus, sonnet, haiku) überein, nicht mit der anbieterspezifischen Modell-ID.

Anzeige und Funktionen des fixierten Modells anpassen

Wenn Sie ein Modell bei einem Drittanbieter fixieren, erscheint die anbieterspezifische ID in der /model-Auswahl und Claude Code erkennt möglicherweise nicht, welche Funktionen das Modell unterstützt. Sie können den Anzeigenamen und die deklarierten Funktionen mit Begleit-Umgebungsvariablen für jedes fixierte Modell überschreiben. Diese Variablen wirken sich auf Drittanbieter wie Bedrock, Vertex AI und Foundry aus. Die Variablen _NAME und _DESCRIPTION wirken sich auch aus, wenn ANTHROPIC_BASE_URL auf ein LLM-Gateway verweist. Sie haben keine Auswirkung bei direkter Verbindung zu api.anthropic.com.

Umgebungsvariable	Beschreibung
`ANTHROPIC_DEFAULT_OPUS_MODEL_NAME`	Anzeigename für das fixierte Opus-Modell in der `/model`-Auswahl. Standardmäßig die Modell-ID, wenn nicht gesetzt
`ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION`	Anzeige-Beschreibung für das fixierte Opus-Modell in der `/model`-Auswahl. Standardmäßig `Custom Opus model`, wenn nicht gesetzt
`ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES`	Komma-getrennte Liste der Funktionen, die das fixierte Opus-Modell unterstützt

Die gleichen _NAME-, _DESCRIPTION- und _SUPPORTED_CAPABILITIES-Suffixe sind für ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL und ANTHROPIC_CUSTOM_MODEL_OPTION verfügbar. Claude Code aktiviert Funktionen wie Aufwandsniveaus und erweitertes Denken durch Abgleich der Modell-ID mit bekannten Mustern. Anbieterspezifische IDs wie Bedrock-ARNs oder benutzerdefinierte Bereitstellungsnamen stimmen oft nicht mit diesen Mustern überein, wodurch unterstützte Funktionen deaktiviert bleiben. Setzen Sie _SUPPORTED_CAPABILITIES, um Claude Code mitzuteilen, welche Funktionen das Modell tatsächlich unterstützt:

Funktionswert	Aktiviert
`effort`	Aufwandsniveaus und der `/effort`-Befehl
`xhigh_effort`	Das `xhigh`-Aufwandsniveau
`max_effort`	Das `max`-Aufwandsniveau
`thinking`	Erweitertes Denken
`adaptive_thinking`	Adaptives Reasoning, das das Denken dynamisch basierend auf der Aufgabenkomplexität zuordnet
`interleaved_thinking`	Denken zwischen Tool-Aufrufen

Wenn _SUPPORTED_CAPABILITIES gesetzt ist, werden aufgelistete Funktionen aktiviert und nicht aufgelistete Funktionen werden für das entsprechende fixierte Modell deaktiviert. Wenn die Variable nicht gesetzt ist, greift Claude Code auf die integrierte Erkennung basierend auf der Modell-ID zurück. Dieses Beispiel fixiert Opus auf ein benutzerdefiniertes Bedrock-Modell-ARN, setzt einen benutzerfreundlichen Namen und deklariert seine Funktionen:

export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'

Modell-IDs pro Version überschreiben

Die oben genannten Umgebungsvariablen auf Familienebene konfigurieren eine Modell-ID pro Familienalias. Wenn Sie mehrere Versionen innerhalb der gleichen Familie auf unterschiedliche Anbieter-IDs abbilden müssen, verwenden Sie stattdessen die modelOverrides-Einstellung. modelOverrides ordnet einzelne Anthropic-Modell-IDs den anbieterspezifischen Strings zu, die Claude Code an die API Ihres Anbieters sendet. Wenn ein Benutzer ein zugeordnetes Modell in der /model-Auswahl auswählt, verwendet Claude Code Ihren konfigurierten Wert anstelle des integrierten Standards. Dies ermöglicht es Enterprise-Administratoren, jede Modellversion zu einem bestimmten Bedrock-Inference-Profil-ARN, Vertex AI-Versionsnamen oder Foundry-Bereitstellungsnamen für Governance, Kostenzuteilung oder regionales Routing zu leiten. Setzen Sie modelOverrides in Ihrer Einstellungsdatei:

{
  "modelOverrides": {
    "claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
    "claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
    "claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
  }
}

Schlüssel müssen Anthropic-Modell-IDs sein, wie in der Modellübersicht aufgelistet. Für datierte Modell-IDs fügen Sie das Datumssuffix genau so ein, wie es dort angezeigt wird. Unbekannte Schlüssel werden ignoriert. Überschreibungen ersetzen die integrierten Modell-IDs, die jeden Eintrag in der /model-Auswahl unterstützen. Bei Bedrock haben Überschreibungen Vorrang vor allen Inference-Profilen, die Claude Code beim Start automatisch erkennt. Werte, die Sie direkt über ANTHROPIC_MODEL, --model oder die ANTHROPIC_DEFAULT_*_MODEL-Umgebungsvariablen bereitstellen, werden unverändert an den Anbieter übergeben und werden nicht durch modelOverrides transformiert. modelOverrides funktioniert zusammen mit availableModels. Die Zulassungsliste wird gegen die Anthropic-Modell-ID ausgewertet, nicht gegen den Überschreibungswert, daher ein Eintrag wie "opus" in availableModels stimmt weiterhin überein, auch wenn Opus-Versionen ARNs zugeordnet sind.

Prompt-Caching-Konfiguration

Claude Code verwendet automatisch Prompt-Caching, um die Leistung zu optimieren und Kosten zu senken. Sie können Prompt-Caching global oder für bestimmte Modell-Tiers deaktivieren:

Umgebungsvariable	Beschreibung
`DISABLE_PROMPT_CACHING`	Setzen Sie auf `1`, um Prompt-Caching für alle Modelle zu deaktivieren (hat Vorrang vor modellspezifischen Einstellungen)
`DISABLE_PROMPT_CACHING_HAIKU`	Setzen Sie auf `1`, um Prompt-Caching nur für Haiku-Modelle zu deaktivieren
`DISABLE_PROMPT_CACHING_SONNET`	Setzen Sie auf `1`, um Prompt-Caching nur für Sonnet-Modelle zu deaktivieren
`DISABLE_PROMPT_CACHING_OPUS`	Setzen Sie auf `1`, um Prompt-Caching nur für Opus-Modelle zu deaktivieren

Diese Umgebungsvariablen geben Ihnen eine feinkörnige Kontrolle über das Prompt-Caching-Verhalten. Die globale DISABLE_PROMPT_CACHING-Einstellung hat Vorrang vor den modellspezifischen Einstellungen, sodass Sie alle Caching schnell deaktivieren können, wenn nötig. Die modellspezifischen Einstellungen sind nützlich für selektive Kontrolle, z. B. beim Debuggen bestimmter Modelle oder bei der Arbeit mit Cloud-Anbietern, die möglicherweise unterschiedliche Caching-Implementierungen haben.

Einstellungen und Berechtigungen

Modell und Antworten

Benutzeroberfläche

Verfügbare Modelle

Modellaliase

Einstellung Ihres Modells

Modellauswahl einschränken

Standardmodell-Verhalten

Kontrollieren Sie das Modell, auf dem Benutzer ausgeführt werden

Merge-Verhalten

Mantle-Modell-IDs

Spezielles Modellverhalten

`default`-Modelleinstellung

`opusplan`-Modelleinstellung

Anpassung des Aufwandsniveaus

Wählen Sie ein Aufwandsniveau

Verwenden Sie ultrathink für einmaliges tiefes Reasoning

Setzen Sie das Aufwandsniveau

Adaptives Reasoning und feste Thinking-Budgets

Erweitertes Thinking

Erweiterter Kontext

Überprüfung Ihres aktuellen Modells

Benutzerdefinierte Modelloption hinzufügen

Umgebungsvariablen

Modelle für Drittanbieter-Bereitstellungen fixieren

Anzeige und Funktionen des fixierten Modells anpassen

Modell-IDs pro Version überschreiben

Prompt-Caching-Konfiguration

Einstellungen und Berechtigungen

Modell und Antworten

Benutzeroberfläche

Documentation Index

​Verfügbare Modelle

​Modellaliase

​Einstellung Ihres Modells

​Modellauswahl einschränken

​Standardmodell-Verhalten

​Kontrollieren Sie das Modell, auf dem Benutzer ausgeführt werden

​Merge-Verhalten

​Mantle-Modell-IDs

​Spezielles Modellverhalten

​default-Modelleinstellung

​opusplan-Modelleinstellung

​Anpassung des Aufwandsniveaus

​Wählen Sie ein Aufwandsniveau

​Verwenden Sie ultrathink für einmaliges tiefes Reasoning

​Setzen Sie das Aufwandsniveau

​Adaptives Reasoning und feste Thinking-Budgets

​Erweitertes Thinking

​Erweiterter Kontext

​Überprüfung Ihres aktuellen Modells

​Benutzerdefinierte Modelloption hinzufügen

​Umgebungsvariablen

​Modelle für Drittanbieter-Bereitstellungen fixieren

​Anzeige und Funktionen des fixierten Modells anpassen

​Modell-IDs pro Version überschreiben

​Prompt-Caching-Konfiguration

Verfügbare Modelle

Modellaliase

Einstellung Ihres Modells

Modellauswahl einschränken

Standardmodell-Verhalten

Kontrollieren Sie das Modell, auf dem Benutzer ausgeführt werden

Merge-Verhalten

Mantle-Modell-IDs

Spezielles Modellverhalten

`default`-Modelleinstellung

`opusplan`-Modelleinstellung

Anpassung des Aufwandsniveaus

Wählen Sie ein Aufwandsniveau

Verwenden Sie ultrathink für einmaliges tiefes Reasoning

Setzen Sie das Aufwandsniveau

Adaptives Reasoning und feste Thinking-Budgets

Erweitertes Thinking

Erweiterter Kontext

Überprüfung Ihres aktuellen Modells

Benutzerdefinierte Modelloption hinzufügen

Umgebungsvariablen

Modelle für Drittanbieter-Bereitstellungen fixieren

Anzeige und Funktionen des fixierten Modells anpassen

Modell-IDs pro Version überschreiben

Prompt-Caching-Konfiguration