Zum Hauptinhalt springen

Verfügbare Modelle

Für die model-Einstellung in Claude Code können Sie konfigurieren:
  • Einen Modellalias
  • Einen Modellnamen
    • Anthropic API: Einen vollständigen Modellnamen
    • Bedrock: ein Inference-Profil-ARN
    • Foundry: einen Bereitstellungsnamen
    • Vertex: einen Versionsnamen

Modellaliase

Modellaliase bieten eine bequeme Möglichkeit, Modelleinstellungen auszuwählen, ohne sich genaue Versionsnummern merken zu müssen:
ModellaliasVerhalten
defaultEmpfohlene Modelleinstellung, abhängig von Ihrem Kontotyp
sonnetVerwendet das neueste Sonnet-Modell (derzeit Sonnet 4.6) für tägliche Codierungsaufgaben
opusVerwendet das neueste Opus-Modell (derzeit Opus 4.6) für komplexe Reasoning-Aufgaben
haikuVerwendet das schnelle und effiziente Haiku-Modell für einfache Aufgaben
sonnet[1m]Verwendet Sonnet mit einem 1-Million-Token-Kontextfenster für lange Sitzungen
opus[1m]Verwendet Opus mit einem 1-Million-Token-Kontextfenster für lange Sitzungen
opusplanSpezieller Modus, der opus während des Plan-Modus verwendet und dann zu sonnet für die Ausführung wechselt
Aliase verweisen immer auf die neueste Version. Um eine bestimmte Version zu fixieren, verwenden Sie den vollständigen Modellnamen (z. B. claude-opus-4-6) oder setzen Sie die entsprechende Umgebungsvariable wie ANTHROPIC_DEFAULT_OPUS_MODEL.

Einstellung Ihres Modells

Sie können Ihr Modell auf mehrere Arten konfigurieren, aufgelistet nach Priorität:
  1. Während der Sitzung - Verwenden Sie /model <alias|name>, um Modelle während der Sitzung zu wechseln
  2. Beim Start - Starten Sie mit claude --model <alias|name>
  3. Umgebungsvariable - Setzen Sie ANTHROPIC_MODEL=<alias|name>
  4. Einstellungen - Konfigurieren Sie dauerhaft in Ihrer Einstellungsdatei mit dem model-Feld.
Beispielverwendung:
# Mit Opus starten
claude --model opus

# Während der Sitzung zu Sonnet wechseln
/model sonnet
Beispiel-Einstellungsdatei:
{
    "permissions": {
        ...
    },
    "model": "opus"
}

Modellauswahl einschränken

Enterprise-Administratoren können availableModels in verwalteten oder Richtlinieneinstellungen verwenden, um einzuschränken, welche Modelle Benutzer auswählen können. Wenn availableModels gesetzt ist, können Benutzer nicht über /model, das --model-Flag, das Config-Tool oder die ANTHROPIC_MODEL-Umgebungsvariable zu Modellen wechseln, die nicht in der Liste enthalten sind.
{
  "availableModels": ["sonnet", "haiku"]
}

Standardmodell-Verhalten

Die Option „Standard” in der Modellauswahl wird von availableModels nicht beeinflusst. Sie bleibt immer verfügbar und stellt den Laufzeit-Standard des Systems dar, basierend auf dem Abonnement-Tier des Benutzers. Auch mit availableModels: [] können Benutzer Claude Code weiterhin mit dem Standardmodell für ihren Tier verwenden.

Kontrollieren Sie das Modell, auf dem Benutzer ausgeführt werden

Um die Modellerfahrung vollständig zu kontrollieren, verwenden Sie availableModels zusammen mit der model-Einstellung:
  • availableModels: schränkt ein, worauf Benutzer wechseln können
  • model: setzt die explizite Modellüberschreibung, die Vorrang vor dem Standard hat
Dieses Beispiel stellt sicher, dass alle Benutzer Sonnet 4.6 ausführen und nur zwischen Sonnet und Haiku wählen können:
{
  "model": "sonnet",
  "availableModels": ["sonnet", "haiku"]
}

Merge-Verhalten

Wenn availableModels auf mehreren Ebenen gesetzt ist, z. B. in Benutzereinstellungen und Projekteinstellungen, werden Arrays zusammengeführt und dedupliziert. Um eine strikte Zulassungsliste durchzusetzen, setzen Sie availableModels in verwalteten oder Richtlinieneinstellungen, die die höchste Priorität haben.

Spezielles Modellverhalten

default-Modelleinstellung

Das Verhalten von default hängt von Ihrem Kontotyp ab:
  • Max und Team Premium: Standard ist Opus 4.6
  • Pro und Team Standard: Standard ist Sonnet 4.6
  • Enterprise: Opus 4.6 ist verfügbar, aber nicht der Standard
Claude Code kann automatisch auf Sonnet zurückfallen, wenn Sie einen Nutzungsschwellenwert mit Opus erreichen.

opusplan-Modelleinstellung

Der opusplan-Modellalias bietet einen automatisierten Hybrid-Ansatz:
  • Im Plan-Modus - Verwendet opus für komplexes Reasoning und Architekturentscheidungen
  • Im Ausführungsmodus - Wechselt automatisch zu sonnet für Code-Generierung und Implementierung
Dies gibt Ihnen das Beste aus beiden Welten: Opus’s überlegenes Reasoning für die Planung und Sonnets Effizienz für die Ausführung.

Anpassung des Aufwandsniveaus

Aufwandsniveaus steuern adaptives Reasoning, das das Denken dynamisch basierend auf der Aufgabenkomplexität zuordnet. Niedrigerer Aufwand ist schneller und günstiger für unkomplizierte Aufgaben, während höherer Aufwand tieferes Reasoning für komplexe Probleme bietet. Drei Ebenen bleiben über Sitzungen hinweg erhalten: low, medium und high. Eine vierte Ebene, max, bietet das tiefste Reasoning ohne Einschränkung bei der Token-Ausgabe, daher sind Antworten langsamer und kosten mehr als bei high. max ist nur auf Opus 4.6 verfügbar und bleibt nicht über Sitzungen hinweg erhalten, außer durch die CLAUDE_CODE_EFFORT_LEVEL-Umgebungsvariable. Opus 4.6 und Sonnet 4.6 haben standardmäßig mittleren Aufwand. Dies gilt für alle Anbieter, einschließlich Bedrock, Vertex AI und direktem API-Zugriff. Medium ist die empfohlene Ebene für die meisten Codierungsaufgaben: Sie bietet ein Gleichgewicht zwischen Geschwindigkeit und Reasoning-Tiefe, und höhere Ebenen können dazu führen, dass das Modell Routinearbeiten überdenkt. Reservieren Sie high oder max für Aufgaben, die wirklich von tieferem Reasoning profitieren, wie z. B. schwierige Debugging-Probleme oder komplexe Architekturentscheidungen. Für einmaliges tiefes Reasoning ohne Änderung Ihrer Sitzungseinstellung fügen Sie „ultrathink” in Ihren Prompt ein, um hohen Aufwand für diesen Durchgang auszulösen. Aufwand einstellen:
  • /effort: Führen Sie /effort low, /effort medium, /effort high oder /effort max aus, um die Ebene zu ändern, oder /effort auto, um auf den Modellstandard zurückzusetzen
  • In /model: Verwenden Sie die Pfeiltasten nach links/rechts, um den Aufwand-Schieberegler anzupassen, wenn Sie ein Modell auswählen
  • --effort-Flag: Übergeben Sie low, medium, high oder max, um die Ebene für eine einzelne Sitzung beim Starten von Claude Code festzulegen
  • Umgebungsvariable: Setzen Sie CLAUDE_CODE_EFFORT_LEVEL auf low, medium, high, max oder auto
  • Einstellungen: Setzen Sie effortLevel in Ihrer Einstellungsdatei auf "low", "medium" oder "high"
  • Skill- und Subagent-Frontmatter: Setzen Sie effort in einer Skill- oder Subagent-Markdown-Datei, um das Aufwandsniveau zu überschreiben, wenn dieser Skill oder Subagent ausgeführt wird
Die Umgebungsvariable hat Vorrang vor allen anderen Methoden, dann Ihre konfigurierte Ebene, dann der Modellstandard. Frontmatter-Aufwand gilt, wenn dieser Skill oder Subagent aktiv ist, und überschreibt die Sitzungsebene, aber nicht die Umgebungsvariable. Der Aufwand wird auf Opus 4.6 und Sonnet 4.6 unterstützt. Der Aufwand-Schieberegler erscheint in /model, wenn ein unterstütztes Modell ausgewählt ist. Das aktuelle Aufwandsniveau wird auch neben dem Logo und dem Spinner angezeigt, z. B. „with low effort”, damit Sie bestätigen können, welche Einstellung aktiv ist, ohne /model zu öffnen. Um adaptives Reasoning auf Opus 4.6 und Sonnet 4.6 zu deaktivieren und zum vorherigen festen Thinking-Budget zurückzukehren, setzen Sie CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1. Wenn deaktiviert, verwenden diese Modelle das feste Budget, das von MAX_THINKING_TOKENS gesteuert wird. Siehe Umgebungsvariablen.

Erweiterter Kontext

Opus 4.6 und Sonnet 4.6 unterstützen ein 1-Million-Token-Kontextfenster für lange Sitzungen mit großen Codebases. Die Verfügbarkeit variiert je nach Modell und Plan. Bei Max-, Team- und Enterprise-Plänen wird Opus automatisch auf 1M-Kontext ohne zusätzliche Konfiguration aktualisiert. Dies gilt für beide Team Standard- und Team Premium-Plätze.
PlanOpus 4.6 mit 1M-KontextSonnet 4.6 mit 1M-Kontext
Max, Team und EnterpriseIm Abonnement enthaltenErfordert zusätzliche Nutzung
ProErfordert zusätzliche NutzungErfordert zusätzliche Nutzung
API und Pay-as-you-goVollständiger ZugriffVollständiger Zugriff
Um 1M-Kontext vollständig zu deaktivieren, setzen Sie CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Dies entfernt 1M-Modellvarianten aus der Modellauswahl. Siehe Umgebungsvariablen. Das 1M-Kontextfenster verwendet Standard-Modellpreise ohne Aufschlag für Token über 200K. Für Pläne, bei denen erweiterter Kontext in Ihrem Abonnement enthalten ist, bleibt die Nutzung von Ihrem Abonnement abgedeckt. Für Pläne, die über zusätzliche Nutzung auf erweiterten Kontext zugreifen, werden Token zur zusätzlichen Nutzung abgerechnet. Wenn Ihr Konto 1M-Kontext unterstützt, erscheint die Option in der Modellauswahl (/model) in den neuesten Versionen von Claude Code. Wenn Sie sie nicht sehen, versuchen Sie, Ihre Sitzung neu zu starten. Sie können auch das [1m]-Suffix mit Modellaliasen oder vollständigen Modellnamen verwenden:
# Verwenden Sie den opus[1m]- oder sonnet[1m]-Alias
/model opus[1m]
/model sonnet[1m]

# Oder fügen Sie [1m] an einen vollständigen Modellnamen an
/model claude-opus-4-6[1m]

Überprüfung Ihres aktuellen Modells

Sie können sehen, welches Modell Sie derzeit verwenden, auf mehrere Arten:
  1. In der Statuszeile (falls konfiguriert)
  2. In /status, das auch Ihre Kontoinformationen anzeigt.

Benutzerdefinierte Modelloption hinzufügen

Verwenden Sie ANTHROPIC_CUSTOM_MODEL_OPTION, um einen einzelnen benutzerdefinierten Eintrag zur /model-Auswahl hinzuzufügen, ohne die integrierten Aliase zu ersetzen. Dies ist nützlich für LLM-Gateway-Bereitstellungen oder zum Testen von Modell-IDs, die Claude Code standardmäßig nicht auflistet. Dieses Beispiel setzt alle drei Variablen, um eine Gateway-gesteuerte Opus-Bereitstellung auswählbar zu machen:
export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-6"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"
Der benutzerdefinierte Eintrag erscheint am unteren Ende der /model-Auswahl. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME und ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION sind optional. Wenn weggelassen, wird die Modell-ID als Name verwendet und die Beschreibung wird standardmäßig auf Custom model (<model-id>) gesetzt. Claude Code überspringt die Validierung für die Modell-ID, die in ANTHROPIC_CUSTOM_MODEL_OPTION gesetzt ist, daher können Sie jeden String verwenden, den Ihr API-Endpunkt akzeptiert.

Umgebungsvariablen

Sie können die folgenden Umgebungsvariablen verwenden, die vollständige Modellnamen (oder Äquivalente für Ihren API-Anbieter) sein müssen, um die Modellnamen zu steuern, auf die die Aliase verweisen.
UmgebungsvariableBeschreibung
ANTHROPIC_DEFAULT_OPUS_MODELDas Modell, das für opus verwendet werden soll, oder für opusplan, wenn Plan Mode aktiv ist.
ANTHROPIC_DEFAULT_SONNET_MODELDas Modell, das für sonnet verwendet werden soll, oder für opusplan, wenn Plan Mode nicht aktiv ist.
ANTHROPIC_DEFAULT_HAIKU_MODELDas Modell, das für haiku verwendet werden soll, oder Hintergrundfunktionalität
CLAUDE_CODE_SUBAGENT_MODELDas Modell, das für Subagents verwendet werden soll
Hinweis: ANTHROPIC_SMALL_FAST_MODEL ist veraltet zugunsten von ANTHROPIC_DEFAULT_HAIKU_MODEL.

Modelle für Drittanbieter-Bereitstellungen fixieren

Beim Bereitstellen von Claude Code über Bedrock, Vertex AI oder Foundry sollten Sie Modellversionen vor dem Rollout für Benutzer fixieren. Ohne Fixierung verwendet Claude Code Modellaliase (sonnet, opus, haiku), die zur neuesten Version aufgelöst werden. Wenn Anthropic ein neues Modell veröffentlicht, werden Benutzer, deren Konten die neue Version nicht aktiviert haben, stillschweigend unterbrochen.
Setzen Sie alle drei Modell-Umgebungsvariablen auf spezifische Versions-IDs als Teil Ihres anfänglichen Setups. Das Überspringen dieses Schritts bedeutet, dass ein Claude Code-Update Ihre Benutzer ohne Maßnahmen Ihrerseits unterbrechen kann.
Verwenden Sie die folgenden Umgebungsvariablen mit versionsspezifischen Modell-IDs für Ihren Anbieter:
AnbieterBeispiel
Bedrockexport ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-6-v1'
Vertex AIexport ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-6'
Foundryexport ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-6'
Wenden Sie das gleiche Muster auf ANTHROPIC_DEFAULT_SONNET_MODEL und ANTHROPIC_DEFAULT_HAIKU_MODEL an. Für aktuelle und ältere Modell-IDs über alle Anbieter hinweg siehe Modellübersicht. Um Benutzer auf eine neue Modellversion zu aktualisieren, aktualisieren Sie diese Umgebungsvariablen und stellen Sie erneut bereit. Um erweiterten Kontext für ein fixiertes Modell zu aktivieren, fügen Sie [1m] an die Modell-ID in ANTHROPIC_DEFAULT_OPUS_MODEL oder ANTHROPIC_DEFAULT_SONNET_MODEL an:
export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-6[1m]'
Das [1m]-Suffix wendet das 1M-Kontextfenster auf alle Verwendungen dieses Alias an, einschließlich opusplan. Claude Code entfernt das Suffix, bevor die Modell-ID an Ihren Anbieter gesendet wird. Fügen Sie [1m] nur an, wenn das zugrunde liegende Modell 1M-Kontext unterstützt, z. B. Opus 4.6 oder Sonnet 4.6.
Die settings.availableModels-Zulassungsliste gilt weiterhin bei Verwendung von Drittanbieter-Anbietern. Die Filterung stimmt mit dem Modellalias (opus, sonnet, haiku) überein, nicht mit der anbieterspezifischen Modell-ID.

Modell-IDs pro Version überschreiben

Die oben genannten Umgebungsvariablen auf Familienebene konfigurieren eine Modell-ID pro Familienalias. Wenn Sie mehrere Versionen innerhalb der gleichen Familie auf unterschiedliche Anbieter-IDs abbilden müssen, verwenden Sie stattdessen die modelOverrides-Einstellung. modelOverrides ordnet einzelne Anthropic-Modell-IDs den anbieterspezifischen Strings zu, die Claude Code an die API Ihres Anbieters sendet. Wenn ein Benutzer ein zugeordnetes Modell in der /model-Auswahl auswählt, verwendet Claude Code Ihren konfigurierten Wert anstelle des integrierten Standards. Dies ermöglicht es Enterprise-Administratoren, jede Modellversion zu einem bestimmten Bedrock-Inference-Profil-ARN, Vertex AI-Versionsnamen oder Foundry-Bereitstellungsnamen für Governance, Kostenzuteilung oder regionales Routing zu leiten. Setzen Sie modelOverrides in Ihrer Einstellungsdatei:
{
  "modelOverrides": {
    "claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
    "claude-opus-4-5-20251101": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-45-prod",
    "claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
  }
}
Schlüssel müssen Anthropic-Modell-IDs sein, wie in der Modellübersicht aufgelistet. Für datierte Modell-IDs fügen Sie das Datumssuffix genau so ein, wie es dort angezeigt wird. Unbekannte Schlüssel werden ignoriert. Überschreibungen ersetzen die integrierten Modell-IDs, die jeden Eintrag in der /model-Auswahl unterstützen. Bei Bedrock haben Überschreibungen Vorrang vor allen Inference-Profilen, die Claude Code beim Start automatisch erkennt. Werte, die Sie direkt über ANTHROPIC_MODEL, --model oder die ANTHROPIC_DEFAULT_*_MODEL-Umgebungsvariablen bereitstellen, werden unverändert an den Anbieter übergeben und werden nicht durch modelOverrides transformiert. modelOverrides funktioniert zusammen mit availableModels. Die Zulassungsliste wird gegen die Anthropic-Modell-ID ausgewertet, nicht gegen den Überschreibungswert, daher ein Eintrag wie "opus" in availableModels stimmt weiterhin überein, auch wenn Opus-Versionen ARNs zugeordnet sind.

Prompt-Caching-Konfiguration

Claude Code verwendet automatisch Prompt-Caching, um die Leistung zu optimieren und Kosten zu senken. Sie können Prompt-Caching global oder für bestimmte Modell-Tiers deaktivieren:
UmgebungsvariableBeschreibung
DISABLE_PROMPT_CACHINGSetzen Sie auf 1, um Prompt-Caching für alle Modelle zu deaktivieren (hat Vorrang vor modellspezifischen Einstellungen)
DISABLE_PROMPT_CACHING_HAIKUSetzen Sie auf 1, um Prompt-Caching nur für Haiku-Modelle zu deaktivieren
DISABLE_PROMPT_CACHING_SONNETSetzen Sie auf 1, um Prompt-Caching nur für Sonnet-Modelle zu deaktivieren
DISABLE_PROMPT_CACHING_OPUSSetzen Sie auf 1, um Prompt-Caching nur für Opus-Modelle zu deaktivieren
Diese Umgebungsvariablen geben Ihnen eine feinkörnige Kontrolle über das Prompt-Caching-Verhalten. Die globale DISABLE_PROMPT_CACHING-Einstellung hat Vorrang vor den modellspezifischen Einstellungen, sodass Sie alle Caching schnell deaktivieren können, wenn nötig. Die modellspezifischen Einstellungen sind nützlich für selektive Kontrolle, z. B. beim Debuggen bestimmter Modelle oder bei der Arbeit mit Cloud-Anbietern, die möglicherweise unterschiedliche Caching-Implementierungen haben.