Documentation Index
Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
Modèles disponibles
Pour le paramètre model dans Claude Code, vous pouvez configurer l’un des éléments suivants :
- Un alias de modèle
- Un nom de modèle
- API Anthropic : un nom de modèle complet
- Bedrock : un ARN de profil d’inférence
- Foundry : un nom de déploiement
- Vertex : un nom de version
ANTHROPIC_BASE_URL change l’endroit où les demandes sont envoyées, et non le modèle qui y répond. Pour acheminer Claude via une passerelle LLM, consultez la configuration de la passerelle LLM.
Alias de modèle
Les alias de modèle offrent un moyen pratique de sélectionner les paramètres du modèle sans avoir à mémoriser les numéros de version exacts :
| Alias de modèle | Comportement |
|---|
default | Valeur spéciale qui efface tout remplacement de modèle et revient au modèle recommandé pour votre type de compte. N’est pas en soi un alias de modèle |
best | Utilise le modèle disponible le plus capable, actuellement équivalent à opus |
sonnet | Utilise le dernier modèle Sonnet pour les tâches de codage quotidiennes |
opus | Utilise le dernier modèle Opus pour les tâches de raisonnement complexe |
haiku | Utilise le modèle Haiku rapide et efficace pour les tâches simples |
sonnet[1m] | Utilise Sonnet avec une fenêtre de contexte de 1 million de tokens pour les sessions longues |
opus[1m] | Utilise Opus avec une fenêtre de contexte de 1 million de tokens pour les sessions longues |
opusplan | Mode spécial qui utilise opus pendant le mode plan, puis bascule vers sonnet pour l’exécution |
Sur l’API Anthropic et Claude Platform on AWS, opus se résout en Opus 4.7 et sonnet se résout en Sonnet 4.6. Sur Bedrock, Vertex et Foundry, opus se résout en Opus 4.6 et sonnet se résout en Sonnet 4.5 ; les modèles plus récents sont disponibles sur ces fournisseurs en sélectionnant le nom de modèle complet explicitement ou en définissant ANTHROPIC_DEFAULT_OPUS_MODEL ou ANTHROPIC_DEFAULT_SONNET_MODEL.
Les alias pointent vers la version recommandée pour votre fournisseur et se mettent à jour au fil du temps. Pour épingler une version spécifique, utilisez le nom de modèle complet (par exemple, claude-opus-4-7) ou définissez la variable d’environnement correspondante comme ANTHROPIC_DEFAULT_OPUS_MODEL.
Opus 4.7 nécessite Claude Code v2.1.111 ou version ultérieure. Exécutez claude update pour mettre à niveau.
Définir votre modèle
Vous pouvez configurer votre modèle de plusieurs façons, énumérées par ordre de priorité :
- Pendant la session - Utilisez
/model <alias|name> pour basculer immédiatement, ou exécutez /model sans argument pour ouvrir le sélecteur. Le sélecteur demande une confirmation lorsque la conversation a une sortie antérieure, car la réponse suivante relit l’historique complet sans contexte en cache
- Au démarrage - Lancez avec
claude --model <alias|name>
- Variable d’environnement - Définissez
ANTHROPIC_MODEL=<alias|name>
- Paramètres - Configurez de manière permanente dans votre fichier de paramètres en utilisant le champ
model.
Votre sélection /model est enregistrée dans les paramètres utilisateur et persiste entre les redémarrages. À partir de la v2.1.117, si le fichier .claude/settings.json du projet épingle un modèle différent, Claude Code écrit également votre choix dans .claude/settings.local.json afin qu’il continue à s’appliquer dans ce projet après un redémarrage. Les paramètres gérés ont la priorité et se réappliquent au prochain lancement.
L’indicateur --model et la variable d’environnement ANTHROPIC_MODEL s’appliquent uniquement à la session que vous lancez avec eux et ne sont pas enregistrés. Pour exécuter différents modèles dans différents terminaux en même temps, lancez chacun avec son propre indicateur --model plutôt que de basculer avec /model.
Lorsque le modèle actif au démarrage provient des paramètres du projet ou gérés plutôt que de votre propre sélection, l’en-tête de démarrage indique quel fichier de paramètres l’a défini. Exécutez /model pour remplacer la sélection pour la session actuelle.
Exemple d’utilisation :
# Démarrer avec Opus
claude --model opus
# Basculer vers Sonnet pendant la session
/model sonnet
Exemple de fichier de paramètres :
{
"permissions": {
...
},
"model": "opus"
}
Restreindre la sélection du modèle
Les administrateurs d’entreprise peuvent utiliser availableModels dans les paramètres gérés ou de politique pour restreindre les modèles que les utilisateurs peuvent sélectionner.
Lorsque availableModels est défini, les utilisateurs ne peuvent pas basculer vers des modèles ne figurant pas dans la liste via /model, le drapeau --model, ou la variable d’environnement ANTHROPIC_MODEL.
{
"availableModels": ["sonnet", "haiku"]
}
Comportement du modèle par défaut
L’option Par défaut dans le sélecteur de modèle n’est pas affectée par availableModels. Elle reste toujours disponible et représente la valeur par défaut du système basée sur le niveau d’abonnement de l’utilisateur.
Même avec availableModels: [], les utilisateurs peuvent toujours utiliser Claude Code avec le modèle Par défaut pour leur niveau.
Contrôler le modèle sur lequel les utilisateurs s’exécutent
Le paramètre model est une sélection initiale, pas une application. Il définit quel modèle est actif au démarrage d’une session, mais les utilisateurs peuvent toujours ouvrir /model et choisir Par défaut, qui se résout au système par défaut pour leur niveau indépendamment de ce que model est défini.
Pour contrôler complètement l’expérience du modèle, combinez trois paramètres :
availableModels : restreint les modèles nommés vers lesquels les utilisateurs peuvent basculer
model : définit la sélection de modèle initiale au démarrage d’une session
ANTHROPIC_DEFAULT_SONNET_MODEL / ANTHROPIC_DEFAULT_OPUS_MODEL / ANTHROPIC_DEFAULT_HAIKU_MODEL : contrôlent ce vers quoi l’option Par défaut et les alias sonnet, opus et haiku se résolvent
Cet exemple démarre les utilisateurs sur Sonnet 4.5, limite le sélecteur à Sonnet et Haiku, et épingle Par défaut pour se résoudre à Sonnet 4.5 plutôt qu’à la dernière version :
{
"model": "claude-sonnet-4-5",
"availableModels": ["claude-sonnet-4-5", "haiku"],
"env": {
"ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
}
}
Sans le bloc env, un utilisateur qui sélectionne Par défaut dans le sélecteur obtiendrait la dernière version de Sonnet, contournant l’épinglage de version dans model et availableModels.
Comportement de fusion
Lorsque availableModels est défini à plusieurs niveaux, comme les paramètres utilisateur et les paramètres de projet, les tableaux sont fusionnés et dédupliqués. Pour appliquer une liste d’autorisation stricte, définissez availableModels dans les paramètres gérés ou de politique qui ont la priorité la plus élevée.
ID de modèle Mantle
Lorsque le point de terminaison Bedrock Mantle est activé, les entrées dans availableModels qui commencent par anthropic. sont ajoutées au sélecteur /model en tant qu’options personnalisées et acheminées vers le point de terminaison Mantle. Ceci est une exception à la correspondance d’alias uniquement décrite dans Épingler les modèles pour les déploiements tiers. Le paramètre restreint toujours le sélecteur aux entrées listées, donc incluez les alias standard aux côtés de tous les ID Mantle.
Comportement spécial du modèle
Paramètre de modèle default
Le comportement de default dépend de votre type de compte :
- Max et Team Premium : par défaut Opus 4.7
- Pro, Team Standard, Enterprise et API Anthropic : par défaut Sonnet 4.6
- Bedrock, Vertex et Foundry : par défaut Sonnet 4.5
Claude Code peut automatiquement revenir à Sonnet si vous atteignez un seuil d’utilisation avec Opus.
Le 23 avril 2026, le modèle par défaut pour les utilisateurs Enterprise pay-as-you-go et API Anthropic passera à Opus 4.7. Pour conserver un défaut différent, définissez ANTHROPIC_MODEL ou le champ model dans les paramètres gérés par le serveur.
Paramètre de modèle opusplan
L’alias de modèle opusplan fournit une approche hybride automatisée :
- En mode plan - Utilise
opus pour le raisonnement complexe et les décisions architecturales
- En mode exécution - Bascule automatiquement vers
sonnet pour la génération de code et l’implémentation
Cela vous donne le meilleur des deux mondes : le raisonnement supérieur d’Opus pour la planification et l’efficacité de Sonnet pour l’exécution.
La phase Opus en mode plan s’exécute avec la fenêtre de contexte standard de 200 K. La mise à niveau automatique 1M décrite dans Contexte étendu s’applique au paramètre de modèle opus et ne s’étend pas à opusplan.
Ajuster le niveau d’effort
Les niveaux d’effort contrôlent le raisonnement adaptatif, qui permet au modèle de décider si et combien réfléchir à chaque étape en fonction de la complexité de la tâche. Un effort inférieur est plus rapide et moins cher pour les tâches simples, tandis qu’un effort supérieur fournit un raisonnement plus profond pour les problèmes complexes.
L’effort est pris en charge sur Opus 4.7, Opus 4.6 et Sonnet 4.6. Les niveaux disponibles dépendent du modèle :
| Modèle | Niveaux |
|---|
| Opus 4.7 | low, medium, high, xhigh, max |
| Opus 4.6 et Sonnet 4.6 | low, medium, high, max |
Si vous définissez un niveau que le modèle actif ne prend pas en charge, Claude Code revient au niveau le plus élevé pris en charge au niveau ou en dessous de celui que vous avez défini. Par exemple, xhigh s’exécute comme high sur Opus 4.6.
À partir de la v2.1.117, l’effort par défaut est xhigh sur Opus 4.7 et high sur Opus 4.6 et Sonnet 4.6.
Lorsque vous exécutez Opus 4.7 pour la première fois, Claude Code applique xhigh même si vous aviez précédemment défini un niveau d’effort différent pour Opus 4.6 ou Sonnet 4.6. Exécutez /effort à nouveau pour choisir un niveau différent après le changement.
low, medium, high et xhigh persistent entre les sessions. max fournit le raisonnement le plus profond sans contrainte sur les dépenses en tokens et s’applique à la session actuelle uniquement, sauf lorsqu’il est défini via la variable d’environnement CLAUDE_CODE_EFFORT_LEVEL.
Choisir un niveau d’effort
Chaque niveau échange les dépenses en tokens contre la capacité. La valeur par défaut convient à la plupart des tâches de codage ; ajustez lorsque vous souhaitez un équilibre différent.
| Niveau | Quand l’utiliser |
|---|
low | Réservez aux tâches courtes, délimitées, sensibles à la latence qui ne sont pas sensibles à l’intelligence |
medium | Réduit l’utilisation des tokens pour le travail sensible aux coûts qui peut faire des compromis sur l’intelligence |
high | Équilibre l’utilisation des tokens et l’intelligence. Utilisez comme minimum pour le travail sensible à l’intelligence, ou pour réduire les dépenses en tokens par rapport à xhigh |
xhigh | Meilleurs résultats pour la plupart des tâches de codage et d’agent. Défaut recommandé sur Opus 4.7 |
max | Peut améliorer les performances sur les tâches exigeantes mais peut montrer des rendements décroissants et est sujet à la surréflexion. Testez avant d’adopter largement |
L’échelle d’effort est calibrée par modèle, donc le même nom de niveau ne représente pas la même valeur sous-jacente entre les modèles.
Utiliser ultrathink pour un raisonnement profond ponctuel
Incluez ultrathink n’importe où dans votre invite pour demander un raisonnement plus profond à ce tour sans modifier votre paramètre d’effort de session. Claude Code reconnaît le mot-clé et ajoute une instruction en contexte. Le niveau d’effort envoyé à l’API reste inchangé. D’autres phrases telles que « think », « think hard » et « think more » sont transmises comme du texte d’invite ordinaire et ne sont pas reconnues comme des mots-clés.
Définir le niveau d’effort
Vous pouvez modifier l’effort par l’une des méthodes suivantes :
/effort : exécutez /effort sans arguments pour ouvrir un curseur interactif, /effort suivi d’un nom de niveau pour le définir directement, ou /effort auto pour réinitialiser à la valeur par défaut du modèle
- Dans
/model : utilisez les touches fléchées gauche/droite pour ajuster le curseur d’effort lors de la sélection d’un modèle
- Drapeau
--effort : passez un nom de niveau pour le définir pour une seule session lors du lancement de Claude Code
- Variable d’environnement : définissez
CLAUDE_CODE_EFFORT_LEVEL sur un nom de niveau ou auto
- Paramètres : définissez
effortLevel sur low, medium, high ou xhigh dans votre fichier de paramètres. max est session uniquement et n’est pas accepté ici
- Frontmatter de skill et de subagent : définissez
effort dans un fichier markdown de skill ou de subagent pour remplacer le niveau d’effort lorsque ce skill ou subagent s’exécute
La variable d’environnement prend la priorité sur toutes les autres méthodes, puis votre niveau configuré, puis la valeur par défaut du modèle. L’effort du frontmatter s’applique lorsque ce skill ou subagent est actif, remplaçant le niveau de session mais pas la variable d’environnement.
Le curseur d’effort apparaît dans /model lorsqu’un modèle pris en charge est sélectionné. Le niveau d’effort actuel est également affiché à côté du logo et du spinner, par exemple « with low effort », vous pouvez donc confirmer quel paramètre est actif sans ouvrir /model.
Raisonnement adaptatif et budgets de réflexion fixes
Le raisonnement adaptatif rend la réflexion optionnelle à chaque étape, donc Claude peut répondre plus rapidement aux invites de routine et réserver une réflexion plus profonde pour les étapes qui en bénéficient. Si vous souhaitez que Claude réfléchisse plus ou moins souvent que le niveau actuel ne le produit, vous pouvez le dire directement dans votre invite ou dans CLAUDE.md ; le modèle répond à cette orientation dans son paramètre d’effort.
Opus 4.7 utilise toujours le raisonnement adaptatif. Le mode de budget de réflexion fixe et CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING ne s’appliquent pas à lui.
Sur Opus 4.6 et Sonnet 4.6, vous pouvez définir CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 pour revenir au budget de réflexion fixe précédent contrôlé par MAX_THINKING_TOKENS. Voir variables d’environnement.
Réflexion étendue
La réflexion étendue est le raisonnement que Claude émet avant de répondre. Sur les modèles qui prennent en charge le raisonnement adaptatif, le niveau d’effort est le contrôle principal de la quantité de réflexion qui se produit ; les paramètres ci-dessous activent ou désactivent la réflexion et contrôlent son affichage.
| Contrôle | Comment le définir |
|---|
| Basculer pour la session actuelle | Appuyez sur Option+T sur macOS ou Alt+T sur Windows et Linux |
| Définir la valeur par défaut globale | Exécutez /config et basculez le mode de réflexion. Enregistré en tant que alwaysThinkingEnabled dans ~/.claude/settings.json |
| Désactiver indépendamment de l’effort | Définissez MAX_THINKING_TOKENS=0. D’autres valeurs s’appliquent uniquement avec un budget de réflexion fixe |
La sortie de réflexion est réduite par défaut. Appuyez sur Ctrl+O pour basculer le mode verbeux et voir le raisonnement en tant que texte gris en italique. Les sessions interactives sur l’API Anthropic reçoivent des blocs de réflexion masqués par défaut, donc définissez showThinkingSummaries: true dans les paramètres si vous souhaitez que les résumés complets soient disponibles lorsque vous développez. Vous êtes facturé pour tous les tokens de réflexion générés, même lorsqu’ils sont réduits ou masqués.
Contexte étendu
Opus 4.7, Opus 4.6 et Sonnet 4.6 prennent en charge une fenêtre de contexte de 1 million de tokens pour les sessions longues avec de grandes bases de code.
La disponibilité varie selon le modèle et le plan. Sur les plans Max, Team et Enterprise, Opus est automatiquement mis à niveau vers un contexte 1M sans configuration supplémentaire. Cela s’applique aux sièges Team Standard et Team Premium. Sonnet avec contexte 1M ne fait pas partie de la mise à niveau automatique et nécessite une utilisation supplémentaire sur tous les plans d’abonnement, y compris Max.
| Plan | Opus avec contexte 1M | Sonnet avec contexte 1M |
|---|
| Max, Team et Enterprise | Inclus dans l’abonnement | Nécessite une utilisation supplémentaire |
| Pro | Nécessite une utilisation supplémentaire | Nécessite une utilisation supplémentaire |
| API et paiement à l’utilisation | Accès complet | Accès complet |
Pour désactiver complètement le contexte 1M, définissez CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Cela supprime les variantes de modèle 1M du sélecteur de modèle. Voir variables d’environnement.
La fenêtre de contexte 1M utilise la tarification standard du modèle sans prime pour les tokens au-delà de 200 K. Pour les plans où le contexte étendu est inclus dans votre abonnement, l’utilisation reste couverte par votre abonnement. Pour les plans qui accèdent au contexte étendu via une utilisation supplémentaire, les tokens sont facturés à l’utilisation supplémentaire.
Si votre compte prend en charge le contexte 1M, l’option apparaît dans le sélecteur de modèle (/model) dans les dernières versions de Claude Code. Si vous ne la voyez pas, essayez de redémarrer votre session.
Vous pouvez également utiliser le suffixe [1m] avec les alias de modèle ou les noms de modèle complets :
# Utiliser l'alias opus[1m] ou sonnet[1m]
/model opus[1m]
/model sonnet[1m]
# Ou ajouter [1m] à un nom de modèle complet
/model claude-opus-4-7[1m]
Vérifier votre modèle actuel
Vous pouvez voir quel modèle vous utilisez actuellement de plusieurs façons :
- Dans la ligne d’état (si configurée)
- Dans
/status, qui affiche également vos informations de compte.
Ajouter une option de modèle personnalisé
Utilisez ANTHROPIC_CUSTOM_MODEL_OPTION pour ajouter une seule entrée personnalisée au sélecteur /model sans remplacer les alias intégrés. Ceci est utile pour tester les ID de modèle que Claude Code ne répertorie pas par défaut. Pour les déploiements de passerelle LLM, Claude Code peut remplir le sélecteur à partir du point de terminaison /v1/models de la passerelle lorsque CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 est défini, donc cette variable n’est nécessaire que lorsque la découverte est désactivée ou ne retourne pas le modèle que vous souhaitez. Voir Sélection du modèle de passerelle LLM.
Cet exemple définit les trois variables pour rendre un déploiement Opus acheminé par passerelle sélectionnable :
export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"
L’entrée personnalisée apparaît au bas du sélecteur /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME et ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION sont optionnels. S’ils sont omis, l’ID du modèle est utilisé comme nom et la description par défaut est Custom model (<model-id>).
Claude Code ignore la validation pour l’ID de modèle défini dans ANTHROPIC_CUSTOM_MODEL_OPTION, vous pouvez donc utiliser n’importe quelle chaîne que votre point de terminaison API accepte.
Variables d’environnement
Vous pouvez utiliser les variables d’environnement suivantes, qui doivent être des noms de modèle complets (ou équivalents pour votre fournisseur d’API), pour contrôler les noms de modèle auxquels les alias sont mappés.
| Variable d’environnement | Description |
|---|
ANTHROPIC_DEFAULT_OPUS_MODEL | Le modèle à utiliser pour opus, ou pour opusplan lorsque le mode Plan est actif. |
ANTHROPIC_DEFAULT_SONNET_MODEL | Le modèle à utiliser pour sonnet, ou pour opusplan lorsque le mode Plan n’est pas actif. |
ANTHROPIC_DEFAULT_HAIKU_MODEL | Le modèle à utiliser pour haiku, ou fonctionnalité d’arrière-plan |
CLAUDE_CODE_SUBAGENT_MODEL | Le modèle à utiliser pour les subagents |
Remarque : ANTHROPIC_SMALL_FAST_MODEL est déprécié au profit de ANTHROPIC_DEFAULT_HAIKU_MODEL.
Épingler les modèles pour les déploiements tiers
Lors du déploiement de Claude Code via Bedrock, Vertex AI, Foundry ou Claude Platform on AWS, épinglez les versions de modèle avant de les déployer auprès des utilisateurs.
Sans épinglage, Claude Code utilise les alias de modèle (sonnet, opus, haiku) qui se résolvent à la dernière version. Lorsqu’Anthropic publie un nouveau modèle qui n’est pas encore activé dans le compte d’un utilisateur, les utilisateurs de Bedrock et Vertex AI voient un avis et reviennent à la version précédente pour cette session, tandis que les utilisateurs de Foundry voient des erreurs car Foundry n’a pas de vérification de démarrage équivalente.
Définissez les trois variables d’environnement de modèle sur des ID de version spécifiques dans le cadre de votre configuration initiale. L’épinglage vous permet de contrôler quand vos utilisateurs passent à un nouveau modèle.
Utilisez les variables d’environnement suivantes avec des ID de modèle spécifiques à la version pour votre fournisseur :
| Fournisseur | Exemple |
|---|
| Bedrock | export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-7' |
| Vertex AI | export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7' |
| Foundry | export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7' |
Appliquez le même modèle pour ANTHROPIC_DEFAULT_SONNET_MODEL et ANTHROPIC_DEFAULT_HAIKU_MODEL. Pour les ID de modèle actuels et hérités sur tous les fournisseurs, voir Aperçu des modèles. Pour mettre à niveau les utilisateurs vers une nouvelle version de modèle, mettez à jour ces variables d’environnement et redéployez.
Pour activer le contexte étendu pour un modèle épinglé, ajoutez [1m] à l’ID du modèle dans ANTHROPIC_DEFAULT_OPUS_MODEL ou ANTHROPIC_DEFAULT_SONNET_MODEL :
export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7[1m]'
Le suffixe [1m] applique la fenêtre de contexte 1M à toute utilisation de cet alias, y compris opusplan. Claude Code supprime le suffixe avant d’envoyer l’ID du modèle à votre fournisseur. N’ajoutez [1m] que lorsque le modèle sous-jacent prend en charge le contexte 1M, comme Opus 4.7 ou Sonnet 4.6.
La liste d’autorisation settings.availableModels s’applique toujours lors de l’utilisation de fournisseurs tiers. Le filtrage correspond à l’alias de modèle (opus, sonnet, haiku), et non à l’ID de modèle spécifique au fournisseur.
Personnaliser l’affichage et les capacités du modèle épinglé
Lorsque vous épinglez un modèle sur un fournisseur tiers, l’ID spécifique au fournisseur apparaît tel quel dans le sélecteur /model et Claude Code peut ne pas reconnaître les fonctionnalités que le modèle prend en charge. Vous pouvez remplacer le nom d’affichage et déclarer les capacités avec des variables d’environnement complémentaires pour chaque modèle épinglé.
Ces variables prennent effet sur les fournisseurs tiers tels que Bedrock, Vertex AI et Foundry. Les variables _NAME et _DESCRIPTION prennent également effet lorsque ANTHROPIC_BASE_URL pointe vers une passerelle LLM. Elles n’ont aucun effet lors de la connexion directe à api.anthropic.com.
| Variable d’environnement | Description |
|---|
ANTHROPIC_DEFAULT_OPUS_MODEL_NAME | Nom d’affichage pour le modèle Opus épinglé dans le sélecteur /model. Par défaut, l’ID du modèle lorsqu’il n’est pas défini |
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION | Description d’affichage pour le modèle Opus épinglé dans le sélecteur /model. Par défaut, Custom Opus model lorsqu’il n’est pas défini |
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES | Liste séparée par des virgules des capacités que le modèle Opus épinglé prend en charge |
Les mêmes suffixes _NAME, _DESCRIPTION et _SUPPORTED_CAPABILITIES sont disponibles pour ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL et ANTHROPIC_CUSTOM_MODEL_OPTION.
Claude Code active les fonctionnalités comme les niveaux d’effort et la réflexion étendue en faisant correspondre l’ID du modèle à des modèles connus. Les ID spécifiques au fournisseur tels que les ARN Bedrock ou les noms de déploiement personnalisés ne correspondent souvent pas à ces modèles, laissant les fonctionnalités prises en charge désactivées. Définissez _SUPPORTED_CAPABILITIES pour indiquer à Claude Code les fonctionnalités que le modèle prend réellement en charge :
| Valeur de capacité | Active |
|---|
effort | Niveaux d’effort et la commande /effort |
xhigh_effort | Le niveau d’effort xhigh |
max_effort | Le niveau d’effort max |
thinking | Réflexion étendue |
adaptive_thinking | Raisonnement adaptatif qui alloue dynamiquement la réflexion en fonction de la complexité de la tâche |
interleaved_thinking | Réflexion entre les appels d’outils |
Lorsque _SUPPORTED_CAPABILITIES est défini, les capacités listées sont activées et les capacités non listées sont désactivées pour le modèle épinglé correspondant. Lorsque la variable n’est pas définie, Claude Code revient à la détection intégrée basée sur l’ID du modèle.
Cet exemple épingle Opus à un ARN de modèle personnalisé Bedrock, définit un nom convivial et déclare ses capacités :
export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'
Remplacer les ID de modèle par version
Les variables d’environnement au niveau de la famille ci-dessus configurent un ID de modèle par alias de famille. Si vous devez mapper plusieurs versions au sein de la même famille à des ID de fournisseur distincts, utilisez plutôt le paramètre modelOverrides.
modelOverrides mappe les ID de modèle Anthropic individuels aux chaînes spécifiques au fournisseur que Claude Code envoie à l’API de votre fournisseur. Lorsqu’un utilisateur sélectionne un modèle mappé dans le sélecteur /model, Claude Code utilise votre valeur configurée au lieu de la valeur par défaut intégrée.
Cela permet aux administrateurs d’entreprise d’acheminer chaque version de modèle vers un ARN de profil d’inférence Bedrock spécifique, un nom de version Vertex AI ou un nom de déploiement Foundry pour la gouvernance, l’allocation des coûts ou l’acheminement régional.
Définissez modelOverrides dans votre fichier de paramètres :
{
"modelOverrides": {
"claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
"claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
"claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
}
}
Les clés doivent être des ID de modèle Anthropic tels que listés dans l’Aperçu des modèles. Pour les ID de modèle datés, incluez le suffixe de date exactement tel qu’il apparaît là. Les clés inconnues sont ignorées.
Les remplacements remplacent les ID de modèle intégrés qui soutiennent chaque entrée dans le sélecteur /model. Sur Bedrock, les remplacements prennent la priorité sur tous les profils d’inférence que Claude Code découvre automatiquement au démarrage. Les valeurs que vous fournissez directement via ANTHROPIC_MODEL, --model ou les variables d’environnement ANTHROPIC_DEFAULT_*_MODEL sont transmises au fournisseur telles quelles et ne sont pas transformées par modelOverrides.
modelOverrides fonctionne aux côtés de availableModels. La liste d’autorisation est évaluée par rapport à l’ID de modèle Anthropic, et non à la valeur de remplacement, donc une entrée comme "opus" dans availableModels continue de correspondre même lorsque les versions d’Opus sont mappées à des ARN.
Configuration de la mise en cache des invites
Claude Code utilise automatiquement la mise en cache des invites pour optimiser les performances et réduire les coûts. Vous pouvez désactiver la mise en cache des invites globalement ou pour des niveaux de modèle spécifiques :
| Variable d’environnement | Description |
|---|
DISABLE_PROMPT_CACHING | Définissez sur 1 pour désactiver la mise en cache des invites pour tous les modèles (prend la priorité sur les paramètres par modèle) |
DISABLE_PROMPT_CACHING_HAIKU | Définissez sur 1 pour désactiver la mise en cache des invites pour les modèles Haiku uniquement |
DISABLE_PROMPT_CACHING_SONNET | Définissez sur 1 pour désactiver la mise en cache des invites pour les modèles Sonnet uniquement |
DISABLE_PROMPT_CACHING_OPUS | Définissez sur 1 pour désactiver la mise en cache des invites pour les modèles Opus uniquement |
Ces variables d’environnement vous donnent un contrôle granulaire sur le comportement de la mise en cache des invites. Le paramètre global DISABLE_PROMPT_CACHING prend la priorité sur les paramètres spécifiques au modèle, vous permettant de désactiver rapidement toute la mise en cache si nécessaire. Les paramètres par modèle sont utiles pour un contrôle sélectif, par exemple lors du débogage de modèles spécifiques ou du travail avec des fournisseurs cloud qui peuvent avoir des implémentations de mise en cache différentes.