Vai al contenuto principale

Documentation Index

Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt

Use this file to discover all available pages before exploring further.

Modelli disponibili

Per l’impostazione model in Claude Code, è possibile configurare:
  • Un alias del modello
  • Un nome del modello
    • API Anthropic: un nome del modello completo
    • Bedrock: un ARN del profilo di inferenza
    • Foundry: un nome di distribuzione
    • Vertex: un nome di versione
ANTHROPIC_BASE_URL cambia dove vengono inviate le richieste, non quale modello le risponde. Per instradare Claude attraverso un gateway LLM, vedere configurazione del gateway LLM.

Alias dei modelli

Gli alias dei modelli forniscono un modo conveniente per selezionare le impostazioni del modello senza dover ricordare i numeri di versione esatti:
Alias del modelloComportamento
defaultValore speciale che cancella qualsiasi override del modello e ripristina il modello consigliato per il tipo di account. Non è di per sé un alias del modello
bestUtilizza il modello più capace disponibile, attualmente equivalente a opus
sonnetUtilizza il modello Sonnet più recente per le attività di codifica quotidiane
opusUtilizza il modello Opus più recente per attività di ragionamento complesso
haikuUtilizza il modello Haiku veloce ed efficiente per attività semplici
sonnet[1m]Utilizza Sonnet con una finestra di contesto di 1 milione di token per sessioni lunghe
opus[1m]Utilizza Opus con una finestra di contesto di 1 milione di token per sessioni lunghe
opusplanModalità speciale che utilizza opus durante Plan Mode, quindi passa a sonnet per l’esecuzione
Su API Anthropic e Claude Platform on AWS, opus si risolve in Opus 4.7 e sonnet si risolve in Sonnet 4.6. Su Bedrock, Vertex e Foundry, opus si risolve in Opus 4.6 e sonnet si risolve in Sonnet 4.5; modelli più recenti sono disponibili su questi provider selezionando il nome del modello completo esplicitamente o impostando ANTHROPIC_DEFAULT_OPUS_MODEL o ANTHROPIC_DEFAULT_SONNET_MODEL. Gli alias puntano alla versione consigliata per il provider e si aggiornano nel tempo. Per fissare una versione specifica, utilizzare il nome del modello completo (ad esempio, claude-opus-4-7) o impostare la variabile di ambiente corrispondente come ANTHROPIC_DEFAULT_OPUS_MODEL.
Opus 4.7 richiede Claude Code v2.1.111 o successivo. Eseguire claude update per aggiornare.

Impostazione del modello

È possibile configurare il modello in diversi modi, elencati in ordine di priorità:
  1. Durante la sessione - Utilizzare /model <alias|name> per cambiare immediatamente, oppure eseguire /model senza argomenti per aprire il selettore. Il selettore chiede conferma quando la conversazione ha output precedente, poiché la risposta successiva rilegge la cronologia completa senza contesto memorizzato nella cache
  2. All’avvio - Avviare con claude --model <alias|name>
  3. Variabile di ambiente - Impostare ANTHROPIC_MODEL=<alias|name>
  4. Impostazioni - Configurare in modo permanente nel file delle impostazioni utilizzando il campo model.
La selezione /model viene salvata nelle impostazioni utente e persiste tra i riavvii. A partire dalla v2.1.117, se il file .claude/settings.json del progetto fissa un modello diverso, Claude Code scrive anche la scelta in .claude/settings.local.json in modo che continui ad applicarsi in quel progetto dopo un riavvio. Le impostazioni gestite hanno la precedenza e si riapplicano al prossimo avvio. Quando il modello attivo all’avvio proviene dalle impostazioni del progetto o gestite piuttosto che dalla propria selezione, l’intestazione di avvio mostra quale file di impostazioni lo ha impostato. Eseguire /model per eseguire l’override per la sessione corrente. Esempio di utilizzo:
# Avviare con Opus
claude --model opus

# Passare a Sonnet durante la sessione
/model sonnet
File delle impostazioni di esempio:
{
    "permissions": {
        ...
    },
    "model": "opus"
}

Limitare la selezione del modello

Gli amministratori aziendali possono utilizzare availableModels nelle impostazioni gestite o di policy per limitare quali modelli gli utenti possono selezionare. Quando availableModels è impostato, gli utenti non possono passare a modelli non presenti nell’elenco tramite /model, il flag --model, o la variabile di ambiente ANTHROPIC_MODEL.
{
  "availableModels": ["sonnet", "haiku"]
}

Comportamento del modello predefinito

L’opzione Predefinito nel selettore di modelli non è interessata da availableModels. Rimane sempre disponibile e rappresenta il valore predefinito di runtime del sistema in base al livello di sottoscrizione dell’utente. Anche con availableModels: [], gli utenti possono comunque utilizzare Claude Code con il modello Predefinito per il loro livello.

Controllare il modello su cui gli utenti eseguono

L’impostazione model è una selezione iniziale, non un’applicazione. Imposta quale modello è attivo quando una sessione inizia, ma gli utenti possono comunque aprire /model e scegliere Predefinito, che si risolve nel valore predefinito del sistema per il loro livello indipendentemente da ciò che model è impostato. Per controllare completamente l’esperienza del modello, combinare tre impostazioni:
  • availableModels: limita a quali modelli denominati gli utenti possono passare
  • model: imposta la selezione del modello iniziale quando una sessione inizia
  • ANTHROPIC_DEFAULT_SONNET_MODEL / ANTHROPIC_DEFAULT_OPUS_MODEL / ANTHROPIC_DEFAULT_HAIKU_MODEL: controllano a cosa si risolvono l’opzione Predefinito e gli alias sonnet, opus e haiku
Questo esempio avvia gli utenti su Sonnet 4.5, limita il selettore a Sonnet e Haiku, e fissa Predefinito per risolversi a Sonnet 4.5 piuttosto che alla versione più recente:
{
  "model": "claude-sonnet-4-5",
  "availableModels": ["claude-sonnet-4-5", "haiku"],
  "env": {
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
  }
}
Senza il blocco env, un utente che seleziona Predefinito nel selettore otterrebbe la versione Sonnet più recente, bypassando il pin di versione in model e availableModels.

Comportamento di unione

Quando availableModels è impostato a più livelli, come nelle impostazioni utente e nelle impostazioni del progetto, gli array vengono uniti e deduplicati. Per applicare un elenco di autorizzazione rigoroso, impostare availableModels nelle impostazioni gestite o di policy che hanno la priorità più alta.

ID di modello Mantle

Quando l’endpoint Bedrock Mantle è abilitato, le voci in availableModels che iniziano con anthropic. vengono aggiunte al selettore /model come opzioni personalizzate e instradate all’endpoint Mantle. Questa è un’eccezione alla corrispondenza solo alias descritta in Fissare i modelli per distribuzioni di terze parti. L’impostazione limita comunque il selettore alle voci elencate, quindi includere gli alias standard insieme a qualsiasi ID Mantle.

Comportamento speciale del modello

Impostazione del modello default

Il comportamento di default dipende dal tipo di account:
  • Max e Team Premium: per impostazione predefinita Opus 4.7
  • Pro, Team Standard, Enterprise e API Anthropic: per impostazione predefinita Sonnet 4.6
  • Bedrock, Vertex e Foundry: per impostazione predefinita Sonnet 4.5
Claude Code potrebbe eseguire automaticamente il fallback a Sonnet se si raggiunge una soglia di utilizzo con Opus.
Il 23 aprile 2026, il modello predefinito per gli utenti Enterprise con pagamento in base al consumo e API Anthropic cambierà in Opus 4.7. Per mantenere un valore predefinito diverso, impostare ANTHROPIC_MODEL o il campo model nelle impostazioni gestite dal server.

Impostazione del modello opusplan

L’alias del modello opusplan fornisce un approccio ibrido automatizzato:
  • In Plan Mode - Utilizza opus per il ragionamento complesso e le decisioni architettoniche
  • In modalità esecuzione - Passa automaticamente a sonnet per la generazione di codice e l’implementazione
Questo ti dà il meglio di entrambi i mondi: il ragionamento superiore di Opus per la pianificazione e l’efficienza di Sonnet per l’esecuzione. La fase Opus in Plan Mode viene eseguita con la finestra di contesto standard di 200K. L’aggiornamento automatico 1M descritto in Contesto esteso si applica all’impostazione del modello opus e non si estende a opusplan.

Regolare il livello di sforzo

I livelli di sforzo controllano il ragionamento adattivo, che consente al modello di decidere se e quanto pensare ad ogni passo in base alla complessità dell’attività. Lo sforzo inferiore è più veloce ed economico per attività semplici, mentre lo sforzo superiore fornisce un ragionamento più profondo per problemi complessi. Lo sforzo è supportato su Opus 4.7, Opus 4.6 e Sonnet 4.6. I livelli disponibili dipendono dal modello:
ModelloLivelli
Opus 4.7low, medium, high, xhigh, max
Opus 4.6 e Sonnet 4.6low, medium, high, max
Se imposti un livello che il modello attivo non supporta, Claude Code ricade al livello supportato più alto pari o inferiore a quello impostato. Ad esempio, xhigh viene eseguito come high su Opus 4.6. A partire dalla v2.1.117, lo sforzo predefinito è xhigh su Opus 4.7 e high su Opus 4.6 e Sonnet 4.6. Quando esegui Opus 4.7 per la prima volta, Claude Code applica xhigh anche se hai precedentemente impostato un livello di sforzo diverso per Opus 4.6 o Sonnet 4.6. Esegui /effort di nuovo per scegliere un livello diverso dopo il passaggio. low, medium, high e xhigh persistono tra le sessioni. max fornisce il ragionamento più profondo senza vincoli sulla spesa di token e si applica solo alla sessione corrente, tranne quando impostato tramite la variabile di ambiente CLAUDE_CODE_EFFORT_LEVEL.

Scegliere un livello di sforzo

Ogni livello scambia la spesa di token rispetto alla capacità. Il valore predefinito è adatto alla maggior parte delle attività di codifica; regola quando desideri un equilibrio diverso.
LivelloQuando utilizzarlo
lowRiservare per attività brevi, limitate e sensibili alla latenza che non sono sensibili all’intelligenza
mediumRiduce l’utilizzo di token per il lavoro sensibile ai costi che può scambiare un po’ di intelligenza
highBilancia l’utilizzo di token e l’intelligenza. Utilizzare come minimo per il lavoro sensibile all’intelligenza, o per ridurre la spesa di token rispetto a xhigh
xhighMigliori risultati per la maggior parte delle attività di codifica e agentic. Valore predefinito consigliato su Opus 4.7
maxPuò migliorare le prestazioni su attività impegnative ma potrebbe mostrare rendimenti decrescenti ed è soggetto a pensiero eccessivo. Testare prima di adottare ampiamente
La scala dello sforzo è calibrata per modello, quindi lo stesso nome di livello non rappresenta lo stesso valore sottostante tra i modelli.

Utilizzare ultrathink per il ragionamento profondo una tantum

Includi ultrathink in qualsiasi punto del prompt per richiedere un ragionamento più profondo su quel turno senza modificare l’impostazione dello sforzo della sessione. Claude Code riconosce la parola chiave e aggiunge un’istruzione in contesto. Il livello di sforzo inviato all’API rimane invariato. Altre frasi come “think”, “think hard” e “think more” vengono passate come testo ordinario del prompt e non vengono riconosciute come parole chiave.

Impostare il livello di sforzo

È possibile modificare lo sforzo attraverso uno dei seguenti:
  • /effort: eseguire /effort senza argomenti per aprire un cursore interattivo, /effort seguito da un nome di livello per impostarlo direttamente, o /effort auto per ripristinare il valore predefinito del modello
  • In /model: utilizzare i tasti freccia sinistra/destra per regolare il cursore dello sforzo quando si seleziona un modello
  • Flag --effort: passare un nome di livello per impostarlo per una singola sessione quando si avvia Claude Code
  • Variabile di ambiente: impostare CLAUDE_CODE_EFFORT_LEVEL su un nome di livello o auto
  • Impostazioni: impostare effortLevel su low, medium, high o xhigh nel file delle impostazioni. max è solo per la sessione e non è accettato qui
  • Frontmatter di skill e subagent: impostare effort in un file markdown di skill o subagent per sovrascrivere il livello di sforzo quando quella skill o subagent viene eseguita
La variabile di ambiente ha la precedenza su tutti gli altri metodi, quindi il livello configurato, quindi il valore predefinito del modello. Lo sforzo del frontmatter si applica quando quella skill o subagent è attiva, sovrascrivendo il livello della sessione ma non la variabile di ambiente. Il cursore dello sforzo appare in /model quando è selezionato un modello supportato. Il livello di sforzo corrente viene visualizzato anche accanto al logo e al spinner, ad esempio “with low effort”, in modo da poter confermare quale impostazione è attiva senza aprire /model.

Ragionamento adattivo e budget di pensiero fissi

Il ragionamento adattivo rende il pensiero facoltativo ad ogni passo, quindi Claude può rispondere più velocemente ai prompt di routine e riservare un pensiero più profondo per i passi che ne traggono vantaggio. Se desideri che Claude pensi più o meno spesso di quanto il livello corrente produce, puoi dirlo direttamente nel prompt o in CLAUDE.md; il modello risponde a quella guida entro l’impostazione dello sforzo. Opus 4.7 utilizza sempre il ragionamento adattivo. La modalità budget di pensiero fisso e CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING non si applicano ad esso. Su Opus 4.6 e Sonnet 4.6, è possibile impostare CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 per ripristinare il budget di pensiero fisso precedente controllato da MAX_THINKING_TOKENS. Vedere variabili di ambiente.

Pensiero esteso

Il pensiero esteso è il ragionamento che Claude emette prima di rispondere. Sui modelli che supportano il ragionamento adattivo, il livello di sforzo è il controllo principale per la quantità di pensiero che si verifica; le impostazioni seguenti attivano o disattivano il pensiero e controllano come viene visualizzato.
ControlloCome impostarlo
Attiva/disattiva per la sessione correntePremere Option+T su macOS o Alt+T su Windows e Linux
Impostare il valore predefinito globaleEseguire /config e attivare/disattivare la modalità di pensiero. Salvato come alwaysThinkingEnabled in ~/.claude/settings.json
Disabilitare indipendentemente dallo sforzoImpostare MAX_THINKING_TOKENS=0. Altri valori si applicano solo con un budget di pensiero fisso
L’output del pensiero è compresso per impostazione predefinita. Premere Ctrl+O per attivare/disattivare la modalità dettagliata e visualizzare il ragionamento come testo grigio in corsivo. Le sessioni interattive sull’API Anthropic ricevono blocchi di pensiero redatti per impostazione predefinita, quindi impostare showThinkingSummaries: true nelle impostazioni se desideri che i riepiloghi completi siano disponibili quando li espandi. Viene addebitato il costo di tutti i token di pensiero generati, anche quando compressi o redatti.

Contesto esteso

Opus 4.7, Opus 4.6 e Sonnet 4.6 supportano una finestra di contesto di 1 milione di token per sessioni lunghe con basi di codice di grandi dimensioni. La disponibilità varia in base al modello e al piano. Nei piani Max, Team ed Enterprise, Opus viene automaticamente aggiornato al contesto 1M senza configurazione aggiuntiva. Questo si applica sia ai posti Team Standard che Team Premium. Sonnet con contesto 1M non fa parte dell’aggiornamento automatico e richiede utilizzo extra su ogni piano di abbonamento, incluso Max.
PianoOpus con contesto 1MSonnet con contesto 1M
Max, Team ed EnterpriseIncluso nell’abbonamentoRichiede utilizzo extra
ProRichiede utilizzo extraRichiede utilizzo extra
API e pagamento in base al consumoAccesso completoAccesso completo
Per disabilitare completamente il contesto 1M, impostare CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Questo rimuove le varianti di modello 1M dal selettore di modelli. Vedere variabili di ambiente. La finestra di contesto 1M utilizza i prezzi standard del modello senza premio per i token oltre 200K. Per i piani in cui il contesto esteso è incluso nell’abbonamento, l’utilizzo rimane coperto dall’abbonamento. Per i piani che accedono al contesto esteso tramite utilizzo extra, i token vengono fatturati all’utilizzo extra. Se l’account supporta il contesto 1M, l’opzione appare nel selettore di modelli (/model) nelle versioni più recenti di Claude Code. Se non la vedi, prova a riavviare la sessione. È anche possibile utilizzare il suffisso [1m] con alias di modelli o nomi di modelli completi:
# Utilizzare l'alias opus[1m] o sonnet[1m]
/model opus[1m]
/model sonnet[1m]

# O aggiungere [1m] a un nome di modello completo
/model claude-opus-4-7[1m]

Verifica del modello corrente

È possibile vedere quale modello stai utilizzando attualmente in diversi modi:
  1. Nella riga di stato (se configurata)
  2. In /status, che visualizza anche le informazioni dell’account.

Aggiungere un’opzione di modello personalizzato

Utilizzare ANTHROPIC_CUSTOM_MODEL_OPTION per aggiungere una singola voce personalizzata al selettore /model senza sostituire gli alias incorporati. Questo è utile per testare ID di modello che Claude Code non elenca per impostazione predefinita. Per le distribuzioni di gateway LLM, Claude Code può popolare il selettore dall’endpoint /v1/models del gateway quando CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 è impostato, quindi questa variabile è necessaria solo quando la scoperta è disabilitata o non restituisce il modello desiderato. Vedere Selezione del modello del gateway LLM. Questo esempio imposta tutte e tre le variabili per rendere selezionabile una distribuzione Opus instradata tramite gateway:
export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"
La voce personalizzata appare in fondo al selettore /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME e ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION sono facoltativi. Se omessi, l’ID del modello viene utilizzato come nome e la descrizione per impostazione predefinita è Custom model (<model-id>). Claude Code salta la convalida per l’ID del modello impostato in ANTHROPIC_CUSTOM_MODEL_OPTION, quindi è possibile utilizzare qualsiasi stringa che l’endpoint API accetta.

Variabili di ambiente

È possibile utilizzare le seguenti variabili di ambiente, che devono essere nomi di modelli completi (o equivalenti per il provider API), per controllare i nomi dei modelli a cui gli alias si mappano.
Variabile di ambienteDescrizione
ANTHROPIC_DEFAULT_OPUS_MODELIl modello da utilizzare per opus, o per opusplan quando Plan Mode è attivo.
ANTHROPIC_DEFAULT_SONNET_MODELIl modello da utilizzare per sonnet, o per opusplan quando Plan Mode non è attivo.
ANTHROPIC_DEFAULT_HAIKU_MODELIl modello da utilizzare per haiku, o funzionalità in background
CLAUDE_CODE_SUBAGENT_MODELIl modello da utilizzare per subagents
Nota: ANTHROPIC_SMALL_FAST_MODEL è deprecato a favore di ANTHROPIC_DEFAULT_HAIKU_MODEL.

Fissare i modelli per distribuzioni di terze parti

Quando si distribuisce Claude Code tramite Bedrock, Vertex AI, Foundry, o Claude Platform on AWS, fissare le versioni dei modelli prima di distribuire agli utenti. Senza fissaggio, Claude Code utilizza alias di modelli (sonnet, opus, haiku) che si risolvono nella versione più recente. Quando Anthropic rilascia un nuovo modello che non è ancora abilitato nell’account di un utente, gli utenti Bedrock e Vertex AI vedono un avviso e ricadono nella versione precedente per quella sessione, mentre gli utenti Foundry vedono errori perché Foundry non ha alcun controllo di avvio equivalente.
Impostare tutte e tre le variabili di ambiente del modello su ID di versione specifici come parte della configurazione iniziale. Il fissaggio consente di controllare quando i tuoi utenti passano a un nuovo modello.
Utilizzare le seguenti variabili di ambiente con ID di modello specifici della versione per il provider:
ProviderEsempio
Bedrockexport ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-7'
Vertex AIexport ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7'
Foundryexport ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7'
Applicare lo stesso modello per ANTHROPIC_DEFAULT_SONNET_MODEL e ANTHROPIC_DEFAULT_HAIKU_MODEL. Per gli ID di modello attuali e legacy su tutti i provider, vedere Panoramica dei modelli. Per aggiornare gli utenti a una nuova versione del modello, aggiornare queste variabili di ambiente e ridistribuire. Per abilitare il contesto esteso per un modello fissato, aggiungere [1m] all’ID del modello in ANTHROPIC_DEFAULT_OPUS_MODEL o ANTHROPIC_DEFAULT_SONNET_MODEL:
export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7[1m]'
Il suffisso [1m] applica la finestra di contesto 1M a tutto l’utilizzo di quell’alias, incluso opusplan. Claude Code rimuove il suffisso prima di inviare l’ID del modello al provider. Aggiungere [1m] solo quando il modello sottostante supporta il contesto 1M, come Opus 4.7 o Sonnet 4.6.
L’elenco di autorizzazione settings.availableModels si applica comunque quando si utilizzano provider di terze parti. Il filtraggio corrisponde all’alias del modello (opus, sonnet, haiku), non all’ID del modello specifico del provider.

Personalizzare la visualizzazione e le capacità del modello fissato

Quando si fissa un modello su un provider di terze parti, l’ID specifico del provider appare così com’è nel selettore /model e Claude Code potrebbe non riconoscere quali funzionalità il modello supporta. È possibile sovrascrivere il nome di visualizzazione e dichiarare le capacità con variabili di ambiente complementari per ogni modello fissato. Queste variabili hanno effetto su provider di terze parti come Bedrock, Vertex AI e Foundry. Le variabili _NAME e _DESCRIPTION hanno effetto anche quando ANTHROPIC_BASE_URL punta a un gateway LLM. Non hanno effetto quando si effettua la connessione direttamente a api.anthropic.com.
Variabile di ambienteDescrizione
ANTHROPIC_DEFAULT_OPUS_MODEL_NAMENome di visualizzazione per il modello Opus fissato nel selettore /model. Per impostazione predefinita l’ID del modello quando non impostato
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTIONDescrizione di visualizzazione per il modello Opus fissato nel selettore /model. Per impostazione predefinita Custom Opus model quando non impostato
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIESElenco separato da virgole delle capacità che il modello Opus fissato supporta
Gli stessi suffissi _NAME, _DESCRIPTION e _SUPPORTED_CAPABILITIES sono disponibili per ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL e ANTHROPIC_CUSTOM_MODEL_OPTION. Claude Code abilita funzionalità come livelli di sforzo e extended thinking abbinando l’ID del modello rispetto a modelli noti. Gli ID specifici del provider come ARN Bedrock o nomi di distribuzione personalizzati spesso non corrispondono a questi modelli, lasciando le funzionalità supportate disabilitate. Impostare _SUPPORTED_CAPABILITIES per dire a Claude Code quali funzionalità il modello effettivamente supporta:
Valore di capacitàAbilita
effortLivelli di sforzo e il comando /effort
xhigh_effortIl livello di sforzo xhigh
max_effortIl livello di sforzo max
thinkingExtended thinking
adaptive_thinkingRagionamento adattivo che alloca dinamicamente il pensiero in base alla complessità dell’attività
interleaved_thinkingPensiero tra le chiamate di strumento
Quando _SUPPORTED_CAPABILITIES è impostato, le capacità elencate sono abilitate e le capacità non elencate sono disabilitate per il modello fissato corrispondente. Quando la variabile non è impostata, Claude Code ricade sulla rilevazione incorporata basata sull’ID del modello. Questo esempio fissa Opus a un ARN di modello personalizzato Bedrock, imposta un nome amichevole e dichiara le sue capacità:
export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'

Eseguire l’override degli ID di modello per versione

Le variabili di ambiente a livello di famiglia sopra configurano un ID di modello per alias di famiglia. Se è necessario mappare diverse versioni all’interno della stessa famiglia a ID di provider distinti, utilizzare invece l’impostazione modelOverrides. modelOverrides mappa i singoli ID di modello Anthropic alle stringhe specifiche del provider che Claude Code invia all’API del provider. Quando un utente seleziona un modello mappato nel selettore /model, Claude Code utilizza il valore configurato invece del valore predefinito incorporato. Questo consente agli amministratori aziendali di instradare ogni versione del modello a un ARN di profilo di inferenza Bedrock specifico, a un nome di versione Vertex AI o a un nome di distribuzione Foundry per governance, allocazione dei costi o instradamento regionale. Impostare modelOverrides nel file delle impostazioni:
{
  "modelOverrides": {
    "claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
    "claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
    "claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
  }
}
Le chiavi devono essere ID di modello Anthropic come elencati nella Panoramica dei modelli. Per gli ID di modello datati, includere il suffisso della data esattamente come appare lì. Le chiavi sconosciute vengono ignorate. Gli override sostituiscono gli ID di modello incorporati che supportano ogni voce nel selettore /model. Su Bedrock, gli override hanno la precedenza su qualsiasi profilo di inferenza che Claude Code scopre automaticamente all’avvio. I valori forniti direttamente tramite ANTHROPIC_MODEL, --model o le variabili di ambiente ANTHROPIC_DEFAULT_*_MODEL vengono passati al provider così come sono e non vengono trasformati da modelOverrides. modelOverrides funziona insieme a availableModels. L’elenco di autorizzazione viene valutato rispetto all’ID di modello Anthropic, non al valore di override, quindi una voce come "opus" in availableModels continua a corrispondere anche quando le versioni di Opus sono mappate a ARN.

Configurazione della prompt caching

Claude Code utilizza automaticamente la prompt caching per ottimizzare le prestazioni e ridurre i costi. È possibile disabilitare la prompt caching globalmente o per livelli di modello specifici:
Variabile di ambienteDescrizione
DISABLE_PROMPT_CACHINGImpostare su 1 per disabilitare la prompt caching per tutti i modelli (ha la precedenza sulle impostazioni per modello)
DISABLE_PROMPT_CACHING_HAIKUImpostare su 1 per disabilitare la prompt caching solo per i modelli Haiku
DISABLE_PROMPT_CACHING_SONNETImpostare su 1 per disabilitare la prompt caching solo per i modelli Sonnet
DISABLE_PROMPT_CACHING_OPUSImpostare su 1 per disabilitare la prompt caching solo per i modelli Opus
Queste variabili di ambiente forniscono un controllo granulare sul comportamento della prompt caching. L’impostazione globale DISABLE_PROMPT_CACHING ha la precedenza sulle impostazioni specifiche del modello, consentendo di disabilitare rapidamente tutta la caching quando necessario. Le impostazioni per modello sono utili per il controllo selettivo, ad esempio quando si esegue il debug di modelli specifici o si lavora con provider cloud che potrebbero avere implementazioni di caching diverse.