Vai al contenuto principale
Questa pagina documenta le richieste che Claude Code invia a un gateway, inclusi gli endpoint che chiama, le intestazioni e i campi del corpo che il gateway deve inoltrare, e quali funzionalità smettono di funzionare quando non lo fa. È scritta per gli operatori che configurano un prodotto gateway per funzionare con Claude Code.
Questa pagina copre: Questa pagina utilizza due termini per quello che il vostro gateway fa con ogni intestazione e campo del corpo:
  • Inoltrare invariato: passarlo all’upstream byte per byte
  • Consumare: il gateway può leggerlo per il routing, l’attribuzione o il tracciamento e non è necessario inoltrarlo
Qualsiasi cosa non contrassegnata come inoltrare invariato è vostro da consumare o ignorare.

Formati API

Un gateway deve esporre almeno uno dei seguenti formati API ai client Claude Code. Quale formato Claude Code parla è determinato dalla configurazione del client: la variabile nella colonna Selezionato da della tabella sottostante punta Claude Code al vostro gateway in quel formato.
FormatoSelezionato daEndpointInoltrare invariato
Anthropic MessagesANTHROPIC_BASE_URL/v1/messages, /v1/messages/count_tokens (opzionale)intestazioni di richiesta anthropic-beta e anthropic-version
Bedrock InvokeModelANTHROPIC_BEDROCK_BASE_URL con CLAUDE_CODE_USE_BEDROCK=1/model/{model}/invoke, /model/{model}/invoke-with-response-streamcampi del corpo della richiesta anthropic_beta e anthropic_version
Vertex rawPredictANTHROPIC_VERTEX_BASE_URL con CLAUDE_CODE_USE_VERTEX=1:rawPredict, :streamRawPredict, count-tokens:rawPredict (opzionale)intestazioni di richiesta anthropic-beta e anthropic-version, e il campo del corpo della richiesta anthropic_version

Foundry e Claude Platform on AWS

Microsoft Foundry e Claude Platform on AWS implementano il formato Anthropic Messages. Claude Code instrada verso di loro attraverso le loro variabili, ANTHROPIC_FOUNDRY_BASE_URL e ANTHROPIC_AWS_BASE_URL, ma un gateway che le fronteggia implementa la riga Anthropic Messages sopra. Un gateway che fronteggia Claude Platform on AWS deve anche inoltrare l’intestazione anthropic-workspace-id, che quella piattaforma richiede su ogni richiesta.

Endpoint opzionali e traffico di avvio

Gli endpoint di conteggio dei token sono gli unici opzionali: quando sono assenti, Claude Code stima l’utilizzo del contesto localmente. Le richieste di inferenza vengono inviate a /v1/messages?beta=true, quindi abbinate sul percorso, non sull’URL completo. Il metodo Vertex allega i suffissi al percorso del modello dell’editore, come in /projects/{project}/locations/{location}/publishers/anthropic/models/{model}:streamRawPredict. Un gateway vede anche il traffico di avvio best-effort che può rifiutare senza rompere nulla: una sonda di connettività HEAD /, e su gateway in formato Bedrock una richiesta GET /inference-profiles?type=SYSTEM_DEFINED.

Streaming

Le risposte di inferenza devono essere in streaming. Claude Code consuma gli eventi inviati dal server mentre arrivano, quindi un gateway che memorizza nel buffer le risposte complete prima di inoltrarle blocca il client.

Mancata corrispondenza del formato con l’upstream

Quale formato il client parla determina cosa riceve il vostro gateway. La modalità di errore comune è una mancata corrispondenza tra il formato che il client invia al vostro gateway e il formato che il provider upstream dietro di esso accetta.
  • Quando il client parla il formato Bedrock o Vertex, Claude Code invia solo il sottoinsieme del suo set di capacità completo che quei provider accettano
  • Quando il client parla il formato Anthropic Messages, Claude Code invia il set completo, anche se il vostro gateway inoltra a un upstream Bedrock o Vertex
Colmare quella differenza è il compito del vostro gateway. Passaggio delle funzionalità descrive cosa si interrompe quando non lo fa.

Intestazioni delle richieste

Claude Code include queste intestazioni sulle richieste API. I nomi delle intestazioni non fanno distinzione tra maiuscole e minuscole sul filo. Inoltrare anthropic-version e anthropic-beta invariate, più anthropic-workspace-id quando l’upstream è Claude Platform on AWS; il resto il gateway può consumare per il routing, l’attribuzione e il tracciamento, e non è necessario inoltrare.
IntestazioneDescrizione
Authorization, x-api-keyLa credenziale del gateway dello sviluppatore, in una o entrambe le intestazioni a seconda di quale variabile di credenziale impostano
anthropic-versionVersione API, attualmente 2023-06-01. Le richieste in formato Bedrock e Vertex portano anche il campo del corpo anthropic_version, il cui valore è la stringa del dialetto del provider, non il valore di questa intestazione
anthropic-betaValori di capacità separati da virgole per la richiesta. Inoltrare l’intestazione verbatim; non creare un elenco di consentiti dei singoli valori, perché l’insieme cambia con i rilasci di Claude Code. Quando lo sviluppatore si autentica con un accesso claude.ai, che è possibile quando ANTHROPIC_BASE_URL è impostato senza una variabile di credenziale del gateway, questa intestazione porta anche una capacità OAuth che l’upstream richiede, e rimuoverla fa fallire quelle richieste con 401
x-claude-code-session-idUn identificatore univoco per la sessione Claude Code corrente. Usarlo per aggregare tutte le richieste da una sessione senza analizzare i corpi delle richieste
x-claude-code-agent-idIdentificatore del subagent che ha emesso la richiesta, presente solo sulle richieste da un agente che Claude Code ha generato all’interno della sessione. Usarlo con l’ID della sessione per attribuire il costo agli agenti paralleli
x-claude-code-parent-agent-idIdentificatore dell’agente che ha generato l’agente richiedente, presente solo per gli agenti annidati
Gli ID dei subagent vengono generati freschi per ogni spawn. Gli agenti compagni, i membri denominati di un team di agenti, riutilizzano un ID stabile basato sul nome tra le riconnessioni. In entrambi i casi l’ID identifica un agente, non una persona o un dispositivo, quindi non trattate l’intestazione dell’ID dell’agente come un identificatore utente. Se i vostri sviluppatori impostano ANTHROPIC_CUSTOM_HEADERS, quelle intestazioni appaiono anche sulle richieste.

Inoltrare come elenchi aperti

Trattate le intestazioni e i campi del corpo come elenchi aperti, non chiusi. Claude Code guadagna capacità nei rilasci, e arrivano come nuovi valori anthropic-beta, nuovi campi del corpo della richiesta, e occasionalmente nuove intestazioni anthropic-* o x-claude-code-*. Quando inoltrate a un upstream in formato Anthropic, passate le intestazioni di richiesta anthropic-* e i campi del corpo della richiesta invariati piuttosto che creare un elenco di consentiti di quelli che vedete oggi. Un gateway bloccato a un elenco osservato rimuove l’intestazione o il campo della prossima capacità e lo interrompe nel rilascio che lo introduce. L’eccezione è un upstream non-Anthropic come Bedrock o Vertex, dove colmare la differenza dello schema è il compito del gateway; vedere passaggio delle funzionalità.

Blocco di attribuzione del prompt di sistema

Claude Code antepone un breve blocco di attribuzione al prompt di sistema contenente la versione del client e un’impronta digitale derivata dalla conversazione. L’endpoint api.anthropic.com rimuove il blocco prima dell’elaborazione, quindi non influisce sul prompt caching di prima parte; qualsiasi altro upstream lo riceve come parte del prompt. Anthropic e gli endpoint Claude dei provider cloud lo leggono per l’attribuzione, quindi per ometterlo impostare CLAUDE_CODE_ATTRIBUTION_HEADER=0 piuttosto che rimuoverlo nel gateway. Da Claude Code v2.1.181, il blocco è stabile per la durata di una conversazione quando le richieste instradano attraverso un URL di base personalizzato, quindi una cache del prompt lato gateway basata sul corpo della richiesta completa funziona senza disabilitarla. Prima di v2.1.181 il blocco includeva un token per richiesta; su quelle versioni, impostare CLAUDE_CODE_ATTRIBUTION_HEADER=0 se il vostro gateway implementa una tale cache.

Passaggio delle funzionalità

Claude Code tratta un gateway ANTHROPIC_BASE_URL come un endpoint in formato Anthropic e gli invia le intestazioni beta e i campi del corpo della richiesta che invia a api.anthropic.com, tranne un piccolo insieme di diagnostica e impostazioni predefinite riservate alle connessioni dirette. Le capacità che aggiungono campi del corpo li associano a un’intestazione beta, e la coppia viaggia insieme. Un gateway che rimuove l’intestazione mentre passa il corpo, o inoltra un corpo in formato Anthropic a un upstream con uno schema diverso, produce errori 400 difficili; solo quando entrambe le metà sono assenti insieme la funzionalità si disattiva silenziosamente. Un gateway che riscrive o redige i corpi delle richieste per l’ispezione del contenuto interrompe l’associazione allo stesso modo della rimozione, quindi ispezionare senza modificare. La tabella nota dove una funzionalità si discosta dall’associazione. Lo streaming fine degli strumenti è una delle impostazioni predefinite della connessione diretta: è disattivato per impostazione predefinita ogni volta che le richieste instradano attraverso un URL di base personalizzato, e un gateway lo riceve quando gli sviluppatori impostano CLAUDE_CODE_ENABLE_FINE_GRAINED_TOOL_STREAMING=1.
FunzionalitàIntestazione e coppia del corpoSintomo quando interrottoRimedio
Ragionamento adattivoNessuna intestazione beta. Claude Code invia thinking: {"type": "adaptive"} per Claude 4.6 e successivi, e tratta i nomi dei modelli che non riconosce, come gli alias del gateway, come modelli attuali che ricevono il campo400 che nomina il campo thinking o il tag adaptive quando la build del modello upstream non lo accettaAggiornare l’upstream. Su Opus 4.6 e Sonnet 4.6, gli sviluppatori possono invece impostare CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1
Gestione del contestoL’intestazione beta di gestione del contesto si associa al campo del corpo context_management400 con Extra inputs are not permitted. Comune quando un gateway accetta richieste in formato Anthropic ma le inoltra a BedrockInoltrare entrambi, o CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1
Contesto esteso e pensiero interleavedSolo intestazioni beta, nessun campo del corpoSilenziosamente non disponibile quando l’intestazione viene rimossa; l’upstream non vede mai la richiesta di capacitàInoltrare anthropic-beta verbatim
Campi dello strumento beta tool fieldsLe intestazioni beta relative agli strumenti si associano ai campi dello schema dello strumento come strict e defer_loading400 che nomina il campo dello schema dello strumento non riconosciuto quando il corpo passa attraverso senza la sua intestazioneInoltrare entrambi, o CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1
Sforzo e output strutturatiIl campo del corpo output_config contiene impostazioni di sforzo, formato di output strutturato e budget dei compiti; ciascuno si associa con la sua intestazione beta400 che nomina output_config, spesso Extra inputs are not permitted, su upstream Bedrock e VertexInoltrare il campo e le sue intestazioni insieme
Conteggio dei tokenNessun accoppiamento beta; utilizza l’endpoint count_tokensClaude Code ricade alla stima dell’utilizzo del contesto localmenteEsporre l’endpoint se desiderate conteggi esatti
Le variabili ANTHROPIC_DEFAULT_*_MODEL_SUPPORTED_CAPABILITIES variables dichiarano le capacità del modello solo nelle configurazioni del provider: CLAUDE_CODE_USE_BEDROCK, CLAUDE_CODE_USE_VERTEX, CLAUDE_CODE_USE_FOUNDRY, e CLAUDE_CODE_USE_MANTLE. Non hanno effetto dietro un gateway ANTHROPIC_BASE_URL.

Ritentativo automatico e inoltro degli errori

Claude Code ritenta automaticamente dopo alcuni rifiuti upstream e disabilita la capacità rifiutata per il resto della conversazione. I rifiuti del campo thinking, dei thinking signatures, e dei messaggi di sistema a metà conversazione si riprendono in questo modo. I rifiuti di gestione del contesto e di campi dello schema dello strumento non ritentano; quegli errori 400 raggiungono lo sviluppatore. La logica di ritentativo corrisponde alla formulazione dell’errore dell’upstream, quindi inoltrare i corpi della risposta di errore invariati. Un gateway che avvolge gli errori upstream nel suo involucro interrompe il percorso di recupero anche quando preserva il codice di stato.

Disabilitare le capacità pre-release

CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1 impedisce a Claude Code di inviare capacità pre-release e i loro campi del corpo su ogni provider, inclusa la gestione del contesto e i campi dello strumento beta. Non influisce sul ragionamento adattivo, che è selezionato dal modello piuttosto che da beta, e non sopprime mai la capacità OAuth che l’autenticazione della sottoscrizione richiede. L’insieme delle capacità che Claude Code invia cresce nei rilasci. Per le stringhe di intestazione beta attuali, vedere il riferimento delle intestazioni beta; testare il vostro gateway contro i nuovi rilasci di Claude Code piuttosto che bloccare a un elenco osservato.

Scoperta dei modelli

Quando ANTHROPIC_BASE_URL punta a un gateway che espone il formato Anthropic Messages, Claude Code può interrogare l’endpoint /v1/models del gateway all’avvio e aggiungere i modelli restituiti al selettore /model. Gli sviluppatori lo abilitano impostando CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1, nel loro ambiente o attraverso le impostazioni gestite. La scoperta è disattivata per impostazione predefinita in modo che i gateway supportati da una chiave API condivisa non espongano ogni modello a cui la chiave può accedere a ogni utente. Questo richiede Claude Code v2.1.129 o successivo.

Quando viene eseguita la scoperta

La scoperta si applica solo al formato Anthropic Messages. Non viene eseguita quando:
  • Qualsiasi variabile del provider CLAUDE_CODE_USE_* è impostata, anche se ANTHROPIC_BASE_URL è anche impostato
  • ANTHROPIC_BASE_URL non è impostato o punta a api.anthropic.com
  • Il traffico non essenziale è disabilitato, attraverso CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC o la politica dell’organizzazione

Richiesta e risposta

La richiesta è GET /v1/models?limit=1000 con un timeout di 3 secondi, e qualsiasi reindirizzamento è trattato come fallimento in modo che la credenziale non possa trapelare a una destinazione di reindirizzamento. Un gateway che risponde lentamente o reindirizza /v1/models, anche da http a https, fallisce la scoperta silenziosamente; servire l’endpoint direttamente all’URL di base configurato. La richiesta di scoperta invia esattamente un’intestazione di credenziale:
  • ANTHROPIC_AUTH_TOKEN come token bearer, quando impostato
  • Altrimenti la chiave API risolta, incluso un valore apiKeyHelper, nell’intestazione x-api-key
Questo differisce dalle richieste di inferenza, che inviano un valore helper in entrambe le intestazioni. Un gateway che autentica /v1/models deve accettare x-api-key per le distribuzioni helper. Qualsiasi intestazione da ANTHROPIC_CUSTOM_HEADERS è inclusa anche. Claude Code legge id e il display_name opzionale da ogni voce nell’array data della risposta, e ignora le voci il cui id non inizia con claude o anthropic:
{
  "data": [
    { "id": "claude-sonnet-4-6", "display_name": "Claude Sonnet 4.6" },
    { "id": "claude-opus-4-7" }
  ]
}

Voci del selettore e caching

Il selettore è l’elenco interattivo dei modelli che si apre quando uno sviluppatore esegue /model in Claude Code. Ogni voce scoperta è etichettata “From gateway” e utilizza display_name quando fornito. Un ID scoperto viene saltato solo quando corrisponde esattamente a una riga già nel selettore, o quando sia l’ID scoperto che quello esistente si risolvono in Fable. Le righe integrate sono codificate su alias come sonnet, quindi un ID scoperto come claude-sonnet-4-6 aggiunge la sua propria riga “From gateway” accanto alla voce integrata. L’impostazione gestita availableModels limita quello che la scoperta può aggiungere. I risultati vengono memorizzati nella cache in ~/.claude/cache/gateway-models.json, o %USERPROFILE%\.claude\cache\gateway-models.json su Windows, e aggiornati ad ogni avvio. Se la richiesta fallisce o il gateway non implementa /v1/models, il selettore ricade all’elenco memorizzato nella cache dall’avvio precedente o all’elenco dei modelli integrati. Se il vostro gateway serve modelli Claude con alias che non corrispondono al filtro di scoperta, gli sviluppatori possono aggiungere quegli alias manualmente con le variabili di configurazione del modello. Per il resto della serie di documentazione del gateway e i riferimenti API sottostanti: