Il ciclo a colpo d’occhio
Ogni sessione dell’agente segue lo stesso ciclo:- Ricevere il prompt. Claude riceve il vostro prompt, insieme al prompt di sistema, alle definizioni degli strumenti e alla cronologia della conversazione. L’SDK produce un
SystemMessagecon sottotipo"init"contenente i metadati della sessione. - Valutare e rispondere. Claude valuta lo stato attuale e determina come procedere. Può rispondere con testo, richiedere una o più chiamate di strumenti, o entrambi. L’SDK produce un
AssistantMessagecontenente il testo e le richieste di chiamate di strumenti. - Eseguire gli strumenti. L’SDK esegue ogni strumento richiesto e raccoglie i risultati. Ogni set di risultati degli strumenti viene restituito a Claude per la decisione successiva. Potete utilizzare hooks per intercettare, modificare o bloccare le chiamate di strumenti prima che vengano eseguite.
- Ripetere. I passaggi 2 e 3 si ripetono come un ciclo. Ogni ciclo completo è un turno. Claude continua a chiamare gli strumenti ed elaborare i risultati fino a quando non produce una risposta senza chiamate di strumenti.
- Restituire il risultato. L’SDK produce un
AssistantMessagefinale con la risposta di testo (senza chiamate di strumenti), seguito da unResultMessagecon il testo finale, l’utilizzo dei token, il costo e l’ID della sessione.
Glob e risposta con i risultati. Un’attività complessa (“refactorizza il modulo di autenticazione e aggiorna i test”) può concatenare dozzine di chiamate di strumenti su molti turni, leggendo file, modificando codice ed eseguendo test, con Claude che adatta il suo approccio in base a ogni risultato.
Turni e messaggi
Un turno è un viaggio di andata e ritorno all’interno del ciclo: Claude produce output che include chiamate di strumenti, l’SDK esegue quegli strumenti e i risultati vengono restituiti a Claude automaticamente. Questo accade senza cedere il controllo al vostro codice. I turni continuano fino a quando Claude non produce output senza chiamate di strumenti, a quel punto il ciclo termina e il risultato finale viene consegnato. Considerate come potrebbe apparire una sessione completa per il prompt “Correggi i test falliti in auth.ts”. Per prima cosa, l’SDK invia il vostro prompt a Claude e produce unSystemMessage con i metadati della sessione. Poi il ciclo inizia:
- Turno 1: Claude chiama
Bashper eseguirenpm test. L’SDK produce unAssistantMessagecon la chiamata dello strumento, esegue il comando, poi produce unUserMessagecon l’output (tre errori). - Turno 2: Claude chiama
Readsuauth.tseauth.test.ts. L’SDK restituisce il contenuto dei file e produce unAssistantMessage. - Turno 3: Claude chiama
Editper correggereauth.ts, poi chiamaBashper rieseguirenpm test. Tutti e tre i test passano. L’SDK produce unAssistantMessage. - Turno finale: Claude produce una risposta solo di testo senza chiamate di strumenti: “Corretto il bug di autenticazione, tutti e tre i test passano ora.” L’SDK produce un
AssistantMessagefinale con questo testo, poi unResultMessagecon lo stesso testo più costo e utilizzo.
max_turns / maxTurns, che conta solo i turni di utilizzo degli strumenti. Ad esempio, max_turns=2 nel ciclo precedente si sarebbe fermato prima del passaggio di modifica. Potete anche utilizzare max_budget_usd / maxBudgetUsd per limitare i turni in base a una soglia di spesa.
Senza limiti, il ciclo viene eseguito fino a quando Claude non termina da solo, il che va bene per attività ben definite ma può durare a lungo su prompt aperti (“migliora questo codebase”). Impostare un budget è una buona impostazione predefinita per gli agenti di produzione. Vedere Turni e budget di seguito per il riferimento alle opzioni.
Tipi di messaggi
Mentre il ciclo viene eseguito, l’SDK produce un flusso di messaggi. Ogni messaggio ha un tipo che vi dice da quale fase del ciclo proviene. I cinque tipi principali sono:SystemMessage: eventi del ciclo di vita della sessione. Il camposubtypeli distingue:"init"è il primo messaggio (metadati della sessione), e"compact_boundary"si attiva dopo la compattazione. In TypeScript, il confine di compattazione è il suo proprio tipoSDKCompactBoundaryMessagepiuttosto che un sottotipo diSDKSystemMessage.AssistantMessage: emesso dopo ogni risposta di Claude, inclusa quella finale solo di testo. Contiene blocchi di contenuto di testo e blocchi di chiamate di strumenti da quel turno.UserMessage: emesso dopo ogni esecuzione di strumento con il risultato dello strumento inviato di nuovo a Claude. Emesso anche per qualsiasi input dell’utente che trasmettete a metà ciclo.StreamEvent: emesso solo quando i messaggi parziali sono abilitati. Contiene eventi di streaming API grezzi (delta di testo, chunk di input dello strumento). Vedere Stream responses.ResultMessage: segna la fine del ciclo dell’agente. Contiene il risultato di testo finale, l’utilizzo dei token, il costo e l’ID della sessione. Controllate il camposubtypeper determinare se l’attività ha avuto successo o ha raggiunto un limite. Un piccolo numero di eventi di sistema finali, comeprompt_suggestion, può arrivare dopo di esso, quindi iterate il flusso fino al completamento piuttosto che interrompere al risultato. Vedere Gestire il risultato.
Gestire i messaggi
Quali messaggi gestite dipende da ciò che state costruendo:- Solo risultati finali: gestite
ResultMessageper ottenere l’output, il costo e se l’attività ha avuto successo o ha raggiunto un limite. - Aggiornamenti di progresso: gestite
AssistantMessageper vedere cosa sta facendo Claude ad ogni turno, inclusi gli strumenti che ha chiamato. - Streaming in tempo reale: abilitate i messaggi parziali (
include_partial_messagesin Python,includePartialMessagesin TypeScript) per ottenere messaggiStreamEventin tempo reale. Vedere Stream responses in real-time.
- Python: controllate i tipi di messaggi con
isinstance()rispetto alle classi importate daclaude_agent_sdk(ad esempio,isinstance(message, ResultMessage)). - TypeScript: controllate il campo stringa
type(ad esempio,message.type === "result").AssistantMessageeUserMessageavvolgono il messaggio API grezzo in un campo.message, quindi i blocchi di contenuto si trovano inmessage.message.content, non inmessage.content.
Esempio: Controllare i tipi di messaggi e gestire i risultati
Esempio: Controllare i tipi di messaggi e gestire i risultati
Esecuzione degli strumenti
Gli strumenti danno al vostro agente la capacità di agire. Senza strumenti, Claude può solo rispondere con testo. Con gli strumenti, Claude può leggere file, eseguire comandi, cercare codice e interagire con servizi esterni.Strumenti integrati
L’SDK include gli stessi strumenti che alimentano Claude Code:| Categoria | Strumenti | Cosa fanno |
|---|---|---|
| Operazioni su file | Read, Edit, Write | Leggere, modificare e creare file |
| Ricerca | Glob, Grep | Trovare file per pattern, cercare contenuto con regex |
| Esecuzione | Bash | Eseguire comandi shell, script, operazioni git |
| Web | WebSearch, WebFetch | Cercare il web, recuperare e analizzare pagine |
| Scoperta | ToolSearch | Trovare e caricare dinamicamente gli strumenti su richiesta invece di precaricarli tutti |
| Orchestrazione | Agent, Skill, AskUserQuestion, TaskCreate, TaskUpdate | Generare subagenti, invocare skills, chiedere all’utente, tracciare attività |
- Connettere servizi esterni con server MCP (database, browser, API)
- Definire strumenti personalizzati con gestori di strumenti personalizzati
- Caricare skills del progetto tramite setting sources per flussi di lavoro riutilizzabili
Autorizzazioni degli strumenti
Claude determina quali strumenti chiamare in base all’attività, ma voi controllate se quelle chiamate sono autorizzate a essere eseguite. Potete approvare automaticamente strumenti specifici, bloccare altri completamente, o richiedere l’approvazione per tutto. Tre opzioni lavorano insieme per determinare cosa viene eseguito:allowed_tools/allowedToolsapprova automaticamente gli strumenti elencati. Un agente di sola lettura con["Read", "Glob", "Grep"]nel suo elenco di strumenti consentiti esegue quegli strumenti senza chiedere. Gli strumenti non elencati sono ancora disponibili ma richiedono autorizzazione.disallowed_tools/disallowedToolsblocca gli strumenti elencati, indipendentemente da altre impostazioni. Vedere Autorizzazioni per l’ordine in cui le regole vengono controllate prima che uno strumento venga eseguito.permission_mode/permissionModecontrolla cosa accade agli strumenti che non sono coperti da regole di consentimento o negazione. Vedere Modalità di autorizzazione per le modalità disponibili.
"Bash(npm *)" per consentire solo comandi specifici. Vedere Autorizzazioni per la sintassi completa delle regole.
Quando uno strumento viene negato, Claude riceve un messaggio di rifiuto come risultato dello strumento e in genere tenta un approccio diverso o segnala che non potrebbe procedere.
Esecuzione parallela degli strumenti
Quando Claude richiede più chiamate di strumenti in un singolo turno, entrambi gli SDK possono eseguirli contemporaneamente o sequenzialmente a seconda dello strumento. Gli strumenti di sola lettura (comeRead, Glob, Grep e strumenti MCP contrassegnati come di sola lettura) possono essere eseguiti contemporaneamente. Gli strumenti che modificano lo stato (come Edit, Write e Bash) vengono eseguiti sequenzialmente per evitare conflitti.
Gli strumenti personalizzati predefiniti per l’esecuzione sequenziale. Per abilitare l’esecuzione parallela per uno strumento personalizzato, impostare readOnlyHint nelle sue annotazioni. Sia l’SDK TypeScript che Python utilizzano questo nome di campo dall’SDK MCP.
Controllare come viene eseguito il ciclo
Potete limitare quanti turni il ciclo prende, quanto costa, quanto profondamente Claude ragiona e se gli strumenti richiedono approvazione prima di essere eseguiti. Tutti questi sono campi suClaudeAgentOptions (Python) / Options (TypeScript).
Turni e budget
| Opzione | Cosa controlla | Predefinito |
|---|---|---|
Max turni (max_turns / maxTurns) | Massimi round trip di utilizzo degli strumenti | Nessun limite |
Max budget (max_budget_usd / maxBudgetUsd) | Costo massimo prima di fermarsi | Nessun limite |
ResultMessage con un sottotipo di errore corrispondente (error_max_turns o error_max_budget_usd). Vedere Gestire il risultato per come controllare questi sottotipi e ClaudeAgentOptions / Options per la sintassi.
Livello di sforzo
L’opzioneeffort controlla quanto ragionamento Claude applica. I livelli di sforzo inferiori utilizzano meno token per turno e riducono il costo. Non tutti i modelli supportano il parametro di sforzo. Vedere Effort per quali modelli lo supportano.
| Livello | Comportamento | Buono per |
|---|---|---|
"low" | Ragionamento minimo, risposte veloci | Ricerche di file, elenco di directory |
"medium" | Ragionamento equilibrato | Modifiche di routine, attività standard |
"high" | Analisi approfondita | Refactoring, debug |
"xhigh" | Profondità di ragionamento estesa | Attività di codifica e agentic; consigliato su Opus 4.7 |
"max" | Profondità di ragionamento massima | Problemi multi-step che richiedono analisi profonda |
effort, l’SDK Python lascia il parametro non impostato e rimanda al comportamento predefinito del modello. L’SDK TypeScript predefinisce a "high".
effort scambia latenza e costo dei token per profondità di ragionamento all’interno di ogni risposta. Extended thinking è una funzione separata che produce blocchi di catena di pensiero visibili nell’output. Sono indipendenti: potete impostare effort: "low" con extended thinking abilitato, o effort: "max" senza di esso.effort nelle opzioni di livello superiore query() per l’intera sessione, o per subagente con il campo effort su AgentDefinition per sovrascrivere il livello di sessione.
Modalità di autorizzazione
L’opzione della modalità di autorizzazione (permission_mode in Python, permissionMode in TypeScript) controlla se l’agente chiede l’approvazione prima di utilizzare gli strumenti:
| Modalità | Comportamento |
|---|---|
"default" | Gli strumenti non coperti da regole di consentimento attivano il vostro callback di approvazione; nessun callback significa negare |
"acceptEdits" | Approva automaticamente le modifiche ai file e i comandi comuni del filesystem (mkdir, touch, mv, cp, ecc.); altri comandi Bash seguono le regole predefinite |
"plan" | Gli strumenti di sola lettura vengono eseguiti; Claude esplora e produce un piano senza modificare i vostri file sorgente |
"dontAsk" | Non chiede mai. Gli strumenti pre-approvati da regole di autorizzazione vengono eseguiti, tutto il resto viene negato |
"auto" (solo TypeScript) | Utilizza un classificatore di modello per approvare o negare ogni chiamata di strumento. Vedere Modalità Auto per disponibilità e comportamento |
"bypassPermissions" | Esegue tutti gli strumenti consentiti senza chiedere. Non può essere utilizzato quando si esegue come root su Unix. Utilizzare solo in ambienti isolati dove le azioni dell’agente non possono influenzare i sistemi che vi interessano |
"default" con un callback di approvazione dello strumento per visualizzare i prompt di approvazione. Per gli agenti autonomi su una macchina di sviluppo, "acceptEdits" approva automaticamente le modifiche ai file e i comandi comuni del filesystem (mkdir, touch, mv, cp, ecc.) mentre ancora limita altri comandi Bash dietro le regole di consentimento. Riservate "bypassPermissions" per CI, container o altri ambienti isolati. Vedere Autorizzazioni per i dettagli completi.
Modello
Se non impostatemodel, l’SDK utilizza il predefinito di Claude Code, che dipende dal vostro metodo di autenticazione e dall’abbonamento. Impostatelo esplicitamente (ad esempio, model="claude-sonnet-4-6") per fissare un modello specifico o per utilizzare un modello più piccolo per agenti più veloci e economici. Vedere models per gli ID disponibili.
La finestra di contesto
La finestra di contesto è la quantità totale di informazioni disponibili a Claude durante una sessione. Non si ripristina tra i turni all’interno di una sessione. Tutto si accumula: il prompt di sistema, le definizioni degli strumenti, la cronologia della conversazione, gli input degli strumenti e gli output degli strumenti. Il contenuto che rimane lo stesso tra i turni (prompt di sistema, definizioni degli strumenti, CLAUDE.md) viene automaticamente prompt cached, il che riduce il costo e la latenza per i prefissi ripetuti.Cosa consuma il contesto
Ecco come ogni componente influisce sul contesto nell’SDK:| Fonte | Quando viene caricato | Impatto |
|---|---|---|
| Prompt di sistema | Ogni richiesta | Costo fisso piccolo, sempre presente |
| File CLAUDE.md | Inizio della sessione, tramite settingSources | Contenuto completo in ogni richiesta (ma prompt-cached, quindi solo la prima richiesta paga il costo completo) |
| Definizioni degli strumenti | Ogni richiesta; schemi MCP differiti per impostazione predefinita | Gli schemi degli strumenti integrati vengono caricati ad ogni richiesta. Tool search differisce gli schemi degli strumenti MCP per impostazione predefinita, ricadendo nel caricamento anticipato su Vertex AI o su un ANTHROPIC_BASE_URL non di prima parte. Vedere Configurare la ricerca degli strumenti per la matrice completa |
| Cronologia della conversazione | Si accumula nel corso dei turni | Cresce con ogni turno: prompt, risposte, input degli strumenti, output degli strumenti |
| Descrizioni delle skills | Inizio della sessione, tramite setting sources | Brevi riassunti; il contenuto completo viene caricato solo quando invocato |
Compattazione automatica
Quando la finestra di contesto si avvicina al suo limite, l’SDK compatta automaticamente la conversazione: riassume la cronologia più vecchia per liberare spazio, mantenendo intatti gli scambi più recenti e le decisioni chiave. L’SDK emette un messaggio contype: "system" e subtype: "compact_boundary" nel flusso quando questo accade (in Python questo è un SystemMessage; in TypeScript è un tipo separato SDKCompactBoundaryMessage).
La compattazione sostituisce i messaggi più vecchi con un riassunto, quindi le istruzioni specifiche dall’inizio della conversazione potrebbero non essere preservate. Le regole persistenti appartengono a CLAUDE.md (caricato tramite settingSources) piuttosto che al prompt iniziale, perché il contenuto di CLAUDE.md viene reiniettato ad ogni richiesta.
Potete personalizzare il comportamento della compattazione in diversi modi:
- Istruzioni di riassunto in CLAUDE.md: Il compattatore legge il vostro CLAUDE.md come qualsiasi altro contesto, quindi potete includere una sezione che gli dice cosa preservare quando riassume. L’intestazione della sezione è libera (non una stringa magica); il compattatore corrisponde all’intento.
- Hook
PreCompact: Eseguire logica personalizzata prima che si verifichi la compattazione, ad esempio per archiviare la trascrizione completa. L’hook riceve un campotrigger(manualoauto). Vedere hooks. - Compattazione manuale: Inviare
/compactcome stringa di prompt per attivare la compattazione su richiesta. I comandi inviati in questo modo sono input SDK, non scorciatoie solo CLI. Vedere slash commands.
Esempio: Istruzioni di riassunto in CLAUDE.md
Esempio: Istruzioni di riassunto in CLAUDE.md
Aggiungete una sezione al vostro CLAUDE.md del progetto dicendo al compattatore cosa preservare. Il nome dell’intestazione non è speciale; utilizzate qualsiasi etichetta chiara.
CLAUDE.md
Mantenere il contesto efficiente
Alcune strategie per gli agenti a lunga durata:- Utilizzare subagenti per sottoattività. Ogni subagente inizia con una conversazione fresca (nessuna cronologia di messaggi precedenti, anche se carica il suo prompt di sistema e il contesto a livello di progetto come CLAUDE.md). Non vede i turni del genitore e solo la sua risposta finale ritorna al genitore come risultato dello strumento. Il contesto dell’agente principale cresce per quel riassunto, non per la trascrizione completa della sottoattività. Vedere Cosa ereditano i subagenti per i dettagli.
- Essere selettivi con gli strumenti. Ogni definizione di strumento occupa spazio di contesto. Utilizzate il campo
toolssuAgentDefinitionper limitare i subagenti al set minimo di cui hanno bisogno. - Controllare i costi dei server MCP. MCP tool search differisce gli schemi degli strumenti MCP per impostazione predefinita e li carica su richiesta. Quando la ricerca degli strumenti è disattivata, su Vertex AI, o dietro un
ANTHROPIC_BASE_URLnon di prima parte, ogni server MCP aggiunge tutti i suoi schemi di strumenti ad ogni richiesta, quindi pochi server con molti strumenti possono consumare un contesto significativo prima che l’agente faccia qualsiasi lavoro. - Utilizzare uno sforzo inferiore per attività di routine. Impostare effort a
"low"per gli agenti che hanno solo bisogno di leggere file o elencare directory. Questo riduce l’utilizzo dei token e il costo.
Sessioni e continuità
Ogni interazione con l’SDK crea o continua una sessione. Catturate l’ID della sessione daResultMessage.session_id (disponibile in entrambi gli SDK) per riprendere in seguito. L’SDK TypeScript lo espone anche come campo diretto sul SystemMessage init; in Python è annidato in SystemMessage.data.
Quando riprendete, il contesto completo dai turni precedenti viene ripristinato: file che sono stati letti, analisi che è stata eseguita e azioni che sono state intraprese. Potete anche fare un fork di una sessione per diramarvisi in un approccio diverso senza modificare l’originale.
Vedere Gestione della sessione per la guida completa sui pattern di ripresa, continuazione e fork.
In Python,
ClaudeSDKClient gestisce gli ID di sessione automaticamente tra più chiamate. Vedere il riferimento SDK Python per i dettagli.Gestire il risultato
Quando il ciclo termina, ilResultMessage vi dice cosa è successo e vi fornisce l’output. Il campo subtype (disponibile in entrambi gli SDK) è il modo principale per controllare lo stato di terminazione.
| Sottotipo del risultato | Cosa è successo | Campo result disponibile? |
|---|---|---|
success | Claude ha completato l’attività normalmente | Sì |
error_max_turns | Ha raggiunto il limite di maxTurns prima di terminare | No |
error_max_budget_usd | Ha raggiunto il limite di maxBudgetUsd prima di terminare | No |
error_during_execution | Un errore ha interrotto il ciclo (ad esempio, un errore API o una richiesta annullata) | No |
error_max_structured_output_retries | La convalida dell’output strutturato ha fallito dopo il limite di tentativi configurato | No |
result (l’output di testo finale) è presente solo sulla variante success, quindi controllate sempre il sottotipo prima di leggerlo. Tutti i sottotipi di risultato portano total_cost_usd, usage, num_turns e session_id in modo che possiate tracciare il costo e riprendere anche dopo gli errori. In Python, total_cost_usd e usage sono tipizzati come opzionali e possono essere None su alcuni percorsi di errore, quindi proteggete prima di formattarli. Vedere Tracciamento di costi e utilizzo per i dettagli sull’interpretazione dei campi usage.
Il risultato include anche un campo stop_reason (string | null in TypeScript, str | None in Python) che indica perché il modello ha smesso di generare al suo turno finale. I valori comuni sono end_turn (il modello ha terminato normalmente), max_tokens (ha raggiunto il limite di token di output) e refusal (il modello ha rifiutato la richiesta). Su sottotipi di risultato di errore, stop_reason porta il valore dall’ultima risposta dell’assistente prima che il ciclo terminasse. Per rilevare i rifiuti, controllate stop_reason === "refusal" (TypeScript) o stop_reason == "refusal" (Python). Vedere SDKResultMessage (TypeScript) o ResultMessage (Python) per il tipo completo.
Hooks
Hooks sono callback che si attivano in punti specifici del ciclo: prima che uno strumento venga eseguito, dopo che ritorna, quando l’agente termina e così via. Alcuni hook comunemente utilizzati sono:| Hook | Quando si attiva | Usi comuni |
|---|---|---|
PreToolUse | Prima che uno strumento venga eseguito | Convalidare gli input, bloccare i comandi pericolosi |
PostToolUse | Dopo che uno strumento ritorna | Controllare gli output, attivare effetti collaterali |
UserPromptSubmit | Quando un prompt viene inviato | Iniettare contesto aggiuntivo nei prompt |
Stop | Quando l’agente termina | Convalidare il risultato, salvare lo stato della sessione |
SubagentStart / SubagentStop | Quando un subagente viene generato o completato | Tracciare e aggregare i risultati delle attività parallele |
PreCompact | Prima della compattazione del contesto | Archiviare la trascrizione completa prima di riassumere |
PreToolUse che rifiuta una chiamata di strumento impedisce che venga eseguita e Claude riceve il messaggio di rifiuto invece.
Entrambi gli SDK supportano tutti gli eventi precedenti. L’SDK TypeScript include eventi aggiuntivi che Python non supporta ancora. Vedere Controllare l’esecuzione con gli hooks per l’elenco completo degli eventi, la disponibilità per SDK e l’API di callback completa.
Mettere tutto insieme
Questo esempio combina i concetti chiave di questa pagina in un singolo agente che corregge i test falliti. Configura l’agente con strumenti consentiti (pre-approvati in modo che l’agente funzioni autonomamente), impostazioni del progetto e limiti di sicurezza su turni e sforzo di ragionamento. Mentre il ciclo viene eseguito, cattura l’ID della sessione per una potenziale ripresa, gestisce il risultato finale e stampa il costo totale.Passaggi successivi
Ora che comprendete il ciclo, ecco dove andare a seconda di ciò che state costruendo:- Non avete ancora eseguito un agente? Iniziate con la quickstart per ottenere l’SDK installato e vedere un esempio completo in esecuzione da capo a fondo.
- Pronti a collegarvi al vostro progetto? Caricate CLAUDE.md, skills e filesystem hooks in modo che l’agente segua automaticamente le convenzioni del vostro progetto.
- State costruendo un’interfaccia utente interattiva? Abilitate lo streaming per mostrare testo e chiamate di strumenti in tempo reale mentre il ciclo viene eseguito.
- Avete bisogno di un controllo più stretto su ciò che l’agente può fare? Bloccate l’accesso agli strumenti con autorizzazioni e utilizzate hooks per controllare, bloccare o trasformare le chiamate di strumenti prima che vengano eseguite.
- State eseguendo attività lunghe o costose? Delegate il lavoro isolato ai subagenti per mantenere il vostro contesto principale snello.