Die Schleife auf einen Blick
Jede Agent-Sitzung folgt dem gleichen Zyklus:- Prompt empfangen. Claude empfängt Ihren Prompt zusammen mit dem System-Prompt, Werkzeugdefinitionen und Gesprächsverlauf. Das SDK gibt eine
SystemMessagemit dem Subtyp"init"aus, die Sitzungsmetadaten enthält. - Bewerten und antworten. Claude bewertet den aktuellen Status und bestimmt, wie vorzugehen ist. Es kann mit Text antworten, einen oder mehrere Werkzeugaufrufe anfordern oder beides. Das SDK gibt eine
AssistantMessageaus, die den Text und alle Werkzeugaufrufe enthält. - Werkzeuge ausführen. Das SDK führt jedes angeforderte Werkzeug aus und sammelt die Ergebnisse. Jeder Satz von Werkzeugergebnissen wird an Claude für die nächste Entscheidung zurückgesendet. Sie können Hooks verwenden, um Werkzeugaufrufe vor ihrer Ausführung abzufangen, zu ändern oder zu blockieren.
- Wiederholen. Die Schritte 2 und 3 wiederholen sich als Zyklus. Jeder vollständige Zyklus ist eine Runde. Claude ruft weiterhin Werkzeuge auf und verarbeitet Ergebnisse, bis es eine Antwort ohne Werkzeugaufrufe erzeugt.
- Ergebnis zurückgeben. Das SDK gibt eine endgültige
AssistantMessagemit der Textantwort (keine Werkzeugaufrufe) aus, gefolgt von einerResultMessagemit dem endgültigen Text, Token-Nutzung, Kosten und Sitzungs-ID.
Glob aufgerufen und die Ergebnisse beantwortet werden. Eine komplexe Aufgabe („refaktorisieren Sie das Auth-Modul und aktualisieren Sie die Tests”) kann Dutzende von Werkzeugaufrufen über viele Runden hinweg verketten, Dateien lesen, Code bearbeiten und Tests ausführen, wobei Claude seinen Ansatz basierend auf jedem Ergebnis anpasst.
Runden und Nachrichten
Eine Runde ist eine Hin- und Rückfahrt in der Schleife: Claude erzeugt eine Ausgabe, die Werkzeugaufrufe enthält, das SDK führt diese Werkzeuge aus, und die Ergebnisse werden automatisch an Claude zurückgesendet. Dies geschieht, ohne die Kontrolle an Ihren Code zurückzugeben. Runden werden fortgesetzt, bis Claude eine Ausgabe ohne Werkzeugaufrufe erzeugt, woraufhin die Schleife endet und das endgültige Ergebnis geliefert wird. Stellen Sie sich vor, wie eine vollständige Sitzung für den Prompt „Beheben Sie die fehlgeschlagenen Tests in auth.ts” aussehen könnte. Zunächst sendet das SDK Ihren Prompt an Claude und gibt eineSystemMessage mit den Sitzungsmetadaten aus. Dann beginnt die Schleife:
- Runde 1: Claude ruft
Bashauf, umnpm testauszuführen. Das SDK gibt eineAssistantMessagemit dem Werkzeugaufruf aus, führt den Befehl aus und gibt dann eineUserMessagemit der Ausgabe (drei Fehler) aus. - Runde 2: Claude ruft
Readaufauth.tsundauth.test.tsauf. Das SDK gibt die Dateiinhalte zurück und gibt eineAssistantMessageaus. - Runde 3: Claude ruft
Editauf, umauth.tszu beheben, und ruft dannBashauf, umnpm testerneut auszuführen. Alle drei Tests bestehen. Das SDK gibt eineAssistantMessageaus. - Letzte Runde: Claude erzeugt eine nur-Text-Antwort ohne Werkzeugaufrufe: „Behobener Auth-Bug, alle drei Tests bestehen jetzt.” Das SDK gibt eine endgültige
AssistantMessagemit diesem Text aus, gefolgt von einerResultMessagemit dem gleichen Text plus Kosten und Nutzung.
max_turns / maxTurns begrenzen, die nur Werkzeug-Nutzungsrunden zählt. Zum Beispiel würde max_turns=2 in der obigen Schleife vor dem Bearbeitungsschritt gestoppt haben. Sie können auch max_budget_usd / maxBudgetUsd verwenden, um Runden basierend auf einem Ausgabenschwellenwert zu begrenzen.
Ohne Limits läuft die Schleife, bis Claude von selbst fertig ist, was für gut definierte Aufgaben in Ordnung ist, aber bei offenen Prompts lange laufen kann („verbessern Sie diese Codebasis”). Das Festlegen eines Budgets ist eine gute Standardeinstellung für Produktionsagenten. Siehe Runden und Budget unten für die Optionsreferenz.
Nachrichtentypen
Während die Schleife läuft, gibt das SDK einen Stream von Nachrichten aus. Jede Nachricht trägt einen Typ, der Ihnen sagt, aus welcher Phase der Schleife sie stammt. Die fünf Kerntypen sind:SystemMessage: Sitzungslebenszyklus-Ereignisse. Das Feldsubtypeunterscheidet sie:"init"ist die erste Nachricht (Sitzungsmetadaten), und"compact_boundary"wird nach Komprimierung ausgelöst. In TypeScript ist die Komprimierungsgrenze ihr eigenerSDKCompactBoundaryMessage-Typ statt eines Subtyps vonSDKSystemMessage.AssistantMessage: wird nach jeder Claude-Antwort ausgegeben, einschließlich der endgültigen nur-Text-Antwort. Enthält Textinhaltsblöcke und Werkzeugaufrufsblöcke aus dieser Runde.UserMessage: wird nach jeder Werkzeugausführung mit dem Werkzeugergebnis-Inhalt ausgegeben, der an Claude zurückgesendet wird. Wird auch für alle Benutzereingaben ausgegeben, die Sie mid-loop streamen.StreamEvent: wird nur ausgegeben, wenn Teilteilnachrichten aktiviert sind. Enthält rohe API-Streaming-Ereignisse (Text-Deltas, Werkzeug-Input-Chunks). Siehe Stream-Antworten.ResultMessage: markiert das Ende der Agent-Schleife. Enthält das endgültige Textergebnis, Token-Nutzung, Kosten und Sitzungs-ID. Überprüfen Sie das Feldsubtype, um zu bestimmen, ob die Aufgabe erfolgreich war oder ein Limit erreicht hat. Eine kleine Anzahl von nachfolgenden Systemevenementen, wieprompt_suggestion, können danach ankommen, daher sollten Sie den Stream bis zum Ende durchlaufen, anstatt beim Ergebnis zu unterbrechen. Siehe Ergebnis verarbeiten.
Nachrichten verarbeiten
Welche Nachrichten Sie verarbeiten, hängt davon ab, was Sie erstellen:- Nur endgültige Ergebnisse: verarbeiten Sie
ResultMessage, um die Ausgabe, Kosten und ob die Aufgabe erfolgreich war oder ein Limit erreicht hat, zu erhalten. - Fortschritts-Updates: verarbeiten Sie
AssistantMessage, um zu sehen, was Claude jede Runde tut, einschließlich welche Werkzeuge es aufgerufen hat. - Live-Streaming: aktivieren Sie Teilteilnachrichten (
include_partial_messagesin Python,includePartialMessagesin TypeScript), umStreamEvent-Nachrichten in Echtzeit zu erhalten. Siehe Stream-Antworten in Echtzeit.
- Python: überprüfen Sie Nachrichtentypen mit
isinstance()gegen Klassen, die ausclaude_agent_sdkimportiert wurden (zum Beispiel,isinstance(message, ResultMessage)). - TypeScript: überprüfen Sie das Feld
typestring (zum Beispiel,message.type === "result").AssistantMessageundUserMessageumhüllen die rohe API-Nachricht in einem.message-Feld, daher befinden sich Inhaltsblöcke beimessage.message.content, nicht beimessage.content.
Beispiel: Nachrichtentypen überprüfen und Ergebnisse verarbeiten
Beispiel: Nachrichtentypen überprüfen und Ergebnisse verarbeiten
Werkzeugausführung
Werkzeuge geben Ihrem Agent die Möglichkeit, Maßnahmen zu ergreifen. Ohne Werkzeuge kann Claude nur mit Text antworten. Mit Werkzeugen kann Claude Dateien lesen, Befehle ausführen, Code durchsuchen und mit externen Diensten interagieren.Integrierte Werkzeuge
Das SDK enthält die gleichen Werkzeuge, die Claude Code antreiben:| Kategorie | Werkzeuge | Was sie tun |
|---|---|---|
| Dateivorgänge | Read, Edit, Write | Dateien lesen, ändern und erstellen |
| Suche | Glob, Grep | Dateien nach Muster finden, Inhalte mit Regex durchsuchen |
| Ausführung | Bash | Shell-Befehle, Skripte, Git-Vorgänge ausführen |
| Web | WebSearch, WebFetch | Das Web durchsuchen, Seiten abrufen und analysieren |
| Erkennung | ToolSearch | Werkzeuge dynamisch finden und bei Bedarf laden, anstatt alle vorab zu laden |
| Orchestrierung | Agent, Skill, AskUserQuestion, TaskCreate, TaskUpdate | Subagenten spawnen, Fähigkeiten aufrufen, den Benutzer fragen, Aufgaben verfolgen |
- Externe Dienste verbinden mit MCP-Servern (Datenbanken, Browser, APIs)
- Benutzerdefinierte Werkzeuge definieren mit benutzerdefinierten Werkzeug-Handlern
- Projekt-Fähigkeiten laden über Einstellungsquellen für wiederverwendbare Workflows
Werkzeugberechtigungen
Claude bestimmt, welche Werkzeuge aufgerufen werden sollen, basierend auf der Aufgabe, aber Sie kontrollieren, ob diese Aufrufe ausgeführt werden dürfen. Sie können bestimmte Werkzeuge automatisch genehmigen, andere vollständig blockieren oder Genehmigung für alles verlangen. Drei Optionen arbeiten zusammen, um zu bestimmen, was ausgeführt wird:allowed_tools/allowedToolsgenehmigt automatisch aufgelistete Werkzeuge. Ein schreibgeschützter Agent mit["Read", "Glob", "Grep"]in seiner Werkzeugliste für zulässige Werkzeuge führt diese Werkzeuge ohne Aufforderung aus. Werkzeuge, die nicht aufgelistet sind, sind immer noch verfügbar, erfordern aber Berechtigung.disallowed_tools/disallowedToolsblockiert aufgelistete Werkzeuge, unabhängig von anderen Einstellungen. Siehe Berechtigungen für die Reihenfolge, in der Regeln überprüft werden, bevor ein Werkzeug ausgeführt wird.permission_mode/permissionModekontrolliert, was mit Werkzeugen passiert, die nicht durch Zulassungs- oder Ablehnungsregeln abgedeckt sind. Siehe Berechtigungsmodus für verfügbare Modi.
"Bash(npm *)" einschränken, um nur bestimmte Befehle zuzulassen. Siehe Berechtigungen für die vollständige Regelsyntax.
Wenn ein Werkzeug abgelehnt wird, erhält Claude eine Ablehnungsnachricht als Werkzeugergebnis und versucht normalerweise einen anderen Ansatz oder meldet, dass es nicht fortfahren konnte.
Parallele Werkzeugausführung
Wenn Claude mehrere Werkzeugaufrufe in einer einzelnen Runde anfordert, können beide SDKs sie je nach Werkzeug gleichzeitig oder sequenziell ausführen. Schreibgeschützte Werkzeuge (wieRead, Glob, Grep und MCP-Werkzeuge, die als schreibgeschützt gekennzeichnet sind) können gleichzeitig ausgeführt werden. Werkzeuge, die den Status ändern (wie Edit, Write und Bash), werden sequenziell ausgeführt, um Konflikte zu vermeiden.
Benutzerdefinierte Werkzeuge verwenden standardmäßig sequenzielle Ausführung. Um parallele Ausführung für ein benutzerdefiniertes Werkzeug zu aktivieren, setzen Sie readOnlyHint in seinen Anmerkungen. Beide TypeScript und Python SDKs verwenden diesen Feldnamen aus dem MCP SDK.
Kontrollieren Sie, wie die Schleife läuft
Sie können begrenzen, wie viele Runden die Schleife dauert, wie viel sie kostet, wie tief Claude denkt, und ob Werkzeuge vor der Ausführung genehmigt werden müssen. All diese sind Felder aufClaudeAgentOptions (Python) / Options (TypeScript).
Runden und Budget
| Option | Was es kontrolliert | Standard |
|---|---|---|
Max Runden (max_turns / maxTurns) | Maximale Werkzeug-Nutzungs-Hin- und Rückfahrten | Kein Limit |
Max Budget (max_budget_usd / maxBudgetUsd) | Maximale Kosten vor dem Stoppen | Kein Limit |
ResultMessage mit einem entsprechenden Fehler-Subtyp (error_max_turns oder error_max_budget_usd) zurück. Siehe Ergebnis verarbeiten für die Überprüfung dieser Subtypen und ClaudeAgentOptions / Options für die Syntax.
Anstrengungsgrad
Die Optioneffort kontrolliert, wie viel Denken Claude anwendet. Niedrigere Anstrengungsgrade verwenden weniger Token pro Runde und reduzieren Kosten. Nicht alle Modelle unterstützen den Anstrengungsparameter. Siehe Anstrengung für welche Modelle es unterstützen.
| Stufe | Verhalten | Gut für |
|---|---|---|
"low" | Minimales Denken, schnelle Antworten | Datei-Lookups, Verzeichnisse auflisten |
"medium" | Ausgewogenes Denken | Routine-Bearbeitungen, Standard-Aufgaben |
"high" | Gründliche Analyse | Refaktorisierungen, Debugging |
"xhigh" | Erweiterte Denktiefe | Kodierungs- und agentengesteuerte Aufgaben; empfohlen auf Opus 4.7 |
"max" | Maximale Denktiefe | Mehrstufige Probleme, die tiefe Analyse erfordern |
effort nicht setzen, lässt das Python SDK den Parameter ungesetzt und überlässt das Standardverhalten dem Modell. Das TypeScript SDK verwendet standardmäßig "high".
effort tauscht Latenz und Token-Kosten gegen Denktiefe innerhalb jeder Antwort. Erweitertes Denken ist eine separate Funktion, die sichtbare Gedankenketten-Blöcke in der Ausgabe erzeugt. Sie sind unabhängig: Sie können effort: "low" mit aktiviertem erweiterten Denken setzen oder effort: "max" ohne es.effort in den Top-Level-query()-Optionen für die gesamte Sitzung oder pro Subagent mit dem Feld effort auf AgentDefinition, um die Sitzungsebene zu überschreiben.
Berechtigungsmodus
Die Berechtigungsmodus-Option (permission_mode in Python, permissionMode in TypeScript) kontrolliert, ob der Agent vor der Verwendung von Werkzeugen um Genehmigung fragt:
| Modus | Verhalten |
|---|---|
"default" | Werkzeuge, die nicht durch Zulassungsregeln abgedeckt sind, lösen Ihren Genehmigungsrückruf aus; kein Rückruf bedeutet Ablehnung |
"acceptEdits" | Genehmigt automatisch Dateibearbeitungen und häufige Dateisystem-Befehle (mkdir, touch, mv, cp, usw.); andere Bash-Befehle folgen Standardregeln |
"plan" | Schreibgeschützte Werkzeuge laufen; Claude erkundet und erzeugt einen Plan, ohne Ihre Quelldateien zu bearbeiten |
"dontAsk" | Fragt nie. Werkzeuge, die durch Berechtigungsregeln vorab genehmigt wurden, laufen, alles andere wird abgelehnt |
"auto" (nur TypeScript) | Verwendet einen Modell-Klassifizierer, um jeden Werkzeugaufruf zu genehmigen oder abzulehnen. Siehe Auto-Modus für Verfügbarkeit und Verhalten |
"bypassPermissions" | Führt alle zulässigen Werkzeuge aus, ohne zu fragen. Kann nicht verwendet werden, wenn als Root auf Unix ausgeführt wird. Verwenden Sie nur in isolierten Umgebungen, in denen die Aktionen des Agenten keine Systeme beeinflussen können, die Ihnen wichtig sind |
"default" mit einem Werkzeug-Genehmigungsrückruf, um Genehmigungsaufforderungen anzuzeigen. Für autonome Agenten auf einer Dev-Maschine verwenden Sie "acceptEdits", um Dateibearbeitungen und häufige Dateisystem-Befehle (mkdir, touch, mv, cp, usw.) automatisch zu genehmigen, während Sie andere Bash-Befehle immer noch hinter Zulassungsregeln gating. Reservieren Sie "bypassPermissions" für CI, Container oder andere isolierte Umgebungen. Siehe Berechtigungen für vollständige Details.
Modell
Wenn Siemodel nicht setzen, verwendet das SDK Claude Codes Standard, der von Ihrer Authentifizierungsmethode und Ihrem Abonnement abhängt. Setzen Sie es explizit (zum Beispiel, model="claude-sonnet-4-6"), um ein bestimmtes Modell zu fixieren oder um ein kleineres Modell für schnellere, billigere Agenten zu verwenden. Siehe Modelle für verfügbare IDs.
Das Kontextfenster
Das Kontextfenster ist die Gesamtmenge an Informationen, die Claude während einer Sitzung zur Verfügung stehen. Es wird nicht zwischen Runden innerhalb einer Sitzung zurückgesetzt. Alles sammelt sich an: der System-Prompt, Werkzeugdefinitionen, Gesprächsverlauf, Werkzeugeingaben und Werkzeugergebnisse. Inhalte, die über Runden hinweg gleich bleiben (System-Prompt, Werkzeugdefinitionen, CLAUDE.md), werden automatisch prompt-gecacht, was Kosten und Latenz für wiederholte Präfixe reduziert.Was Kontext verbraucht
Hier ist, wie jede Komponente den Kontext im SDK beeinflusst:| Quelle | Wann es lädt | Auswirkung |
|---|---|---|
| System-Prompt | Jede Anfrage | Kleine feste Kosten, immer vorhanden |
| CLAUDE.md-Dateien | Sitzungsstart, über settingSources | Vollständiger Inhalt in jeder Anfrage (aber prompt-gecacht, daher zahlt nur die erste Anfrage die vollständigen Kosten) |
| Werkzeugdefinitionen | Jede Anfrage; MCP-Schemas standardmäßig aufgeschoben | Integrierte Werkzeugschemas werden bei jeder Anfrage geladen. Werkzeugsuche schiebt MCP-Werkzeugschemas standardmäßig auf und fällt auf vorherige Laden auf Vertex AI oder einer Nicht-First-Party-ANTHROPIC_BASE_URL zurück. Siehe Werkzeugsuche konfigurieren für die vollständige Matrix |
| Gesprächsverlauf | Sammelt sich über Runden an | Wächst mit jeder Runde: Prompts, Antworten, Werkzeugeingaben, Werkzeugergebnisse |
| Fähigkeitsbeschreibungen | Sitzungsstart, über Einstellungsquellen | Kurze Zusammenfassungen; vollständiger Inhalt lädt nur bei Aufruf |
Automatische Komprimierung
Wenn sich das Kontextfenster seinem Limit nähert, komprimiert das SDK automatisch das Gespräch: Es fasst ältere Verlauf zusammen, um Platz freizugeben, während Ihre neuesten Austausche und wichtigen Entscheidungen intakt bleiben. Das SDK gibt eine Nachricht mittype: "system" und subtype: "compact_boundary" im Stream aus, wenn dies geschieht (in Python ist dies eine SystemMessage; in TypeScript ist es ein separater SDKCompactBoundaryMessage-Typ).
Die Komprimierung ersetzt ältere Nachrichten durch eine Zusammenfassung, daher können spezifische Anweisungen von früh im Gespräch möglicherweise nicht beibehalten werden. Persistente Regeln gehören in CLAUDE.md (geladen über settingSources) statt in den anfänglichen Prompt, da CLAUDE.md-Inhalte bei jeder Anfrage erneut eingespritzt werden.
Sie können das Komprimierungsverhalten auf mehrere Arten anpassen:
- Zusammenfassungsanweisungen in CLAUDE.md: Der Kompressor liest Ihre CLAUDE.md wie jeden anderen Kontext, daher können Sie einen Abschnitt einschließen, der ihm sagt, was beim Zusammenfassen zu bewahren ist. Der Abschnittskopf ist frei (nicht eine magische Zeichenkette); der Kompressor passt auf Absicht an.
PreCompact-Hook: Führen Sie benutzerdefinierte Logik vor der Komprimierung aus, zum Beispiel um das vollständige Transkript zu archivieren. Der Hook erhält eintrigger-Feld (manualoderauto). Siehe Hooks.- Manuelle Komprimierung: Senden Sie
/compactals Prompt-String, um Komprimierung bei Bedarf auszulösen. Befehle, die auf diese Weise gesendet werden, sind SDK-Eingaben, keine nur-CLI-Verknüpfungen. Siehe Befehle im SDK.
Beispiel: Zusammenfassungsanweisungen in CLAUDE.md
Beispiel: Zusammenfassungsanweisungen in CLAUDE.md
Fügen Sie einen Abschnitt zu Ihrer Projekt-CLAUDE.md hinzu, der dem Kompressor sagt, was zu bewahren ist. Der Kopfname ist nicht speziell; verwenden Sie ein beliebiges klares Label.
CLAUDE.md
Kontext effizient halten
Ein paar Strategien für langfristig laufende Agenten:- Verwenden Sie Subagenten für Unteraufgaben. Jeder Subagent startet mit einem frischen Gespräch (kein vorheriger Nachrichtenverlauf, obwohl er seinen eigenen System-Prompt und Projekt-Kontext wie CLAUDE.md lädt). Er sieht nicht die Runden des Elternteils, und nur seine endgültige Antwort kehrt zum Elternteil als Werkzeugergebnis zurück. Der Kontext des Hauptagenten wächst um diese Zusammenfassung, nicht um das vollständige Unteraufgaben-Transkript. Siehe Was Subagenten erben für Details.
- Seien Sie selektiv mit Werkzeugen. Jede Werkzeugdefinition nimmt Kontextraum ein. Verwenden Sie das Feld
toolsaufAgentDefinition, um Subagenten auf die minimale Menge zu beschränken, die sie benötigen. - Beobachten Sie MCP-Server-Kosten. MCP-Werkzeugsuche schiebt MCP-Werkzeugschemas standardmäßig auf und lädt sie bei Bedarf. Wenn die Werkzeugsuche ausgeschaltet ist, auf Vertex AI oder hinter einer Nicht-First-Party-
ANTHROPIC_BASE_URL, fügt jeder MCP-Server alle seine Werkzeugschemas zu jeder Anfrage hinzu, daher können ein paar Server mit vielen Werkzeugen erheblichen Kontext verbrauchen, bevor der Agent irgendwelche Arbeiten verrichtet. - Verwenden Sie niedrigere Anstrengung für Routine-Aufgaben. Setzen Sie Anstrengung auf
"low"für Agenten, die nur Dateien lesen oder Verzeichnisse auflisten müssen. Dies reduziert Token-Nutzung und Kosten.
Sitzungen und Kontinuität
Jede Interaktion mit dem SDK erstellt oder setzt eine Sitzung fort. Erfassen Sie die Sitzungs-ID ausResultMessage.session_id (verfügbar in beiden SDKs), um später fortzufahren. Das TypeScript SDK macht es auch als direktes Feld auf der Init-SystemMessage verfügbar; in Python ist es in SystemMessage.data verschachtelt.
Wenn Sie fortfahren, wird der vollständige Kontext aus vorherigen Runden wiederhergestellt: Dateien, die gelesen wurden, Analysen, die durchgeführt wurden, und Aktionen, die ergriffen wurden. Sie können auch eine Sitzung forken, um in einen anderen Ansatz zu verzweigen, ohne das Original zu ändern.
Siehe Sitzungsverwaltung für den vollständigen Leitfaden zu Resume-, Continue- und Fork-Mustern.
In Python verwaltet
ClaudeSDKClient Sitzungs-IDs automatisch über mehrere Aufrufe hinweg. Siehe die Python SDK-Referenz für Details.Ergebnis verarbeiten
Wenn die Schleife endet, sagt Ihnen dieResultMessage, was passiert ist, und gibt Ihnen die Ausgabe. Das Feld subtype (verfügbar in beiden SDKs) ist die primäre Methode, um den Beendigungsstatus zu überprüfen.
| Ergebnis-Subtyp | Was passiert ist | Feld result verfügbar? |
|---|---|---|
success | Claude hat die Aufgabe normal abgeschlossen | Ja |
error_max_turns | Hat das maxTurns-Limit erreicht, bevor es fertig wurde | Nein |
error_max_budget_usd | Hat das maxBudgetUsd-Limit erreicht, bevor es fertig wurde | Nein |
error_during_execution | Ein Fehler unterbrach die Schleife (zum Beispiel, ein API-Fehler oder abgebrochene Anfrage) | Nein |
error_max_structured_output_retries | Strukturierte Ausgabevalidierung fehlgeschlagen nach dem konfigurierten Wiederholungslimit | Nein |
result (die endgültige Textausgabe) ist nur in der success-Variante vorhanden, daher überprüfen Sie immer den Subtyp, bevor Sie es lesen. Alle Ergebnis-Subtypen tragen total_cost_usd, usage, num_turns und session_id, daher können Sie Kosten verfolgen und fortfahren, auch nach Fehlern. In Python sind total_cost_usd und usage als optional typisiert und können auf einigen Fehlerpfaden None sein, daher schützen Sie vor dem Formatieren. Siehe Kosten und Nutzung verfolgen für Details zur Interpretation der usage-Felder.
Das Ergebnis enthält auch ein Feld stop_reason (string | null in TypeScript, str | None in Python), das angibt, warum das Modell bei seiner endgültigen Runde die Generierung gestoppt hat. Häufige Werte sind end_turn (Modell fertig normal), max_tokens (hat das Ausgabe-Token-Limit erreicht) und refusal (das Modell lehnte die Anfrage ab). Bei Fehler-Ergebnis-Subtypen trägt stop_reason den Wert aus der letzten Assistenten-Antwort, bevor die Schleife endete. Um Ablehnungen zu erkennen, überprüfen Sie stop_reason === "refusal" (TypeScript) oder stop_reason == "refusal" (Python). Siehe SDKResultMessage (TypeScript) oder ResultMessage (Python) für den vollständigen Typ.
Hooks
Hooks sind Rückrufe, die an bestimmten Punkten in der Schleife ausgelöst werden: bevor ein Werkzeug läuft, nachdem es zurückkommt, wenn der Agent fertig ist, und so weiter. Einige häufig verwendete Hooks sind:| Hook | Wann es ausgelöst wird | Häufige Verwendungen |
|---|---|---|
PreToolUse | Bevor ein Werkzeug ausgeführt wird | Eingaben validieren, gefährliche Befehle blockieren |
PostToolUse | Nachdem ein Werkzeug zurückkommt | Ausgaben prüfen, Nebenwirkungen auslösen |
UserPromptSubmit | Wenn ein Prompt gesendet wird | Zusätzlichen Kontext in Prompts injizieren |
Stop | Wenn der Agent fertig ist | Ergebnis validieren, Sitzungsstatus speichern |
SubagentStart / SubagentStop | Wenn ein Subagent spawnt oder abgeschlossen wird | Parallele Task-Ergebnisse verfolgen und aggregieren |
PreCompact | Bevor Kontext-Komprimierung auftritt | Vollständiges Transkript archivieren, bevor zusammengefasst wird |
PreToolUse-Hook, der einen Werkzeugaufruf ablehnt, verhindert seine Ausführung, und Claude erhält stattdessen die Ablehnungsnachricht.
Beide SDKs unterstützen alle oben genannten Ereignisse. Das TypeScript SDK enthält zusätzliche Ereignisse, die Python noch nicht unterstützt. Siehe Ausführung mit Hooks kontrollieren für die vollständige Ereignisliste, Pro-SDK-Verfügbarkeit und die vollständige Callback-API.
Alles zusammenbringen
Dieses Beispiel kombiniert die Schlüsselkonzepte von dieser Seite in einen einzelnen Agent, der fehlgeschlagene Tests behebt. Es konfiguriert den Agent mit zulässigen Werkzeugen (automatisch genehmigt, damit der Agent autonom läuft), Projekteinstellungen und Sicherheitslimits für Runden und Anstrengungsgrad. Während die Schleife läuft, erfasst sie die Sitzungs-ID für mögliche Wiederaufnahme, verarbeitet das endgültige Ergebnis und gibt die Gesamtkosten aus.Nächste Schritte
Jetzt, da Sie die Schleife verstehen, hier ist, wohin Sie gehen sollten, je nachdem, was Sie erstellen:- Haben Sie noch keinen Agent ausgeführt? Beginnen Sie mit dem Schnellstart, um das SDK installiert zu bekommen und ein vollständiges Beispiel von Anfang bis Ende laufen zu sehen.
- Bereit, in Ihr Projekt zu integrieren? Laden Sie CLAUDE.md, Fähigkeiten und Dateisystem-Hooks, damit der Agent automatisch Ihren Projektkonventionen folgt.
- Erstellen Sie eine interaktive Benutzeroberfläche? Aktivieren Sie Streaming, um Live-Text und Werkzeugaufrufe anzuzeigen, während die Schleife läuft.
- Benötigen Sie strengere Kontrolle über das, was der Agent tun kann? Sperren Sie den Werkzeugzugriff mit Berechtigungen und verwenden Sie Hooks, um Werkzeugaufrufe vor ihrer Ausführung zu prüfen, zu blockieren oder zu transformieren.
- Führen Sie lange oder teure Aufgaben aus? Lagern Sie isolierte Arbeiten auf Subagenten aus, um Ihren Hauptkontext schlank zu halten.