So funktioniert die Agent-Schleife

Das Agent SDK ermöglicht es Ihnen, die autonome Agent-Schleife von Claude Code in Ihre eigenen Anwendungen einzubetten. Das SDK ist ein eigenständiges Paket, das Ihnen programmatische Kontrolle über Werkzeuge, Berechtigungen, Kostenlimits und Ausgabe gibt. Sie müssen die Claude Code CLI nicht installiert haben, um es zu verwenden. Wenn Sie einen Agent starten, führt das SDK die gleiche Ausführungsschleife aus, die Claude Code antreibt: Claude bewertet Ihren Prompt, ruft Werkzeuge auf, um Maßnahmen zu ergreifen, erhält die Ergebnisse und wiederholt dies, bis die Aufgabe abgeschlossen ist. Diese Seite erklärt, was in dieser Schleife passiert, damit Sie Ihre Agenten effektiv erstellen, debuggen und optimieren können.

Die Schleife auf einen Blick

Jede Agent-Sitzung folgt dem gleichen Zyklus:

Diagramm der Agent-Schleife: Ihr Prompt wird in die agentengesteuerte Schleife eingegeben, wo Claude bewertet und entweder Werkzeugaufrufe anfordert, deren Ergebnisse in eine weitere Bewertung zurückfließen, oder die endgültige Antwort zurückgibt

Prompt empfangen. Claude empfängt Ihren Prompt zusammen mit dem System-Prompt, Werkzeugdefinitionen und Gesprächsverlauf. Das SDK gibt eine SystemMessage mit dem Subtyp "init" aus, die Sitzungsmetadaten enthält.
Bewerten und antworten. Claude bewertet den aktuellen Status und bestimmt, wie vorzugehen ist. Es kann mit Text antworten, einen oder mehrere Werkzeugaufrufe anfordern oder beides. Das SDK gibt eine AssistantMessage aus, die den Text und alle Werkzeugaufrufe enthält.
Werkzeuge ausführen. Das SDK führt jedes angeforderte Werkzeug aus und sammelt die Ergebnisse. Jeder Satz von Werkzeugergebnissen wird an Claude für die nächste Entscheidung zurückgesendet. Sie können Hooks verwenden, um Werkzeugaufrufe vor ihrer Ausführung abzufangen, zu ändern oder zu blockieren.
Wiederholen. Die Schritte 2 und 3 wiederholen sich als Zyklus. Jeder vollständige Zyklus ist eine Runde. Claude ruft weiterhin Werkzeuge auf und verarbeitet Ergebnisse, bis es eine Antwort ohne Werkzeugaufrufe erzeugt.
Ergebnis zurückgeben. Das SDK gibt eine endgültige AssistantMessage mit der Textantwort (keine Werkzeugaufrufe) aus, gefolgt von einer ResultMessage mit dem endgültigen Text, Token-Nutzung, Kosten und Sitzungs-ID.

Eine schnelle Frage („welche Dateien sind hier?”) könnte eine oder zwei Runden dauern, in denen Glob aufgerufen und die Ergebnisse beantwortet werden. Eine komplexe Aufgabe („refaktorisieren Sie das Auth-Modul und aktualisieren Sie die Tests”) kann Dutzende von Werkzeugaufrufen über viele Runden hinweg verketten, Dateien lesen, Code bearbeiten und Tests ausführen, wobei Claude seinen Ansatz basierend auf jedem Ergebnis anpasst.

Runden und Nachrichten

Eine Runde ist eine Hin- und Rückfahrt in der Schleife: Claude erzeugt eine Ausgabe, die Werkzeugaufrufe enthält, das SDK führt diese Werkzeuge aus, und die Ergebnisse werden automatisch an Claude zurückgesendet. Dies geschieht, ohne die Kontrolle an Ihren Code zurückzugeben. Runden werden fortgesetzt, bis Claude eine Ausgabe ohne Werkzeugaufrufe erzeugt, woraufhin die Schleife endet und das endgültige Ergebnis geliefert wird. Stellen Sie sich vor, wie eine vollständige Sitzung für den Prompt „Beheben Sie die fehlgeschlagenen Tests in auth.ts” aussehen könnte. Zunächst sendet das SDK Ihren Prompt an Claude und gibt eine SystemMessage mit den Sitzungsmetadaten aus. Dann beginnt die Schleife:

Runde 1: Claude ruft Bash auf, um npm test auszuführen. Das SDK gibt eine AssistantMessage mit dem Werkzeugaufruf aus, führt den Befehl aus und gibt dann eine UserMessage mit der Ausgabe (drei Fehler) aus.
Runde 2: Claude ruft Read auf auth.ts und auth.test.ts auf. Das SDK gibt die Dateiinhalte zurück und gibt eine AssistantMessage aus.
Runde 3: Claude ruft Edit auf, um auth.ts zu beheben, und ruft dann Bash auf, um npm test erneut auszuführen. Alle drei Tests bestehen. Das SDK gibt eine AssistantMessage aus.
Letzte Runde: Claude erzeugt eine nur-Text-Antwort ohne Werkzeugaufrufe: „Behobener Auth-Bug, alle drei Tests bestehen jetzt.” Das SDK gibt eine endgültige AssistantMessage mit diesem Text aus, gefolgt von einer ResultMessage mit dem gleichen Text plus Kosten und Nutzung.

Das waren vier Runden: drei mit Werkzeugaufrufen, eine endgültige nur-Text-Antwort. Sie können die Schleife mit max_turns / maxTurns begrenzen, die nur Werkzeug-Nutzungsrunden zählt. Zum Beispiel würde max_turns=2 in der obigen Schleife vor dem Bearbeitungsschritt gestoppt haben. Sie können auch max_budget_usd / maxBudgetUsd verwenden, um Runden basierend auf einem Ausgabenschwellenwert zu begrenzen. Ohne Limits läuft die Schleife, bis Claude von selbst fertig ist, was für gut definierte Aufgaben in Ordnung ist, aber bei offenen Prompts lange laufen kann („verbessern Sie diese Codebasis”). Das Festlegen eines Budgets ist eine gute Standardeinstellung für Produktionsagenten. Siehe Runden und Budget unten für die Optionsreferenz.

Nachrichtentypen

Während die Schleife läuft, gibt das SDK einen Stream von Nachrichten aus. Jede Nachricht trägt einen Typ, der Ihnen sagt, aus welcher Phase der Schleife sie stammt. Die fünf Kerntypen sind:

SystemMessage: Sitzungslebenszyklus-Ereignisse. Das Feld subtype unterscheidet sie:
- "init": Sitzungsmetadaten für den Durchlauf. Wenn ein SessionStart- oder Setup-Hook während des Sitzungsstarts ausgeführt wird, kommen seine Hook-Lebenszyklus-Nachrichten vor der init-Nachricht an
- "compact_boundary": wird nach Komprimierung ausgelöst
- "informational": einfache Textstatusbanner aus der Schleife
- "worker_shutting_down": die Schleife endet nach der aktuellen Runde, weil der Host beendet wird oder Remote Control getrennt wurde
In TypeScript ist jeder Subtyp außer "init" sein eigener Typ in der SDKMessage-Union statt eines Subtyps von SDKSystemMessage.
AssistantMessage: wird nach jeder Claude-Antwort ausgegeben, einschließlich der endgültigen nur-Text-Antwort. Enthält Textinhaltsblöcke und Werkzeugaufrufsblöcke aus dieser Runde.
UserMessage: wird nach jeder Werkzeugausführung mit dem Werkzeugergebnis-Inhalt ausgegeben, der an Claude zurückgesendet wird. Wird auch für alle Benutzereingaben ausgegeben, die Sie mid-loop streamen.
StreamEvent: wird nur ausgegeben, wenn Teilteilnachrichten aktiviert sind. Enthält rohe API-Streaming-Ereignisse (Text-Deltas, Werkzeug-Input-Chunks). Siehe Stream-Antworten.
ResultMessage: markiert das Ende der Agent-Schleife. Enthält das endgültige Textergebnis, Token-Nutzung, Kosten und Sitzungs-ID. Überprüfen Sie das Feld subtype, um zu bestimmen, ob die Aufgabe erfolgreich war oder ein Limit erreicht hat. Eine kleine Anzahl von nachfolgenden Systemevenementen, wie prompt_suggestion, können danach ankommen, daher sollten Sie den Stream bis zum Ende durchlaufen, anstatt beim Ergebnis zu unterbrechen. Siehe Ergebnis verarbeiten.

Diese fünf Typen decken den vollständigen Lebenszyklus der Agent-Schleife in beiden SDKs ab. Das TypeScript SDK gibt auch zusätzliche Observability-Ereignisse aus (Hook-Ereignisse, Werkzeugfortschritt, Ratenlimits, Task-Benachrichtigungen), die zusätzliche Details bieten, aber nicht erforderlich sind, um die Schleife zu steuern. Siehe die Python-Nachrichtentypen-Referenz und TypeScript-Nachrichtentypen-Referenz für die vollständigen Listen.

Nachrichten verarbeiten

Welche Nachrichten Sie verarbeiten, hängt davon ab, was Sie erstellen:

Nur endgültige Ergebnisse: verarbeiten Sie ResultMessage, um die Ausgabe, Kosten und ob die Aufgabe erfolgreich war oder ein Limit erreicht hat, zu erhalten.
Fortschritts-Updates: verarbeiten Sie AssistantMessage, um zu sehen, was Claude jede Runde tut, einschließlich welche Werkzeuge es aufgerufen hat.
Live-Streaming: aktivieren Sie Teilteilnachrichten (include_partial_messages in Python, includePartialMessages in TypeScript), um StreamEvent-Nachrichten in Echtzeit zu erhalten. Siehe Stream-Antworten in Echtzeit.

Wie Sie Nachrichtentypen überprüfen, hängt vom SDK ab:

Python: überprüfen Sie Nachrichtentypen mit isinstance() gegen Klassen, die aus claude_agent_sdk importiert wurden (zum Beispiel, isinstance(message, ResultMessage)).
TypeScript: überprüfen Sie das Feld type string (zum Beispiel, message.type === "result"). AssistantMessage und UserMessage umhüllen die rohe API-Nachricht in einem .message-Feld, daher befinden sich Inhaltsblöcke bei message.message.content, nicht bei message.content.

Beispiel: Nachrichtentypen überprüfen und Ergebnisse verarbeiten

import asyncio
from claude_agent_sdk import query, AssistantMessage, ResultMessage


async def main():
    try:
        async for message in query(prompt="Summarize this project"):
            if isinstance(message, AssistantMessage):
                print(f"Turn completed: {len(message.content)} content blocks")
            if isinstance(message, ResultMessage):
                if message.subtype == "success":
                    print(message.result)
                else:
                    print(f"Stopped: {message.subtype}")
    except Exception as error:
        # A single-shot query() raises after yielding an error result. If the
        # failure was an error result, the error subtype branches above have
        # already run; connection or process failures yield no result message.
        print(f"Session ended with an error: {error}")


asyncio.run(main())

import { query } from "@anthropic-ai/claude-agent-sdk";

try {
  for await (const message of query({ prompt: "Summarize this project" })) {
    if (message.type === "assistant") {
      console.log(`Turn completed: ${message.message.content.length} content blocks`);
    }
    if (message.type === "result") {
      if (message.subtype === "success") {
        console.log(message.result);
      } else {
        console.log(`Stopped: ${message.subtype}`);
      }
    }
  }
} catch (error) {
  // A single-shot query() throws after yielding an error result. If the
  // failure was an error result, the error subtype branches above have
  // already run; connection or process failures yield no result message.
  console.log(`Session ended with an error: ${error}`);
}

Werkzeugausführung

Werkzeuge geben Ihrem Agent die Möglichkeit, Maßnahmen zu ergreifen. Ohne Werkzeuge kann Claude nur mit Text antworten. Mit Werkzeugen kann Claude Dateien lesen, Befehle ausführen, Code durchsuchen und mit externen Diensten interagieren.

Integrierte Werkzeuge

Das SDK enthält die gleichen Werkzeuge, die Claude Code antreiben:

Kategorie	Werkzeuge	Was sie tun
Dateivorgänge	`Read`, `Edit`, `Write`	Dateien lesen, ändern und erstellen
Suche	`Glob`, `Grep`	Dateien nach Muster finden, Inhalte mit Regex durchsuchen
Ausführung	`Bash`	Shell-Befehle, Skripte, Git-Vorgänge ausführen
Web	`WebSearch`, `WebFetch`	Das Web durchsuchen, Seiten abrufen und analysieren
Erkennung	`ToolSearch`	Werkzeuge dynamisch finden und bei Bedarf laden, anstatt alle vorab zu laden
Orchestrierung	`Agent`, `Skill`, `AskUserQuestion`, `TaskCreate`, `TaskUpdate`	Subagenten spawnen, Fähigkeiten aufrufen, den Benutzer fragen, Aufgaben verfolgen

Über integrierte Werkzeuge hinaus können Sie:

Externe Dienste verbinden mit MCP-Servern (Datenbanken, Browser, APIs)
Benutzerdefinierte Werkzeuge definieren mit benutzerdefinierten Werkzeug-Handlern
Projekt-Fähigkeiten laden über Einstellungsquellen für wiederverwendbare Workflows

Werkzeugberechtigungen

Claude bestimmt, welche Werkzeuge aufgerufen werden sollen, basierend auf der Aufgabe, aber Sie kontrollieren, ob diese Aufrufe ausgeführt werden dürfen. Sie können bestimmte Werkzeuge automatisch genehmigen, andere vollständig blockieren oder Genehmigung für alles verlangen. Drei Optionen arbeiten zusammen, um zu bestimmen, was ausgeführt wird:

allowed_tools / allowedTools genehmigt automatisch aufgelistete Werkzeuge. Ein schreibgeschützter Agent mit ["Read", "Glob", "Grep"] in seiner Werkzeugliste für zulässige Werkzeuge führt diese Werkzeuge ohne Aufforderung aus. Werkzeuge, die nicht aufgelistet sind, sind immer noch verfügbar, erfordern aber Berechtigung.
disallowed_tools / disallowedTools blockiert aufgelistete Werkzeuge, unabhängig von anderen Einstellungen. Siehe Berechtigungen für die Reihenfolge, in der Regeln überprüft werden, bevor ein Werkzeug ausgeführt wird.
permission_mode / permissionMode kontrolliert, was mit Werkzeugen passiert, die nicht durch Zulassungs- oder Ablehnungsregeln abgedeckt sind. Siehe Berechtigungsmodus für verfügbare Modi.

Sie können auch einzelne Werkzeuge mit Regeln wie "Bash(npm *)" einschränken, um nur bestimmte Befehle zuzulassen. Siehe Berechtigungen für die vollständige Regelsyntax. Wenn ein Werkzeug abgelehnt wird, erhält Claude eine Ablehnungsnachricht als Werkzeugergebnis und versucht normalerweise einen anderen Ansatz oder meldet, dass es nicht fortfahren konnte.

Parallele Werkzeugausführung

Wenn Claude mehrere Werkzeugaufrufe in einer einzelnen Runde anfordert, können beide SDKs sie je nach Werkzeug gleichzeitig oder sequenziell ausführen. Schreibgeschützte Werkzeuge (wie Read, Glob, Grep und MCP-Werkzeuge, die als schreibgeschützt gekennzeichnet sind) können gleichzeitig ausgeführt werden. Werkzeuge, die den Status ändern (wie Edit, Write und Bash), werden sequenziell ausgeführt, um Konflikte zu vermeiden. Benutzerdefinierte Werkzeuge verwenden standardmäßig sequenzielle Ausführung. Um parallele Ausführung für ein benutzerdefiniertes Werkzeug zu aktivieren, setzen Sie readOnlyHint in seinen Anmerkungen. Beide TypeScript und Python SDKs verwenden diesen Feldnamen aus dem MCP SDK.

Kontrollieren Sie, wie die Schleife läuft

Sie können begrenzen, wie viele Runden die Schleife dauert, wie viel sie kostet, wie tief Claude denkt, und ob Werkzeuge vor der Ausführung genehmigt werden müssen. All diese sind Felder auf ClaudeAgentOptions (Python) / Options (TypeScript).

Runden und Budget

Option	Was es kontrolliert	Standard
Max Runden (`max_turns` / `maxTurns`)	Maximale Werkzeug-Nutzungs-Hin- und Rückfahrten	Kein Limit
Max Budget (`max_budget_usd` / `maxBudgetUsd`)	Maximale Kosten vor dem Stoppen	Kein Limit

Wenn eines der Limits erreicht wird, gibt das SDK eine ResultMessage mit einem entsprechenden Fehler-Subtyp (error_max_turns oder error_max_budget_usd) zurück. Siehe Ergebnis verarbeiten für die Überprüfung dieser Subtypen und ClaudeAgentOptions / Options für die Syntax. Mit Streaming-Eingabe bleibt eine Nachricht, die Sie senden, während eine Runde noch läuft, in der Warteschlange, wenn diese Runde am Max-Turns-Limit endet, und sie startet ihre eigene Runde mit ihrem eigenen Max-Turns-Limit. Vor v2.1.205 konnte eine Nachricht, die in der letzten Iteration der Runde ankam, in die endende Runde aufgenommen und verloren gehen, ohne jemals das Modell zu erreichen.

Anstrengungsgrad

Die Option effort kontrolliert, wie viel Denken Claude anwendet. Niedrigere Anstrengungsgrade verwenden weniger Token pro Runde und reduzieren Kosten. Nicht alle Modelle unterstützen den Anstrengungsparameter. Siehe Anstrengung für welche Modelle es unterstützen.

Stufe	Verhalten	Gut für
`"low"`	Minimales Denken, schnelle Antworten	Datei-Lookups, Verzeichnisse auflisten
`"medium"`	Ausgewogenes Denken	Routine-Bearbeitungen, Standard-Aufgaben
`"high"`	Gründliche Analyse	Refaktorisierungen, Debugging
`"xhigh"`	Erweiterte Denktiefe	Kodierungs- und agentengesteuerte Aufgaben; empfohlen auf Fable 5, Opus 4.7+ und Sonnet 5
`"max"`	Maximale Denktiefe	Mehrstufige Probleme, die tiefe Analyse erfordern

Wenn Sie effort nicht setzen, lassen beide SDKs den Parameter ungesetzt und überlassen das Standardverhalten dem Modell.

effort tauscht Latenz und Token-Kosten gegen Denktiefe innerhalb jeder Antwort. Erweitertes Denken ist eine separate Funktion, die sichtbare Gedankenketten-Blöcke in der Ausgabe erzeugt. Sie sind unabhängig: Sie können effort: "low" mit aktiviertem erweiterten Denken setzen oder effort: "max" ohne es.

Verwenden Sie niedrigere Anstrengung für Agenten, die einfache, gut definierte Aufgaben ausführen (wie Dateien auflisten oder ein einzelnes Grep ausführen), um Kosten und Latenz zu reduzieren. Setzen Sie effort in den Top-Level-query()-Optionen für die gesamte Sitzung oder pro Subagent mit dem Feld effort auf AgentDefinition, um die Sitzungsebene zu überschreiben.

Berechtigungsmodus

Die Berechtigungsmodus-Option (permission_mode in Python, permissionMode in TypeScript) kontrolliert, ob der Agent vor der Verwendung von Werkzeugen um Genehmigung fragt:

Modus	Verhalten
`"default"`	Werkzeuge, die nicht durch Zulassungsregeln abgedeckt sind, lösen Ihren Genehmigungsrückruf aus; kein Rückruf bedeutet Ablehnung
`"acceptEdits"`	Genehmigt automatisch Dateibearbeitungen und häufige Dateisystem-Befehle (`mkdir`, `touch`, `mv`, `cp`, usw.); andere Bash-Befehle folgen Standardregeln
`"plan"`	Claude erkundet und plant, ohne Ihre Quelldateien zu bearbeiten; Dateibearbeitungen werden nie automatisch genehmigt und werden durch Ihren `canUseTool`-Rückruf aufgefordert
`"dontAsk"`	Fragt nie. Werkzeuge, die durch Berechtigungsregeln vorab genehmigt wurden, laufen, alles andere wird abgelehnt. `AskUserQuestion`, Connector-Werkzeuge die Ihre Organisation auf `ask` gesetzt hat, und MCP-Werkzeuge, die mit `requiresUserInteraction` gekennzeichnet sind, werden abgelehnt, auch wenn Sie sie zugelassen haben
`"auto"`	Verwendet einen Modell-Klassifizierer, um jeden Werkzeugaufruf zu genehmigen oder abzulehnen. Siehe Auto-Modus für Verfügbarkeit und Verhalten
`"bypassPermissions"`	Führt alle zulässigen Werkzeuge aus, ohne zu fragen, es sei denn, eine explizite `ask`-Regel passt, Connector-Werkzeuge die Ihre Organisation auf `ask` gesetzt hat, und Werkzeuge, die Benutzerinteraktion erfordern; siehe Wie Berechtigungen ausgewertet werden für die Vorrangordnung. Kann nicht verwendet werden, wenn als Root auf Unix ausgeführt wird. Verwenden Sie nur in isolierten Umgebungen, in denen die Aktionen des Agenten keine Systeme beeinflussen können, die Ihnen wichtig sind

Für interaktive Anwendungen verwenden Sie "default" mit einem Werkzeug-Genehmigungsrückruf, um Genehmigungsaufforderungen anzuzeigen. Für autonome Agenten auf einer Dev-Maschine verwenden Sie "acceptEdits", um Dateibearbeitungen und häufige Dateisystem-Befehle (mkdir, touch, mv, cp, usw.) automatisch zu genehmigen, während Sie andere Bash-Befehle immer noch hinter Zulassungsregeln gating. Reservieren Sie "bypassPermissions" für CI, Container oder andere isolierte Umgebungen. Siehe Berechtigungen für vollständige Details.

Modell

Wenn Sie model nicht setzen, verwendet das SDK Claude Codes Standard, der von Ihrer Authentifizierungsmethode und Ihrem Abonnement abhängt. Setzen Sie es explizit (zum Beispiel, model="claude-sonnet-5"), um ein bestimmtes Modell zu fixieren oder um ein kleineres Modell für schnellere, billigere Agenten zu verwenden. Siehe Modelle für verfügbare IDs.

Das Kontextfenster

Das Kontextfenster ist die Gesamtmenge an Informationen, die Claude während einer Sitzung zur Verfügung stehen. Es wird nicht zwischen Runden innerhalb einer Sitzung zurückgesetzt. Alles sammelt sich an: der System-Prompt, Werkzeugdefinitionen, Gesprächsverlauf, Werkzeugeingaben und Werkzeugergebnisse. Inhalte, die über Runden hinweg gleich bleiben (System-Prompt, Werkzeugdefinitionen, CLAUDE.md), werden automatisch prompt-gecacht, was Kosten und Latenz für wiederholte Präfixe reduziert.

Was Kontext verbraucht

Hier ist, wie jede Komponente den Kontext im SDK beeinflusst:

Quelle	Wann es lädt	Auswirkung
System-Prompt	Jede Anfrage	Kleine feste Kosten, immer vorhanden
CLAUDE.md-Dateien	Sitzungsstart, über `settingSources`	Vollständiger Inhalt in jeder Anfrage (aber prompt-gecacht, daher zahlt nur die erste Anfrage die vollständigen Kosten)
Werkzeugdefinitionen	Jede Anfrage; MCP-Schemas standardmäßig aufgeschoben	Integrierte Werkzeugschemas werden bei jeder Anfrage geladen. Werkzeugsuche schiebt MCP-Werkzeugschemas standardmäßig auf und fällt auf vorherige Laden auf Google Cloud’s Agent Platform oder einer Nicht-First-Party-`ANTHROPIC_BASE_URL` zurück. Siehe Werkzeugsuche konfigurieren für die vollständige Matrix
Gesprächsverlauf	Sammelt sich über Runden an	Wächst mit jeder Runde: Prompts, Antworten, Werkzeugeingaben, Werkzeugergebnisse
Fähigkeitsbeschreibungen	Sitzungsstart, über Einstellungsquellen	Kurze Zusammenfassungen; vollständiger Inhalt lädt nur bei Aufruf

Große Werkzeugergebnisse verbrauchen erheblichen Kontext. Das Lesen einer großen Datei oder das Ausführen eines Befehls mit ausführlicher Ausgabe kann Tausende von Token in einer einzelnen Runde verwenden. Der Kontext sammelt sich über Runden an, daher bauen längere Sitzungen mit vielen Werkzeugaufrufen erheblich mehr Kontext auf als kurze.

Automatische Komprimierung

Wenn sich das Kontextfenster seinem Limit nähert, komprimiert das SDK automatisch das Gespräch: Es fasst ältere Verlauf zusammen, um Platz freizugeben, während Ihre neuesten Austausche und wichtigen Entscheidungen intakt bleiben. Das SDK gibt eine Nachricht mit type: "system" und subtype: "compact_boundary" im Stream aus, wenn dies geschieht (in Python ist dies eine SystemMessage; in TypeScript ist es ein separater SDKCompactBoundaryMessage-Typ). Die Komprimierung ersetzt ältere Nachrichten durch eine Zusammenfassung, daher können spezifische Anweisungen von früh im Gespräch möglicherweise nicht beibehalten werden. Persistente Regeln gehören in CLAUDE.md (geladen über settingSources) statt in den anfänglichen Prompt, da CLAUDE.md-Inhalte bei jeder Anfrage erneut eingespritzt werden. Sie können das Komprimierungsverhalten auf mehrere Arten anpassen:

Zusammenfassungsanweisungen in CLAUDE.md: Der Kompressor liest Ihre CLAUDE.md wie jeden anderen Kontext, daher können Sie einen Abschnitt einschließen, der ihm sagt, was beim Zusammenfassen zu bewahren ist. Der Abschnittskopf ist frei (nicht eine magische Zeichenkette); der Kompressor passt auf Absicht an.
PreCompact-Hook: Führen Sie benutzerdefinierte Logik vor der Komprimierung aus, zum Beispiel um das vollständige Transkript zu archivieren. Der Hook erhält ein trigger-Feld (manual oder auto). Siehe Hooks.
Manuelle Komprimierung: Senden Sie /compact als Prompt-String, um Komprimierung bei Bedarf auszulösen. Befehle, die auf diese Weise gesendet werden, sind SDK-Eingaben, keine nur-CLI-Verknüpfungen. Siehe Befehle im SDK.

Beispiel: Zusammenfassungsanweisungen in CLAUDE.md

Fügen Sie einen Abschnitt zu Ihrer Projekt-CLAUDE.md hinzu, der dem Kompressor sagt, was zu bewahren ist. Der Kopfname ist nicht speziell; verwenden Sie ein beliebiges klares Label.

CLAUDE.md

# Summary instructions

When summarizing this conversation, always preserve:
- The current task objective and acceptance criteria
- File paths that have been read or modified
- Test results and error messages
- Decisions made and the reasoning behind them

Kontext effizient halten

Ein paar Strategien für langfristig laufende Agenten:

Verwenden Sie Subagenten für Unteraufgaben. Jeder Subagent startet mit einem frischen Gespräch (kein vorheriger Nachrichtenverlauf, obwohl er seinen eigenen System-Prompt und Projekt-Kontext wie CLAUDE.md lädt). Er sieht nicht die Runden des Elternteils, und nur seine endgültige Antwort kehrt zum Elternteil als Werkzeugergebnis zurück. Der Kontext des Hauptagenten wächst um diese Zusammenfassung, nicht um das vollständige Unteraufgaben-Transkript. Siehe Was Subagenten erben für Details.
Seien Sie selektiv mit Werkzeugen. Jede Werkzeugdefinition nimmt Kontextraum ein. Verwenden Sie das Feld tools auf AgentDefinition, um Subagenten auf die minimale Menge zu beschränken, die sie benötigen.
Beobachten Sie MCP-Server-Kosten. MCP-Werkzeugsuche schiebt MCP-Werkzeugschemas standardmäßig auf und lädt sie bei Bedarf. Wenn die Werkzeugsuche ausgeschaltet ist, auf Google Cloud’s Agent Platform oder hinter einer Nicht-First-Party-ANTHROPIC_BASE_URL, fügt jeder MCP-Server alle seine Werkzeugschemas zu jeder Anfrage hinzu, daher können ein paar Server mit vielen Werkzeugen erheblichen Kontext verbrauchen, bevor der Agent irgendwelche Arbeiten verrichtet.
Verwenden Sie niedrigere Anstrengung für Routine-Aufgaben. Setzen Sie Anstrengung auf "low" für Agenten, die nur Dateien lesen oder Verzeichnisse auflisten müssen. Dies reduziert Token-Nutzung und Kosten.

Für eine detaillierte Aufschlüsselung der Pro-Feature-Kontextkosten siehe Kontextkosten verstehen.

Sitzungen und Kontinuität

Jede Interaktion mit dem SDK erstellt oder setzt eine Sitzung fort. Erfassen Sie die Sitzungs-ID aus ResultMessage.session_id (verfügbar in beiden SDKs), um später fortzufahren. Das TypeScript SDK macht es auch als direktes Feld auf der Init-SystemMessage verfügbar; in Python ist es in SystemMessage.data verschachtelt. Wenn Sie fortfahren, wird der vollständige Kontext aus vorherigen Runden wiederhergestellt: Dateien, die gelesen wurden, Analysen, die durchgeführt wurden, und Aktionen, die ergriffen wurden. Sie können auch eine Sitzung forken, um in einen anderen Ansatz zu verzweigen, ohne das Original zu ändern. Siehe Sitzungsverwaltung für den vollständigen Leitfaden zu Resume-, Continue- und Fork-Mustern.

In Python verwaltet ClaudeSDKClient Sitzungs-IDs automatisch über mehrere Aufrufe hinweg. Siehe die Python SDK-Referenz für Details.

Ergebnis verarbeiten

Wenn die Schleife endet, sagt Ihnen die ResultMessage, was passiert ist, und gibt Ihnen die Ausgabe. Das Feld subtype (verfügbar in beiden SDKs) ist die primäre Methode, um den Beendigungsstatus zu überprüfen.

Ergebnis-Subtyp	Was passiert ist	Feld `result` verfügbar?
`success`	Claude hat die Aufgabe normal abgeschlossen	Ja
`error_max_turns`	Hat das `maxTurns`-Limit erreicht, bevor es fertig wurde	Nein
`error_max_budget_usd`	Hat das `maxBudgetUsd`-Limit erreicht, bevor es fertig wurde	Nein
`error_during_execution`	Ein Fehler unterbrach die Schleife (zum Beispiel ein API-Fehler oder eine abgebrochene Anfrage)	Nein
`error_max_structured_output_retries`	Keine gültige strukturierte Ausgabe wurde innerhalb des konfigurierten Wiederholungslimits erzeugt: jeder Versuch schlug die Validierung fehl, oder ein Modell-Fallback zog die abgeschlossene Ausgabe ohne erfolgreiche Wiederholung zurück	Nein

Das Feld result (die endgültige Textausgabe) ist nur in der success-Variante vorhanden, daher überprüfen Sie immer den Subtyp, bevor Sie es lesen. Alle Ergebnis-Subtypen enthalten total_cost_usd, usage, num_turns und session_id, daher können Sie Kosten verfolgen und fortfahren, auch nach Fehlern. In Python sind total_cost_usd und usage als optional typisiert und können auf einigen Fehlerpfaden None sein, daher schützen Sie vor dem Formatieren. Siehe Kosten und Nutzung verfolgen für Details zur Interpretation der usage-Felder.

Wenn eine Abfrage mit einem Fehler-Ergebnis endet:

Ein einzelner query()-Aufruf liefert die endgültige Ergebnis-Nachricht und löst dann einen Fehler aus, der den Fehlertext enthält, wie z. B. Reached maximum number of turns. Das Auslösen ist beabsichtigt — umhüllen Sie die Schleife mit einem Try-Block, wenn Ihr Code danach fortfahren muss. Der zugrunde liegende Claude Code-Prozess beendet sich auch mit einem Nicht-Null-Code.
Eine Streaming-Eingabe-Sitzung bleibt aktiv, und Sie können weiterhin Nachrichten senden.

Das Ergebnis enthält auch ein Feld stop_reason (string | null in TypeScript, str | None in Python), das angibt, warum das Modell bei seiner endgültigen Runde die Generierung gestoppt hat. Häufige Werte sind end_turn (Modell fertig normal), max_tokens (hat das Ausgabe-Token-Limit erreicht) und refusal (das Modell lehnte die Anfrage ab). Bei Fehler-Ergebnis-Subtypen trägt stop_reason den Wert aus der letzten Assistenten-Antwort, bevor die Schleife endete. Um Ablehnungen zu erkennen, überprüfen Sie stop_reason === "refusal" (TypeScript) oder stop_reason == "refusal" (Python). Siehe SDKResultMessage (TypeScript) oder ResultMessage (Python) für den vollständigen Typ.

Hooks

Hooks sind Rückrufe, die an bestimmten Punkten in der Schleife ausgelöst werden: bevor ein Werkzeug läuft, nachdem es zurückkommt, wenn der Agent fertig ist, und so weiter. Einige häufig verwendete Hooks sind:

Hook	Wann es ausgelöst wird	Häufige Verwendungen
`PreToolUse`	Bevor ein Werkzeug ausgeführt wird	Eingaben validieren, gefährliche Befehle blockieren
`PostToolUse`	Nachdem ein Werkzeug zurückkommt	Ausgaben prüfen, Nebenwirkungen auslösen
`UserPromptSubmit`	Wenn ein Prompt gesendet wird	Zusätzlichen Kontext in Prompts injizieren
`Stop`	Wenn der Agent fertig ist	Ergebnis validieren, Sitzungsstatus speichern
`SubagentStart` / `SubagentStop`	Wenn ein Subagent spawnt oder abgeschlossen wird	Parallele Task-Ergebnisse verfolgen und aggregieren
`PreCompact`	Bevor Kontext-Komprimierung auftritt	Vollständiges Transkript archivieren, bevor zusammengefasst wird

Hooks laufen in Ihrem Anwendungsprozess, nicht im Kontext des Agenten, daher verbrauchen sie keinen Kontext. Hooks können auch die Schleife kurzschließen: ein PreToolUse-Hook, der einen Werkzeugaufruf ablehnt, verhindert seine Ausführung, und Claude erhält stattdessen die Ablehnungsnachricht. Beide SDKs unterstützen alle oben genannten Ereignisse. Das TypeScript SDK enthält zusätzliche Ereignisse, die Python noch nicht unterstützt. Siehe Ausführung mit Hooks kontrollieren für die vollständige Ereignisliste, Pro-SDK-Verfügbarkeit und die vollständige Callback-API.

Alles zusammenbringen

Dieses Beispiel kombiniert die Schlüsselkonzepte von dieser Seite in einen einzelnen Agent, der fehlgeschlagene Tests behebt. Es konfiguriert den Agent mit zulässigen Werkzeugen (automatisch genehmigt, damit der Agent autonom läuft), Projekteinstellungen und Sicherheitslimits für Runden und Anstrengungsgrad. Während die Schleife läuft, erfasst sie die Sitzungs-ID für mögliche Wiederaufnahme, verarbeitet das endgültige Ergebnis und gibt die Gesamtkosten aus. Da ein einzelner query()-Aufruf nach dem Ausgeben eines Fehlerergebnisses eine Ausnahme auslöst, ist die Schleife in einen Try-Block eingewickelt, damit das Skript sauber beendet wird, wenn ein Limit erreicht wird.

import asyncio
from claude_agent_sdk import query, ClaudeAgentOptions, ResultMessage


async def run_agent():
    session_id = None

    try:
        async for message in query(
            prompt="Find and fix the bug causing test failures in the auth module",
            options=ClaudeAgentOptions(
                allowed_tools=[
                    "Read",
                    "Edit",
                    "Bash",
                    "Glob",
                    "Grep",
                ],  # Listing tools here auto-approves them (no prompting)
                setting_sources=[
                    "project"
                ],  # Load CLAUDE.md, skills, hooks from current directory
                max_turns=30,  # Prevent runaway sessions
                effort="high",  # Thorough reasoning for complex debugging
            ),
        ):
            # Handle the final result
            if isinstance(message, ResultMessage):
                session_id = message.session_id  # Save for potential resumption

                if message.subtype == "success":
                    print(f"Done: {message.result}")
                elif message.subtype == "error_max_turns":
                    # Agent ran out of turns. Resume with a higher limit.
                    print(f"Hit turn limit. Resume session {session_id} to continue.")
                elif message.subtype == "error_max_budget_usd":
                    print("Hit budget limit.")
                else:
                    print(f"Stopped: {message.subtype}")
                if message.total_cost_usd is not None:
                    print(f"Cost: ${message.total_cost_usd:.4f}")
    except Exception as error:
        # A single-shot query() raises after yielding an error result. If the
        # failure was an error result, the error subtype branches above have
        # already run; connection or process failures yield no result message.
        print(f"Session ended with an error: {error}")


asyncio.run(run_agent())

import { query } from "@anthropic-ai/claude-agent-sdk";

let sessionId: string | undefined;

try {
  for await (const message of query({
    prompt: "Find and fix the bug causing test failures in the auth module",
    options: {
      allowedTools: ["Read", "Edit", "Bash", "Glob", "Grep"], // Listing tools here auto-approves them (no prompting)
      settingSources: ["project"], // Load CLAUDE.md, skills, hooks from current directory
      maxTurns: 30, // Prevent runaway sessions
      effort: "high" // Thorough reasoning for complex debugging
    }
  })) {
    // Save the session ID to resume later if needed
    if (message.type === "system" && message.subtype === "init") {
      sessionId = message.session_id;
    }

    // Handle the final result
    if (message.type === "result") {
      if (message.subtype === "success") {
        console.log(`Done: ${message.result}`);
      } else if (message.subtype === "error_max_turns") {
        // Agent ran out of turns. Resume with a higher limit.
        console.log(`Hit turn limit. Resume session ${sessionId} to continue.`);
      } else if (message.subtype === "error_max_budget_usd") {
        console.log("Hit budget limit.");
      } else {
        console.log(`Stopped: ${message.subtype}`);
      }
      console.log(`Cost: $${message.total_cost_usd.toFixed(4)}`);
    }
  }
} catch (error) {
  // A single-shot query() throws after yielding an error result. If the
  // failure was an error result, the error subtype branches above have
  // already run; connection or process failures yield no result message.
  console.log(`Session ended with an error: ${error}`);
}

Nächste Schritte

Jetzt, da Sie die Schleife verstehen, hier ist, wohin Sie gehen sollten, je nachdem, was Sie erstellen:

Haben Sie noch keinen Agent ausgeführt? Beginnen Sie mit dem Schnellstart, um das SDK installiert zu bekommen und ein vollständiges Beispiel von Anfang bis Ende laufen zu sehen.
Bereit, in Ihr Projekt zu integrieren? Laden Sie CLAUDE.md, Fähigkeiten und Dateisystem-Hooks, damit der Agent automatisch Ihren Projektkonventionen folgt.
Erstellen Sie eine interaktive Benutzeroberfläche? Aktivieren Sie Streaming, um Live-Text und Werkzeugaufrufe anzuzeigen, während die Schleife läuft.
Benötigen Sie strengere Kontrolle über das, was der Agent tun kann? Sperren Sie den Werkzeugzugriff mit Berechtigungen und verwenden Sie Hooks, um Werkzeugaufrufe vor ihrer Ausführung zu prüfen, zu blockieren oder zu transformieren.
Führen Sie lange oder teure Aufgaben aus? Lagern Sie isolierte Arbeiten auf Subagenten aus, um Ihren Hauptkontext schlank zu halten.

Für das breitere konzeptionelle Bild der agentengesteuerten Schleife (nicht SDK-spezifisch) siehe So funktioniert Claude Code. Für einen praktischen Leitfaden zum Entwerfen von Schleifen in Claude Code, von rundenbasierten bis zu zielgesteuerten und proaktiven Schleifen, siehe Loop engineering: getting started with loops im Blog.

Agent SDK

Kernkonzepte

Eingabe und Ausgabe

Mit Tools erweitern

Verhalten anpassen

Kontrolle und Beobachtbarkeit

Bereitstellung

SDK-Referenzen

So funktioniert die Agent-Schleife

Die Schleife auf einen Blick

Runden und Nachrichten

Nachrichtentypen

Nachrichten verarbeiten

Werkzeugausführung

Integrierte Werkzeuge

Werkzeugberechtigungen

Parallele Werkzeugausführung

Kontrollieren Sie, wie die Schleife läuft

Runden und Budget

Anstrengungsgrad

Berechtigungsmodus

Modell

Das Kontextfenster

Was Kontext verbraucht

Automatische Komprimierung

Kontext effizient halten

Sitzungen und Kontinuität

Ergebnis verarbeiten

Hooks

Alles zusammenbringen

Nächste Schritte

​Die Schleife auf einen Blick

​Runden und Nachrichten

​Nachrichtentypen

​Nachrichten verarbeiten

​Werkzeugausführung

​Integrierte Werkzeuge

​Werkzeugberechtigungen

​Parallele Werkzeugausführung

​Kontrollieren Sie, wie die Schleife läuft

​Runden und Budget

​Anstrengungsgrad

​Berechtigungsmodus

​Modell

​Das Kontextfenster

​Was Kontext verbraucht

​Automatische Komprimierung

​Kontext effizient halten

​Sitzungen und Kontinuität

​Ergebnis verarbeiten

​Hooks

​Alles zusammenbringen

​Nächste Schritte

Die Schleife auf einen Blick

Runden und Nachrichten

Nachrichtentypen

Nachrichten verarbeiten

Werkzeugausführung

Integrierte Werkzeuge

Werkzeugberechtigungen

Parallele Werkzeugausführung

Kontrollieren Sie, wie die Schleife läuft

Runden und Budget

Anstrengungsgrad

Berechtigungsmodus

Modell

Das Kontextfenster

Was Kontext verbraucht

Automatische Komprimierung

Kontext effizient halten

Sitzungen und Kontinuität

Ergebnis verarbeiten

Hooks

Alles zusammenbringen

Nächste Schritte