Zum Hauptinhalt springen
Das Claude Agent SDK unterscheidet sich von traditionellen zustandslosen LLM-APIs dadurch, dass es den Konversationszustand beibehält und Befehle in einer persistenten Umgebung ausführt. Dieser Leitfaden behandelt die Architektur, Hosting-Überlegungen und Best Practices für die Bereitstellung von SDK-basierten Agenten in der Produktion.
Für Sicherheitshärtung über grundlegende Sandboxing hinaus (einschließlich Netzwerkkontrollen, Verwaltung von Anmeldedaten und Isolationsoptionen) siehe Sichere Bereitstellung.

Hosting-Anforderungen

Container-basiertes Sandboxing

Aus Sicherheits- und Isolationsgründen sollte das SDK in einer Sandbox-Container-Umgebung ausgeführt werden. Dies bietet Prozessisolation, Ressourcenlimits, Netzwerksteuerung und ephemere Dateisysteme. Das SDK unterstützt auch programmgesteuerte Sandbox-Konfiguration für die Befehlsausführung.

Systemanforderungen

Jede SDK-Instanz erfordert:
  • Laufzeit-Abhängigkeiten
    • Python 3.10+ für das Python SDK oder Node.js 18+ für das TypeScript SDK
    • Beide SDK-Pakete enthalten eine native Claude Code-Binärdatei für die Host-Plattform, daher ist keine separate Claude Code- oder Node.js-Installation für die gestartete CLI erforderlich
  • Ressourcenzuteilung
    • Empfohlen: 1 GiB RAM, 5 GiB Festplatte und 1 CPU (variieren Sie dies je nach Aufgabe nach Bedarf)
  • Netzwerkzugriff
    • Ausgehend HTTPS zu api.anthropic.com
    • Optional: Zugriff auf MCP-Server oder externe Tools

Verständnis der SDK-Architektur

Im Gegensatz zu zustandslosen API-Aufrufen funktioniert das Claude Agent SDK als ein lang laufender Prozess, der:
  • Befehle ausführt in einer persistenten Shell-Umgebung
  • Dateivorgänge verwaltet innerhalb eines Arbeitsverzeichnisses
  • Tool-Ausführung handhabt mit Kontext aus vorherigen Interaktionen

Sandbox-Anbieter-Optionen

Mehrere Anbieter spezialisieren sich auf sichere Container-Umgebungen für KI-Code-Ausführung: Für selbst gehostete Optionen (Docker, gVisor, Firecracker) und detaillierte Isolationskonfiguration siehe Isolationstechnologien.

Produktionsbereitstellungsmuster

Muster 1: Ephemere Sitzungen

Erstellen Sie einen neuen Container für jede Benutzeraufgabe und zerstören Sie ihn nach Abschluss. Am besten für einmalige Aufgaben, der Benutzer kann weiterhin mit der KI interagieren, während die Aufgabe abgeschlossen wird, aber nach Abschluss wird der Container zerstört. Beispiele:
  • Fehleruntersuchung und -behebung: Debuggen und Beheben eines spezifischen Problems mit relevantem Kontext
  • Rechnungsverarbeitung: Extrahieren und Strukturieren von Daten aus Quittungen/Rechnungen für Buchhaltungssysteme
  • Übersetzungsaufgaben: Übersetzen von Dokumenten oder Inhaltschargen zwischen Sprachen
  • Bild-/Videobearbeitung: Anwenden von Transformationen, Optimierungen oder Extrahieren von Metadaten aus Mediendateien

Muster 2: Lang laufende Sitzungen

Behalten Sie persistente Container-Instanzen für lang laufende Aufgaben bei. Oft laufen mehrere Claude Agent-Prozesse innerhalb des Containers basierend auf Bedarf. Am besten für proaktive Agenten, die ohne Benutzereingabe handeln, Agenten, die Inhalte bereitstellen, oder Agenten, die große Mengen an Nachrichten verarbeiten. Beispiele:
  • E-Mail-Agent: Überwacht eingehende E-Mails und sortiert, antwortet oder ergreift automatisch Maßnahmen basierend auf dem Inhalt
  • Website-Builder: Hostet benutzerdefinierte Websites pro Benutzer mit Live-Bearbeitungsfunktionen, die über Container-Ports bereitgestellt werden
  • Hochfrequente Chat-Bots: Verarbeitet kontinuierliche Nachrichtenströme von Plattformen wie Slack, wo schnelle Reaktionszeiten entscheidend sind

Muster 3: Hybrid-Sitzungen

Ephemere Container, die mit Verlauf und Zustand hydratisiert werden, möglicherweise aus einer Datenbank oder aus den Sitzungswiederaufnahmefunktionen des SDK. Am besten für Container mit intermittierender Benutzerinteraktion, die Arbeit startet und herunterfährt, wenn die Arbeit abgeschlossen ist, aber fortgesetzt werden kann. Beispiele:
  • Persönlicher Projektmanager: Hilft bei der Verwaltung laufender Projekte mit intermittierenden Check-ins, behält den Kontext von Aufgaben, Entscheidungen und Fortschritt
  • Tiefgehende Recherche: Führt mehrstündige Recherchaufgaben durch, speichert Erkenntnisse und setzt die Untersuchung fort, wenn der Benutzer zurückkehrt
  • Kundenservice-Agent: Verarbeitet Support-Tickets, die mehrere Interaktionen umfassen, lädt Ticket-Verlauf und Kundenkontext

Muster 4: Einzelne Container

Führen Sie mehrere Claude Agent SDK-Prozesse in einem globalen Container aus. Am besten für Agenten, die eng zusammenarbeiten müssen. Dies ist wahrscheinlich das am wenigsten beliebte Muster, da Sie verhindern müssen, dass Agenten sich gegenseitig überschreiben. Beispiele:
  • Simulationen: Agenten, die in Simulationen wie Videospielen miteinander interagieren.

Häufig gestellte Fragen

Wie kommuniziere ich mit meinen Sandboxes?

Beim Hosting in Containern müssen Sie Ports freigeben, um mit Ihren SDK-Instanzen zu kommunizieren. Ihre Anwendung kann HTTP/WebSocket-Endpunkte für externe Clients freigeben, während das SDK intern im Container ausgeführt wird.

Was kostet das Hosting eines Containers?

Die dominanten Kosten für die Bereitstellung von Agenten sind die Token; Container variieren je nachdem, was Sie bereitstellen, aber die Mindestkosten liegen bei etwa 5 Cent pro Stunde Laufzeit.

Wann sollte ich untätige Container herunterfahren und wann sollte ich sie warm halten?

Dies ist wahrscheinlich anbieterabhängig, verschiedene Sandbox-Anbieter ermöglichen es Ihnen, unterschiedliche Kriterien für Leerlauf-Timeouts festzulegen, nach denen eine Sandbox möglicherweise heruntergefahren wird. Sie sollten diesen Timeout basierend darauf abstimmen, wie häufig Sie denken, dass eine Benutzerantwort erfolgen könnte.

Wie oft sollte ich die Claude Code CLI aktualisieren?

Die Claude Code CLI wird mit Semver versioniert, daher werden alle Breaking Changes versioniert.

Wie überwache ich die Container-Integrität und die Agent-Leistung?

Da Container nur Server sind, funktioniert die gleiche Logging-Infrastruktur, die Sie für das Backend verwenden, auch für Container.

Wie lange kann eine Agent-Sitzung laufen, bevor sie ausfällt?

Eine Agent-Sitzung wird nicht ausfallen, aber erwägen Sie, eine ‘maxTurns’-Eigenschaft festzulegen, um zu verhindern, dass Claude in einer Schleife stecken bleibt.

Nächste Schritte