Mit „Dreaming“ erhalten Claude Agents ein System, das vergangene Sitzungen auswertet und daraus wiederkehrende Muster, typische Abläufe und Fehlerquellen erkennt. Besonders interessant ist dabei, dass dieser Lernprozess nicht zwingend ungeprüft ablaufen muss: Entwickler können festlegen, ob neue Erkenntnisse automatisch gespeichert oder erst manuell freigegeben werden.
Gerade bei langfristigen Aufgaben ist das ein wichtiger Punkt. Ein Agent sammelt während der Arbeit Informationen, während Dreaming diese Daten später weiter verfeinert. Dadurch kann der Kontext sauberer bleiben und die KI besser nachvollziehen, welche Arbeitsweisen funktioniert haben und wo sie sich verbessern sollte.
Mit „Outcomes“ kommt zusätzlich eine Art Qualitätsprüfung hinzu. Entwickler definieren konkrete Erfolgskriterien, anschließend bewertet ein separates Modell die Antwort in einem eigenen Kontextfenster. Werden die Vorgaben nicht erfüllt, benennt die Kontrollinstanz die Fehler und der Agent versucht es erneut. Laut internen Benchmarks verbessert das die Erfolgsquote bei Präsentationen um 10,1 Prozent und bei Textdokumenten um 8,4 Prozent gegenüber einfachen Prompting-Schleifen.
Für umfangreiche Aufgaben führt Anthropic außerdem Multiagent Orchestration ein. Ein Haupt-Agent zerlegt komplexe Anfragen in kleinere Arbeitsschritte und verteilt sie an spezialisierte Sub-Agenten. Diese arbeiten parallel auf einem gemeinsamen Dateisystem. Das macht deutlich, wohin sich KI-Agenten entwickeln: weg vom einzelnen Chatbot, hin zu koordinierten KI-Arbeitsgruppen.
