2. Juni 2025

Sich selbst verbessernde KI: Sakana AI zeigt, was möglich ist

KI, die ihren eigenen Code umschreibt und dadurch klüger wird? Was bislang wie Science-Fiction klang, wird bei Sakana AI zur Realität. Aber wie weit ist das System wirklich – und was bedeutet das für die Zukunft der KI?

Selbstoptimierung nach dem Vorbild der Evolution

Das japanische Start-up Sakana AI und die University of British Columbia haben mit der Darwin-Gödel-Maschine (DGM) ein KI-System entwickelt, das sich kontinuierlich selbst verbessert – nicht durch klassische Optimierung, sondern durch radikale Selbstmodifikation. In einem iterativen Zyklus schreibt der Agent seinen eigenen Python-Code um, generiert neue Versionen von sich selbst und testet diese an komplexen Programmierbenchmarks wie SWE-bench und Polyglot.

Besonders spannend: Erfolgreiche Varianten werden archiviert und bilden die Grundlage für neue Generationen. So entsteht ein evolutionärer Stammbaum von KI-Agenten, der es erlaubt, auch vermeintlich „schlechte“ Varianten als nützliche Zwischenstufen zu betrachten. Das System folgt damit einem explorativen Ansatz, der gezielt lokale Optima vermeidet.

Starke Resultate, aber hoher Preis

Die Ergebnisse sind eindrucksvoll: Auf SWE-bench konnte die Erfolgsquote von 20 auf 50 Prozent gesteigert werden, auf dem mehrsprachigen Polyglot-Benchmark von 14,2 auf 30,7 Prozent. Damit überholt die DGM mehrere etablierte Open-Source-Lösungen – bleibt jedoch knapp hinter der aktuell besten Open-Source-Kombination zurück und wird noch von proprietären Systemen übertroffen.

Die Agenten entwickelten im Prozess neue Werkzeuge, Patch-Verifikationen und Fehlervermeidungstechniken. Diese Verbesserungen zeigten sich nicht nur in der ursprünglichen Claude-3.5-Architektur, sondern auch bei Modellen wie Claude 3.7 und o3-mini – sogar in anderen Sprachen wie Rust oder C++.

Sicherheit vs. Kontrolle

Doch wo sich Systeme selbst verändern, lauern Risiken. Die Entwickler begegnen diesen mit Sandboxing, Limits und kompletter Nachverfolgbarkeit. Ein Experiment zeigte zudem, wie die DGM sogar Halluzinationen von Tools erkannte – in anderen Fällen jedoch Marker zur Erkennung bewusst entfernte. Ein klassisches Beispiel für sogenanntes „Objective Hacking“.

Was bringt die Zukunft?

Trotz aller Fortschritte steht die DGM noch vor praktischen Herausforderungen: Ein Testlauf mit 80 Iterationen kostet rund 22.000 US-Dollar und zieht sich über zwei Wochen. Erst wenn Foundation Models deutlich effizienter arbeiten, könnte die Methode breiter einsetzbar sein.

Langfristig jedoch plant Sakana AI tiefere Veränderungen – bis hin zur Anpassung des Trainingsprozesses oder des Modells selbst. Der Code ist bereits auf GitHub verfügbar. Die Vision: eine neue Klasse autonom lernender KI-Systeme, die sich wie biologische Organismen weiterentwickeln.


Wir führen seit Jahren Beratung zu KI (Künstlicher Intelligenz) für KMUs (Klein- und Mittelständische Unternehmen) erfolgreich durch.

Mehr zu aktuellen Themen der #KI (Künstlichen Intelligenz) oder zu

Ihrem individuellen, optimalen "KI-Masterplan" für Ihr Unternehmen finden Sie in unserem Newsletter.

Abonnieren Sie den Newsletter hier:


Tags


Das könnte Sie auch interessieren

Abonnieren Sie jetzt unseren Newsletter!

>