Können einfache Spiele komplexe Denkfähigkeiten fördern? Ein Forschungsteam hat dazu überraschende Antworten gefunden.
KI-Systeme meistern normalerweise mathematische Probleme durch intensives Training mit umfangreichen Datensätzen – doch was, wenn sie stattdessen einfach spielen? Ein interdisziplinäres Team von der Rice University, Johns Hopkins University und Nvidia hat mit seinem Konzept „Visual Game Learning“ (ViGaL) einen unkonventionellen Weg eingeschlagen: Arcade-Klassiker wie Snake und Tetris dienen dabei als Trainingseinheiten für multimodale KI-Modelle.
Denkfähigkeiten aus dem Spiel heraus
Statt traditioneller Daten setzen die Forschenden auf Spielumgebungen, um die kognitiven Fähigkeiten des Modells zu fördern. Snake trainiert etwa das Verständnis von 2D-Koordinaten, während eine Tetris-ähnliche Rotation visuelles Denken und Raumverständnis verbessert. Grundlage des Experiments ist das Modell Qwen2.5-VL-7B, das mit insgesamt 72.000 synthetischen Beispielen – erzeugt mit Hunyuan3D – trainiert wurde.
Spiele schlagen Mathe-Datensätze
Das Ergebnis: ViGaL schnitt im Benchmark-Test leicht besser ab als MM-Eureka-Qwen-7B, ein Modell, das speziell für Mathematik trainiert wurde. Besonders bei Geometrieaufgaben erzielte ViGaL teils doppelt so gute Werte. Und selbst im Vergleich zu Modellen wie GPT-4o oder Gemini 2.0 Flash zeigte sich das spielerisch trainierte System konkurrenzfähig.
Verstärkungslernen bringt den Durchbruch
Entscheidend war weniger das klassische Finetuning, sondern ein gezieltes Belohnungslernen. Das Modell lernte, gute von schlechten Entscheidungen zu unterscheiden und entwickelte dadurch eine robustere Problemlösungsstrategie. Mathematische Schritt-für-Schritt-Anleitungen und gezielte Variation des Schwierigkeitsgrads steigerten die Ergebnisse signifikant.
Warum das wichtig ist
ViGaL deutet auf eine neue Ära des KI-Trainings hin: Synthetische Spiele könnten künftig die Notwendigkeit riesiger, teuer annotierter Datensätze reduzieren – und gleichzeitig generalisierbares Denken fördern. Ein spannender Ansatz, der neue Impulse für das Design kognitiver KI setzen könnte.