6. November 2024

KI nutzt Weltmodelle zur effizienteren Web-Navigation

Eine neue Methode setzt auf Weltmodelle, um die Web-Navigation von Künstlicher Intelligenz zu verbessern. Welche Auswirkungen könnte dieser Ansatz auf zukünftige KI-Anwendungen haben?

Wissenschaftler der Yonsei University in Korea haben eine innovative Technik entwickelt, die auf sogenannten Weltmodellen basiert, um KI-Agenten im Internet effizienter zu machen. Dabei simulieren die Weltmodelle mögliche Aktionsfolgen, indem sie relevante Zustandsänderungen auf Webseiten analysieren. Diese Methode soll insbesondere die Effizienz und Genauigkeit von KI-gestützten Systemen bei der Navigation im Web steigern.

Die Forscher testeten zunächst verschiedene Sprachmodelle, um deren Vorhersagefähigkeiten zu prüfen. Die Ergebnisse zeigten, dass heutige Modelle wie GPT-4 Turbo und Claude 3.5 bei der Vorhersage von Aktionsfolgen häufig ungenau sind. Dies liegt daran, dass sie keine vollwertigen Weltmodelle besitzen, die auf umfassende Zustandsveränderungen im Web reagieren können. Hier setzt das neue System an: Es simuliert Aktionen, bevor sie tatsächlich ausgeführt werden, und nutzt dabei eine spezielle Technik namens „transition-focused observation abstraction“. Diese fokussiert sich auf die wesentlichen Änderungen von Webseiten, um die Datenmenge effizient zu reduzieren und den Rechenaufwand zu verringern.

Der Trainingsprozess erfolgt in drei Schritten: Zuerst werden Interaktionsdaten zwischen KI und Webumgebung gesammelt, die durch Prompts generiert werden. Anschließend analysiert das System mithilfe des Hungarian-Algorithmus die Änderungen zwischen aufeinanderfolgenden Seitenzuständen. Die Erkenntnisse werden schließlich in eine prägnante, sprachliche Beschreibung umgewandelt, die sich auf die wichtigsten Änderungen konzentriert und dadurch Rechenleistung spart. Die Effizienz und Geschwindigkeit des Systems wurde in Tests bestätigt. So benötigte es durchschnittlich nur 140,3 Sekunden pro Aufgabe, im Vergleich zu 748,3 Sekunden bei bisherigen Systemen. Besonders im WebArena-Benchmark, der diverse Einsatzfelder wie Online-Shopping und CMS-Management abdeckt, schnitt das neue System deutlich besser ab. Die Erfolgsrate stieg von 12,8 auf 16,6 Prozent, wobei Verbesserungen je nach Anwendungsbereich stark variierten: Die Navigation auf GitLab-Seiten profitierte mit einer Steigerung von 181 Prozent, während bei Online-Shopping-Seiten nur eine geringe Steigerung von drei Prozent erreicht wurde.

Die Forschenden erkennen aber auch Grenzen des Systems, insbesondere bei der Verarbeitung visueller Informationen und der Planung mehrschrittiger Prozesse. Diese Aspekte sollen in zukünftigen Arbeiten weiterentwickelt werden. KI-Systeme, die das Web selbstständig durchkämmen und nutzen können, könnten zukünftig weitreichende Anwendungsgebiete abdecken. Dabei entwickeln auch Unternehmen wie Google mit „Project Jarvis“ und Anthropic mit „Claude Computer Use“ ähnliche Technologien zur Browserautomatisierung.


Wir führen seit Jahren Beratung zu KI (Künstlicher Intelligenz) für KMUs (Klein- und Mittelständische Unternehmen) erfolgreich durch.

Mehr zu aktuellen Themen der #KI (Künstlichen Intelligenz) oder zu

Ihrem individuellen, optimalen "KI-Masterplan" für Ihr Unternehmen finden Sie in unserem Newsletter.

Abonnieren Sie den Newsletter hier:


Tags


Das könnte Sie auch interessieren

Abonnieren Sie jetzt unseren Newsletter!

>