18. November 2025

Wie clevere Werkzeugnutzung kleine KI-Modelle plötzlich konkurrenzfähig macht

DeepEyesV2 setzt nicht auf reine Größe, sondern auf kluge Strategien – doch was bedeutet das für den praktischen Einsatz von KI?

DeepEyesV2 zeigt eindrucksvoll, dass sich mit gutem Training und gezielt eingesetzten Werkzeugen erstaunlich viel aus einem kompakten KI-Modell herausholen lässt. Statt die Parameterzahl aufzublasen, kombiniert das System Bildverständnis, Codeausführung und Websuche – und übertrifft damit in einigen Bereichen sogar deutlich größere Modelle. Besonders spannend ist, wie sauber das Training aufgebaut wurde: Die Forschenden nutzten eine zweistufige Pipeline, um stabile Werkzeugnutzung sicherzustellen und Fehlausgaben zu vermeiden.

Im RealX-Benchmark offenbart sich dann, wie anspruchsvoll koordinierte multimodale Aufgaben tatsächlich sind. Das Identifizieren einer Blume, inklusive Bildausschnitt, visueller Websuche und logischer Schlussfolgerung, bringt selbst große Systeme an ihre Grenzen. Während Menschen hier rund 70 Prozent erreichen, schaffen es selbst die stärksten proprietären Modelle nur auf 46 Prozent. DeepEyesV2 liegt mit 28,3 Prozent zwar unterhalb der Spitzenklasse, zeigt aber bemerkenswerte Vorteile gegenüber gleich großen Open-Source-Modellen – besonders dann, wenn alle Fähigkeiten gleichzeitig gefragt sind.

Noch deutlicher wird die Stärke des Modells in spezialisierten Benchmarks. Auf MathVerse verbessert sich die Genauigkeit um über sieben Prozentpunkte gegenüber dem Basismodell, und in suchorientierten Tests schlägt DeepEyesV2 sogar dedizierte Spezialmodelle. Genau hier zeigt sich das eigentliche Potenzial: Die Fähigkeit, externe Ressourcen gezielt einzubinden, macht reine Modellgröße weniger entscheidend. Die Analyse der Werkzeugnutzung zeigt zudem ein sehr flexibles, aufgabenabhängiges Verhalten – ein Schritt hin zu echten agentischen Fähigkeiten.

Für Xiaohongshu ist DeepEyesV2 ein weiterer Baustein, um sich international als ernstzunehmender Player im Open-Source-KI-Bereich zu etablieren. Schon dots.llm1 und dots.ocr hatten gezeigt, dass das Unternehmen effiziente und leistungsfähige Modelle bauen kann. Mit DeepEyesV2 entsteht nun eine Plattform, die multimodales Denken zunehmend besser beherrscht und Entwicklerinnen wie Entwickler dazu einlädt, diese Fähigkeiten in eigenen Projekten zu nutzen.


Wir führen seit Jahren Beratung zu KI (Künstlicher Intelligenz) für KMUs (Klein- und Mittelständische Unternehmen) erfolgreich durch.

Mehr zu aktuellen Themen der #KI (Künstlichen Intelligenz) oder zu

Ihrem individuellen, optimalen "KI-Masterplan" für Ihr Unternehmen finden Sie in unserem Newsletter.

Abonnieren Sie den Newsletter hier:


Tags


Das könnte Sie auch interessieren

Abonnieren Sie jetzt unseren Newsletter!

>