Neue KI-Prompting-Technik: Mehr Präzision und bessere Nachvollziehbarkeit für Sprachmodelle

Die Art und Weise, wie wir mit Künstlicher Intelligenz kommunizieren, entwickelt sich stetig weiter. Eine neue Methode namens „Highlighted Chain of Thought“ (HoT) verspricht, große Sprachmodelle wie GPT-4o oder Gemini-1.5 nicht nur präziser, sondern auch transparenter zu machen. Doch wie funktioniert diese Technik genau?

HoT: Strukturierte Antworten durch Hervorhebungen

Die Kernidee hinter HoT ist es, KIs dazu zu bringen, ihre Antworten nachvollziehbarer zu gestalten. Dazu werden wichtige Fakten innerhalb der ursprünglichen Frage mit XML-Tags hervorgehoben. Die generierte Antwort enthält dann ebenfalls markierte Abschnitte, die sich direkt auf diese Fakten beziehen. Dadurch wird nicht nur sichergestellt, dass die KI kontextbezogener und faktenorientierter antwortet, sondern es erleichtert auch den Nutzern die Überprüfung der Informationen.

Tests haben gezeigt, dass HoT die Genauigkeit von KI-Modellen um bis zu 15 % steigern kann – insbesondere bei arithmetischen und logischen Aufgaben sowie Frage-Antwort-Szenarien.

KI-Modelle profitieren unterschiedlich stark

Während sich HoT bei vielen Modellen als vorteilhaft erwies, zeigte sich bei komplexeren Reasoning-Modellen wie Deepseek-R1 eine überraschende Schwäche: Die Methode führte hier nicht zu besseren, sondern teilweise sogar schlechteren Ergebnissen. Forscher vermuten, dass die Struktur der Beispiel-Prompts bei diesen Modellen zu Verwirrung führt.

Ein weiteres interessantes Ergebnis betrifft die menschliche Interaktion mit KI-Antworten: Durch die hervorgehobenen Fakten benötigten Testpersonen 25 % weniger Zeit für die Überprüfung. Doch es gibt auch eine Kehrseite – Nutzer neigten dazu, den KI-Antworten stärker zu vertrauen, selbst wenn diese fehlerhaft waren. Das bedeutet, dass eine transparente Darstellung nicht zwangsläufig zu einer besseren Fehlererkennung führt.

Herausforderungen und Zukunftsperspektiven

Obwohl die Methode vielversprechend ist, gibt es noch einige Hürden zu überwinden. Kleinere Sprachmodelle wie Llama-3.1-8B oder Qwen-2.5-Coder-32B konnten die HoT-Technik nicht zuverlässig umsetzen. Zudem kann eine fehlerhafte Platzierung der Tags innerhalb der Antworten zu Ungenauigkeiten und Fehlinterpretationen führen.

Der nächste Schritt der Forscher ist daher, KI-Modelle direkt auf HoT-optimierte Antworten zu trainieren, anstatt sich auf manuelles Prompting zu verlassen. Damit könnte sichergestellt werden, dass die Technik in Zukunft noch effektiver und breiter einsetzbar wird.

Ob sich HoT langfristig durchsetzt, bleibt abzuwarten – doch eines ist sicher: Methoden wie diese sind entscheidend, um KI-Anwendungen transparenter und verlässlicher zu machen.

Wir führen seit Jahren Beratung zu KI (Künstlicher Intelligenz) für KMUs (Klein- und Mittelständische Unternehmen) erfolgreich durch.

Mehr zu aktuellen Themen der #KI (Künstlichen Intelligenz) oder zu

Ihrem individuellen, optimalen "KI-Masterplan" für Ihr Unternehmen finden Sie in unserem Newsletter.

Abonnieren Sie den Newsletter hier:

Neue KI-Prompting-Technik: Mehr Präzision und bessere Nachvollziehbarkeit für Sprachmodelle

Neue KI-Prompting-Technik: Mehr Präzision und bessere Nachvollziehbarkeit für Sprachmodelle

Das könnte Sie auch interessieren

Copilot Cowork bringt Agentenarbeit in Microsoft 365

OpenAI will KI-Sicherheitstests näher an die Realität bringen

Abonnieren Sie jetzt unseren Newsletter!