Microsoft entwickelt eine neue Methode, um KI-Systeme noch effizienter und flexibler zu gestalten, indem dynamische Few-Shot-Prompts genutzt werden, die die Auswahl der besten Beispiele automatisieren.
In einem jüngsten Beitrag von Franklin Lindemberg Guimarães, einem Microsoft-Mitarbeiter, wird eine neue Methode zur Optimierung von Few-Shot-Prompts vorgestellt, die das Potenzial hat, KI-Modelle sowohl effizienter als auch skalierbarer zu machen. Diese Methode könnte sich als bahnbrechend erweisen, besonders in der Art und Weise, wie Large Language Models (LLMs) gesteuert und trainiert werden.
Dynamische Few-Shot-Prompts: Eine neue Architektur
Traditionelle Few-Shot-Prompts funktionieren, indem sie dem KI-Modell einige wenige Beispiele für die zu lösende Aufgabe direkt im Prompt zur Verfügung stellen. Dies hilft dem Modell, relevante Ergebnisse zu liefern. Der Ansatz von Guimarães geht jedoch einen entscheidenden Schritt weiter: Statt die Beispiele im Prompt zu hinterlegen, werden sie in einem sogenannten Vector Store gespeichert.
Die Funktionsweise ist elegant: Sobald ein Nutzer eine Eingabe macht, durchsucht ein Embedding-Modell den Vector Store nach den am besten passenden Beispielen. Diese Beispiele werden dann dynamisch in den Prompt eingefügt. Dies hat gleich mehrere Vorteile: Der Prompt bleibt schlanker und übersichtlicher, die Genauigkeit der Ergebnisse steigt und das Modell kann effizienter auf eine Vielzahl unterschiedlicher Aufgaben reagieren.
Die Architektur von Guimarães‘ Ansatz besteht aus drei Hauptkomponenten:
- Vector Store: Hier werden die Beispiel-Prompts als Input-Output-Paare gespeichert und über die Eingabe des Nutzers indiziert.
- Embedding Model: Dieses Modell verwandelt die Nutzereingabe in einen Vektor, um die relevantesten Beispiele im Vector Store abzufragen.
- KI-Modell: Es generiert die eigentlichen Antworten auf Basis der dynamisch eingefügten Beispiele.
Flexibilität und Skalierbarkeit für vielfältige Aufgaben
Ein wesentlicher Vorteil dieser dynamischen Few-Shot-Prompts liegt in ihrer Flexibilität und Skalierbarkeit. Anstatt das KI-Modell mit zahlreichen irrelevanten Beispielen zu überladen, werden nur die relevantesten Top-3-Beispiele ausgewählt und in den Prompt eingefügt. Dies ermöglicht eine präzisere und relevantere Antwortgenerierung bei gleichzeitig reduzierten Kosten, da weniger Token verarbeitet werden müssen.
Ein Anwendungsbeispiel, das Microsoft beschreibt, zeigt, wie ein Chatbot drei verschiedene Aufgaben erfüllt: das Anzeigen von Daten als Tabelle, das Klassifizieren von Texten und das Zusammenfassen von Inhalten. Die dynamische Methode wählt dabei jeweils die passenden Beispiele für die jeweilige Nutzeranfrage aus, wodurch die generierten Antworten sowohl relevanter als auch kosteneffizienter werden. Der Ansatz könnte insbesondere bei komplexen Many-Shot-Prompts von großem Nutzen sein, wo eine große Anzahl von Beispielen verarbeitet wird. Durch die dynamische Auswahl der Beispiele bleibt das Modell flexibel und kann auf eine Vielzahl von Aufgaben reagieren, ohne an Genauigkeit zu verlieren.