Nous Research hat mit Hermes 3 ein Sprachmodell entwickelt, das die KI-Welt aufhorchen lässt.
Das KI-Forschungsunternehmen Nous Research hat die Veröffentlichung einer neuen Familie von Sprachmodellen namens Hermes 3 bekannt gegeben. Diese Modelle zeichnen sich durch eine außergewöhnliche Steuerbarkeit und eine neutrale Ausrichtung aus, was sie von anderen kommerziellen Modellen deutlich unterscheidet.
Hermes 3 basiert auf dem Open-Source-Modell Llama 3.1 von Meta und umfasst drei verschiedene Instruct-Modelle mit 8, 70 und 405 Milliarden Parametern. Eines der herausragenden Merkmale dieser Modelle ist die Fähigkeit, Anweisungen exakt zu befolgen und sich dabei an die im System-Prompt vorgegebene Weltsicht anzupassen. Im Gegensatz zu anderen Modellen, die aus moralischen Gründen Anweisungen verweigern könnten, gibt es bei Hermes 3 laut Nous Research kein „latentes Gedankenverbrechen“.
Besonders beeindruckend sind die zusätzlichen Fähigkeiten von Hermes 3, wie zum Beispiel die Reward-Modellierung, das Nutzen von „Scratchpads“ für Zwischenergebnisse, die strukturierte Ausgabe mit XML-Tags und die Generierung von internen Monologen für eine transparente Entscheidungsfindung. Das Training von Hermes 3 erfolgte in einer überwachten Finetuning-Phase sowie einer Phase mit Direct Preference Optimization (DPO), wobei insgesamt etwa 400 Millionen Token für die SFT-Phase verwendet wurden. Die Ergebnisse sprechen für sich: Hermes 3 erzielt Spitzenwerte in verschiedenen öffentlichen Benchmarks wie BoolQ und ARC, und das sogar im Vergleich zu den zugrunde liegenden Modellen von Meta. Hermes 3 wurde nicht nur auf klassische Reasoning-Aufgaben trainiert, sondern auch auf kreative und expressive Anwendungen wie Rollenspiele und kreatives Schreiben. Dank der Integration externer Tools und der Nutzung von „Retrieval Augmented Generation“ können die Modelle Informationen aus Dokumenten zitieren, um präzise Antworten auf Fragen zu geben.