27. März 2024

Apple stellt bahnbrechendes multimodales KI-Modell MM1 vor

Entdecken Sie MM1, Apples jüngste Innovation im Bereich der künstlichen Intelligenz, die die Art und Weise, wie wir mit Technologie interagieren, revolutionieren könnte.

Das Herzstück von Apples neuestem Durchbruch ist das multimodale KI-Modell MM1, ein Large Language Model (LLM), das nicht nur Text, sondern auch Bilder verarbeiten kann. Mit der Fähigkeit, auf bis zu 30 Milliarden Parameter zu skalieren, mag MM1 auf den ersten Blick weniger mächtig erscheinen als andere Giganten wie GPT-4 oder Google Gemini. Doch der Schein trügt.

Dank eines speziellen Pre-Training-Verfahrens erreicht MM1 eine konkurrenzfähige Leistung, die die Erwartungen bei Weitem übertrifft. Durch die geschickte Kombination aus Bild-Beschriftungen, Bild-Text- und Nur-Text-Daten während des Pre-Trainings, offenbart MM1 beeindruckende Fähigkeiten. Es kann aus Bildern Rückschlüsse auf die aktuellen Temperaturverhältnisse ziehen und Multi-Step-Reasoning über mehrere Bilder hinweg durchführen. Die Forschung hinter MM1 hat entscheidende Komponenten der LLM-Architektur beleuchtet und die Notwendigkeit einer größeren Offenheit in der Dokumentation von Designentscheidungen und Pre-Training-Prozessen unterstrichen. Apples Wissenschaftler teilen die Erkenntnisse mit der Hoffnung, der KI-Community wertvolle Lektionen für die Entwicklung starker Modelle zu bieten.


Wir führen seit Jahren Beratung zu KI (Künstlicher Intelligenz) für KMUs (Klein- und Mittelständische Unternehmen) erfolgreich durch.

Mehr zu aktuellen Themen der #KI (Künstlichen Intelligenz) oder zu

Ihrem individuellen, optimalen "KI-Masterplan" für Ihr Unternehmen finden Sie in unserem Newsletter.

Abonnieren Sie den Newsletter hier:


Tags


Das könnte Sie auch interessieren

Abonnieren Sie jetzt unseren Newsletter!

>