4. März 2025

Neue Phi-4-Modelle von Microsoft: Multimodale KI auf dem nächsten Level

Microsoft erweitert seine KI-Modelle um Phi-4-multimodal und Phi-4-mini. Welche innovativen Funktionen bieten die neuen Modelle?

Microsoft hat seine Phi-Familie um zwei beeindruckende Neuzugänge erweitert: Phi-4-multimodal und Phi-4-mini. Während das erste Modell durch die gleichzeitige Verarbeitung von Sprache, Bildern und Text überzeugt, punktet das zweite als effizientes Textmodell. Diese Entwicklungen zeigen, dass Microsoft seine Stellung im KI-Bereich weiter ausbaut. Doch was genau machen die neuen Modelle so besonders?

Ein Modell für alles: Phi-4-multimodal

Das Herzstück von Phi-4-multimodal ist der „mixture-of-LoRAs“-Ansatz, der es ermöglicht, Text-, Audio- und visuelle Eingaben ohne separate Modelle oder komplexe Pipelines zu verarbeiten. Besonders bemerkenswert ist die Leistung bei der automatischen Spracherkennung (ASR): Mit einer Wortfehlerrate von nur 6,14 Prozent führt das Modell die Rangliste auf Huggingface an und lässt spezialisierte Konkurrenten wie WhisperV3 hinter sich.

Darüber hinaus zeigt Phi-4-multimodal seine Stärken bei Sprachübersetzung und Sprachzusammenfassung sowie bei anspruchsvollen Vision-Aufgaben wie mathematischem und wissenschaftlichem Schlussfolgern. Selbst im Vergleich zu größeren Modellen wie Gemini-2-Flash-lite-preview kann sich Phi-4-multimodal behaupten – und das alles in einer kompakten und effizienten Form.

Klein, aber oho: Phi-4-mini für Textaufgaben

Phi-4-mini, das zweite neue Modell von Microsoft, richtet sich vor allem an Anwender, die Effizienz bei der Textverarbeitung schätzen. Mit 3,8 Milliarden Parametern und einem 128K-Kontextfenster ist dieses Modell für schnelle und präzise Textanalysen optimiert. Besonders spannend ist das sogenannte Function Calling: Phi-4-mini kann externe Tools automatisch nutzen und die Ergebnisse direkt in seine Antworten einfließen lassen. Damit eignet es sich hervorragend für agentenbasierte Systeme, die mit APIs und externen Datenquellen arbeiten.

Besonders die Finanzbranche dürfte von diesem Modell profitieren: Ob komplexe Berechnungen, die Erstellung von Berichten oder die Übersetzung von Finanzdokumenten – Phi-4-mini scheint für diese Aufgaben wie geschaffen.

Sicherheit und Verfügbarkeit

Wie es sich für moderne KI-Modelle gehört, wurden sowohl Phi-4-multimodal als auch Phi-4-mini vom Microsoft AI Red Team auf Herz und Nieren geprüft. Anwender können die neuen Modelle über Azure AI Foundry, Hugging Face und den NVIDIA API Catalog nutzen. Zudem ist bereits ein weiteres Modell der Phi-Familie, das Phi-4-14B, seit Dezember verfügbar.

Ein großer Schritt für KI-Anwendungen

Die neuen Phi-4-Modelle zeigen deutlich, dass Microsoft seine KI-Forschung konsequent vorantreibt. Die Fähigkeit, multimodale Eingaben effizient zu verarbeiten, sowie die optimierte Textverarbeitung machen die Modelle zu attraktiven Optionen für Unternehmen und Entwickler gleichermaßen. Es bleibt spannend zu sehen, wie sich diese Technologien in den kommenden Monaten weiterentwickeln werden.


Wir führen seit Jahren Beratung zu KI (Künstlicher Intelligenz) für KMUs (Klein- und Mittelständische Unternehmen) erfolgreich durch.

Mehr zu aktuellen Themen der #KI (Künstlichen Intelligenz) oder zu

Ihrem individuellen, optimalen "KI-Masterplan" für Ihr Unternehmen finden Sie in unserem Newsletter.

Abonnieren Sie den Newsletter hier:


Tags


Das könnte Sie auch interessieren

Abonnieren Sie jetzt unseren Newsletter!

>