5. Juni 2026

Gemma 4 12B bringt multimodale KI auf lokale Geräte

Multimodale KI muss nicht zwangsläufig in großen Rechenzentren laufen. Mit Gemma 4 12B zeigt Google Deepmind, dass Text-, Bild- und Audioverarbeitung auch auf handelsüblichen Laptops lokal möglich sein soll.

Das neue offene KI-Modell verarbeitet Text, Bilder und Audio direkt im Sprachmodell. Separate Encoder sind dafür nicht erforderlich. Bilder und Audiosignale werden unmittelbar eingespeist, wodurch sich laut Beschreibung sowohl die Verarbeitungszeit als auch Speicherbedarf und Latenz reduzieren.

Technisch interessant ist vor allem der Anspruch, dass Gemma 4 12B bereits mit 16 GB RAM lokal betrieben werden kann. Laut Google erreicht das Modell in Benchmarks nahezu die Leistung des doppelt so großen 26B-Modells. Zugleich ist es das erste mittelgroße Modell der Gemma-Reihe, das Audio nativ verarbeiten kann.

Die Einsatzmöglichkeiten reichen von Spracherkennung über Codegenerierung bis zur Videoanalyse. Laut Developer Guide kann Gemma 4 12B mehrminütige Videoclips auswerten, indem es Einzelbilder und Audiospur gemeinsam analysiert. In einem Beispiel wurde ein fünfminütiger Ausschnitt der Google-IO-Keynote mit 313 Frames bei einem Bild pro Sekunde sowie zusätzlichem Audio verarbeitet.

Für Entwickler und Unternehmen ist vor allem die lokale Nutzbarkeit relevant. Wenn multimodale Modelle auf normaler Hardware laufen, können Tests, Prototypen und bestimmte Anwendungen näher an den Arbeitsplatz rücken, ohne zwingend auf große Cloud-Infrastruktur angewiesen zu sein. Die offene Bereitstellung erleichtert zudem die Integration in bestehende Entwicklungsumgebungen.

Gemma 4 12B ist über Plattformen wie Hugging Face, Ollama, LM Studio und weitere Dienste verfügbar. Durch die Apache-2.0-Lizenz kann das Modell auch kommerziell genutzt werden.


Wir führen seit Jahren Beratung zu KI (Künstlicher Intelligenz) für KMUs (Klein- und Mittelständische Unternehmen) erfolgreich durch.

Mehr zu aktuellen Themen der #KI (Künstlichen Intelligenz) oder zu

Ihrem individuellen, optimalen "KI-Masterplan" für Ihr Unternehmen finden Sie in unserem Newsletter.

Abonnieren Sie den Newsletter hier:


Tags


Das könnte Sie auch interessieren

Abonnieren Sie jetzt unseren Newsletter!

>