22. Dezember 2024

Veo 2 und Imagen 3: Googles neue KI-Modelle für Video- und Bildgenerierung

Google hat zwei innovative KI-Modelle vorgestellt: Veo 2 für hochauflösende Videogenerierung und Imagen 3 für verbesserte Bilddarstellung. Diese Modelle sollen neue Maßstäbe in der Qualität von KI-generierten Inhalten setzen.

Wie performant sind Veo 2 und Imagen 3?

Google hebt Veo 2 als fortschrittliches Videomodell hervor, das Videos in 4K-Auflösung erstellen und komplexe, cinematografische Anweisungen verstehen kann – darunter Linsentypen und spezielle Kameraeffekte. Die erstellten Videos können sogar mehrere Minuten lang sein.

Ein besonderer Fokus lag auf der Reduzierung von sogenannten Halluzinationen, also Fehlern wie zusätzlichen Fingern oder unrealistischen Details. Physikalische Abläufe wirken dadurch natürlicher, was ein großer Fortschritt gegenüber bisherigen Modellen ist.

In Tests mit 1003 Prompts aus Metas MovieGenBench-Datensatz erzielte Veo 2 bessere Ergebnisse als die Konkurrenz, darunter OpenAIs Sora Turbo. Die Testergebnisse basierten auf acht Sekunden langen Videos in 720p-Auflösung, bei denen Veo 2 durch präzises Prompt-Following und eine bessere Gesamtbewertung überzeugte. Dennoch gibt Google zu, dass besonders bei komplexen Bewegungsabläufen und dynamischen Szenen noch Potenzial zur Verbesserung besteht.

Verfügbarkeit von Veo 2

Veo 2 wird zunächst in ausgewählten Plattformen wie VideoFX, YouTube und Googles Vertex-AI bereitgestellt. Ab 2025 soll das Modell auch in YouTube Shorts und weiteren Produkten Einzug halten. Alle generierten Inhalte werden dabei durch ein unsichtbares SynthID-Wasserzeichen als KI-generiert gekennzeichnet.

Imagen 3: Fortschrittliche Bildgenerierung

Parallel dazu bringt Google mit Imagen 3 die nächste Generation seines Bildmodells auf den Markt. Dieses Modell überzeugt durch eine verbesserte Farbbalance, lebendigere Bilder und optimierte Darstellung verschiedener Kunststile – von Fotorealismus über Impressionismus bis zu Anime und abstrakter Kunst.

Zudem steigert Imagen 3 die Detailgenauigkeit: Feine Texturen und reichhaltige Details sorgen für visuell beeindruckendere Ergebnisse. Das Modell wird global über Googles ImageFX-Tool in mehr als 100 Ländern ausgerollt. Auch im Google Gemini-Chat ist Imagen 3 integriert, wobei Google offen lässt, wann künftige Aktualisierungen verfügbar sein werden.

Googles KI-Offensive: Ein Blick in die Zukunft

Mit Veo 2 und Imagen 3 zeigt Google einmal mehr, wie leistungsfähig moderne KI-Modelle geworden sind. Während Veo 2 die Welt der Videogenerierung auf ein neues Level hebt, liefert Imagen 3 brillante visuelle Ergebnisse für unterschiedlichste Anwendungen. Für Nutzer weltweit dürften diese Tools bald in vielen Bereichen – von YouTube-Videos bis hin zu künstlerischen Projekten – unverzichtbar werden.


Wir führen seit Jahren Beratung zu KI (Künstlicher Intelligenz) für KMUs (Klein- und Mittelständische Unternehmen) erfolgreich durch.

Mehr zu aktuellen Themen der #KI (Künstlichen Intelligenz) oder zu

Ihrem individuellen, optimalen "KI-Masterplan" für Ihr Unternehmen finden Sie in unserem Newsletter.

Abonnieren Sie den Newsletter hier:


Tags


Das könnte Sie auch interessieren

Abonnieren Sie jetzt unseren Newsletter!

>