31. Dezember 2024

Google Whisk: Spielerische Bilderstellung mit neuen Ansätzen

Google hat mit Whisk einen innovativen Bildgenerator vorgestellt, der den kreativen Prozess auf neue Weise interpretiert. Im Gegensatz zu anderen Bildgeneratoren kommen hier zunächst keine Texteingaben, sondern Bilder als Prompt zum Einsatz. Doch wie genau funktioniert Whisk, und was macht es besonders?

Experimentelles Konzept: Bilder statt Worte
Whisk setzt auf einen ungewöhnlichen Ansatz: Anstelle von Text-Prompts, wie sie bei gängigen KI-Bildgeneratoren üblich sind, werden mehrere Bilder kombiniert, um neue Grafiken zu erstellen. Ein Bild dient dabei als Subjekt, ein weiteres definiert die Szenerie und ein drittes legt den gewünschten Stil fest. Google beschreibt Whisk als kreativen Spielplatz, bei dem der Spaßfaktor im Vordergrund steht – getreu dem Motto: „Prompt less, Play more“.

Aktuell steht Whisk ausschließlich Nutzerinnen und Nutzern in den USA zur Verfügung, die über die Testumgebung Google Labs Zugriff darauf erhalten. Google betont den experimentellen Charakter des Tools und hebt hervor, dass es nicht um fotorealistische Ergebnisse geht, sondern um die schnelle Entwicklung kreativer Ideen.

Gemini und Imagen: KI-Power im Hintergrund
Im Kern basiert Whisk auf einer Kombination von Googles KI-Modell Gemini und dem Bildgenerator Imagen 3. Während Gemini die eingegebenen Bilder im Hintergrund analysiert und textuelle Beschreibungen erstellt, verarbeitet Imagen diese Informationen zu neuen Bildern. Interessant dabei: Die automatisch generierten Beschreibungen, also die Prompts, sind einsehbar und können bei Bedarf manuell bearbeitet werden.

Laut Google geht es bei Whisk weniger um die Perfektion einzelner Pixel, sondern vielmehr um die schnelle Umsetzung von Ideen. Dabei reicht die Bandbreite der Ergebnisse von digitalen Plüschtieren über Anstecknadeln bis hin zu Aufklebern.

Ein kreativer Spielplatz für Bildideen
Die ersten Beispielbilder, die Google veröffentlicht hat, wirken vor allem comic-haft und verspielt. Fotorealistische Grafiken sucht man bisher vergeblich. Dennoch bietet Whisk durch seine Bild-als-Prompt-Funktion ein interessantes Werkzeug, um auf einfache Weise Ideen zu visualisieren und neue Kombinationen auszuprobieren.

Fazit: Schnelle Ideen statt Perfektion
Whisk zeigt, wie vielseitig KI-basierte Bildgeneratoren sein können, und richtet sich an Nutzer, die auf schnelle und spielerische Weise kreative Konzepte entwickeln möchten. Ob und wann der Bildgenerator auch in anderen Ländern verfügbar sein wird, bleibt vorerst offen.


Wir führen seit Jahren Beratung zu KI (Künstlicher Intelligenz) für KMUs (Klein- und Mittelständische Unternehmen) erfolgreich durch.

Mehr zu aktuellen Themen der #KI (Künstlichen Intelligenz) oder zu

Ihrem individuellen, optimalen "KI-Masterplan" für Ihr Unternehmen finden Sie in unserem Newsletter.

Abonnieren Sie den Newsletter hier:


Tags


Das könnte Sie auch interessieren

Abonnieren Sie jetzt unseren Newsletter!

>