Bilder mit Worten verändern – was früher wie Science-Fiction klang, ist heute Realität. Wie funktioniert das neueste KI-Modell aus Freiburg?
Bilder neu denken: Flux.1 Kontext im Überblick
Das Freiburger KI-Startup Black Forest Labs hat mit seiner neuen Modellfamilie Flux.1 Kontext ein spannendes Werkzeug vorgestellt: Eine KI, die bestehende Bilder per Texteingabe bearbeiten kann – präzise, stilvoll und vielseitig. Anders als klassische Bildgeneratoren erzeugt Flux.1 keine Bilder komplett neu, sondern verändert gezielt Details bestehender Inhalte.
Drei Köpfe stehen hinter dem Projekt: Robin Rombach, Andreas Blattmann und Axel Sauer. Alle drei bringen nicht nur fundierte akademische Expertise mit, sondern auch wertvolle Erfahrung durch ihre Arbeit bei Stability.AI in London.
Was Flux.1 Kontext leisten kann
Flux.1 Kontext versteht, was auf einem Bild zu sehen ist, erkennt Personen oder Gegenstände und kann diese neu inszenieren. Ein Beispiel: Ein CEO, der eben noch auf der Bühne stand, wird per Textprompt plötzlich zum Skateboarder auf der Halfpipe. Auch subtilere Bearbeitungen sind möglich – etwa das Hinzufügen eines VR-Headsets oder das Entfernen störender Accessoires.
Ein besonderes Feature ist die Stilübertragung: Ein hochgeladenes Bild, zum Beispiel eine Kohlezeichnung, dient als Vorlage für völlig neue Motive im gleichen Stil. Auch iterative Arbeitsprozesse sind möglich – Nutzer können in mehreren Schritten ihre Vision ausbauen.
Drei Modelle für unterschiedliche Einsatzzwecke
Black Forest Labs bietet Flux.1 in drei Varianten an:
- Flux.1 Kontext [max]: Maximale Leistung, hohe Geschwindigkeit, exzellentes Prompt-Verständnis und sogar Typografie-Generierung.
- Flux.1 Kontext [pro]: Optimiert für schnelle Abläufe und viele kleine Bearbeitungsschritte – ideal für die tägliche kreative Arbeit.
- Flux.1 Kontext [dev]: Künftig für die Forschung vorgesehen, mit offenem Fokus.
So kann Flux.1 selbst getestet werden
Im „Playground“ kann die KI direkt ausprobiert werden. Nutzer starten mit 200 Credits – das reicht für rund zwölf Bildbearbeitungen. Die englischsprachige Benutzungsoberfläche bietet intuitive Optionen wie „Generate“, „Edit“, „Fill“ und „Expand“.
Auch preislich zeigt sich das Unternehmen transparent. Es richtet sich mit seiner Modellfamilie an Entwickler und größere Organisationen – unter anderem arbeitet die Deutsche Telekom bereits mit Black Forest Labs zusammen.