Microsoft hat sein Bildmodell MAI aktualisiert und positioniert MAI-Image-2.5 deutlich stärker im Wettbewerb der Text-zu-Bild-Systeme. Wie nah kommt das neue Modell bereits an die führenden Anbieter heran?
Nach Angaben des MAI-Teams belegt MAI-Image-2.5 derzeit Platz drei auf der Text-zu-Bild-Rangliste von Arena. Damit liegt Microsofts neues Bildmodell auf Augenhöhe mit Googles Nano Banana 2. Zu Image-2 von OpenAI besteht laut der Einordnung allerdings weiterhin ein deutlicher Abstand.
Microsoft beschreibt MAI-Image-2.5 als bislang stärkstes Bildmodell der eigenen MAI-Reihe. Gegenüber MAI-Image-2 soll das Update vor allem bei drei Punkten zulegen: der Darstellung von Text innerhalb generierter Bilder, stilisierten Illustrationen und kommerziellen Motiven. Das Modell soll Anweisungen genauer umsetzen und Szenen erzeugen, in denen Beleuchtung, räumliche Tiefe und Beziehungen zwischen Objekten stimmiger wirken.
Damit zielt Microsoft nicht nur auf experimentelle Bildgenerierung, sondern ausdrücklich auch auf professionelle Anwendungsfelder. Genannt werden Produktfotos und Markendesign – Bereiche, in denen präzise Vorgaben, konsistente Gestaltung und belastbare Bildqualität besonders wichtig sind.
MAI-Image-2.5 ist ab sofort auf Arena verfügbar. Innerhalb von zwei Wochen soll das Modell außerdem im MAI Playground und in Foundry nutzbar sein.
