Stability AI sorgt mit der Ankündigung der neuen Version von Stable Diffusion für Aufsehen.
Das britische KI-Unternehmen Stability AI hat die neueste Version seines Bildgenerators, Stable Diffusion 3, in der Variante Medium vorgestellt. Diese Version wurde mit 2 Milliarden Parametern trainiert und steht als Teil einer Reihe von Modellen zur Verfügung, die zwischen 800 Millionen und 8 Milliarden Parametern variieren. Nutzer können sowohl über eine API als auch über die KI-Plattform Hugging Face auf den Quelltext zugreifen. Derzeit befindet sich Stable Diffusion 3 jedoch noch im Status „early preview“ und ist somit noch nicht allgemein verfügbar.
Stable Diffusion 3 verspricht eine erhebliche Verbesserung der Bildqualität und der Detailtiefe. Die neue Version kann fotorealistische Bilder erzeugen und ist zudem in der Lage, Text in Bildern zu integrieren sowie komplexe Mehrfachmotive präzise darzustellen. Ein Beispiel für die erhöhte Präzision ist die exakte Umsetzung von detaillierten Eingaben wie „Ein Gemüsecurry mit Kartoffeln, Spinat und Kichererbsen, aber ohne Paprika“, was bisher eine Herausforderung für generative KI darstellte.
Allerdings war Stability AI in der Vergangenheit häufiger Kritik ausgesetzt, weil das Unternehmen urheberrechtlich geschütztes Bildmaterial für das Training genutzt haben soll. In der Ankündigung von Stable Diffusion 3 betonte Stability AI jedoch, dass zahlreiche Sicherheitsvorkehrungen getroffen wurden, um solche Probleme künftig zu vermeiden.
Das Unternehmen bietet drei verschiedene Abomodelle an. Für einzelne Entwickler und Forschungsprojekte ist die Nutzung nichtkommerziell und kostenfrei. Nutzer mit einem Umsatz unter einer Million US-Dollar zahlen 20 US-Dollar pro Monat, während größere Unternehmen individuelle Preisangebote erhalten.