Stability AI erweitert sein Portfolio mit einem spannenden Schritt in die Audio-Welt. Doch was steckt hinter Stable Audio 2.5 – und warum ist es für Unternehmen so interessant?
Das neue Modell soll erstmals professionelle Sound-Produktion auf Knopfdruck ermöglichen. Von dreiminütigen Tracks bis zu maßgeschneiderten Audio-Identitäten für Marken – die Einsatzfelder sind breit gefächert.
Mehr Struktur und Tempo in der Audio-Generierung
Stable Audio 2.5 verspricht bessere musikalische Strukturen als bisher, inklusive klassischer Kompositionsformen mit Intro, Hauptteil und Outro. Besonders spannend: Das System reagiert präziser auf Stimmungs- und Genre-Beschreibungen, etwa „uplifting“ oder „üppige Synthesizer“.
Die Performance beeindruckt – Musikstücke von bis zu drei Minuten entstehen in nur wenigen Sekunden, dank der hauseigenen ARC-Trainingsmethode (Adversarial Relativistic-Contrastive). Während die industrielle Variante auf Nvidia-H100-GPUs läuft, hat Stability AI schon eine kompakte Version für Smartphones vorgestellt, die einfache Tracks in Sekunden erstellt.
Audio Inpainting – kreative Werkzeuge für Teams
Ein Highlight ist das neue Feature „Audio Inpainting“. Nutzer:innen können eigene Audiodateien hochladen und die KI generiert den restlichen Track passend zum vorhandenen Sound. So lassen sich Songs oder Jingles nahtlos erweitern und bestehende Inhalte aufwerten.
Wichtig dabei: Die Inhalte müssen urheberrechtsfrei sein. Stability AI betont, dass Stable Audio 2.5 mit lizenziertem Material trainiert wurde und strenge Prüfsysteme zum Schutz vor Urheberrechtsverstößen integriert sind.
Neue Märkte für Marken und Agenturen
Von Kaufhausmusik über Soundlogos für Kreditkarten bis hin zu Audio für Werbespots – die Anwendungen sind vielfältig. Unternehmen können eine konsistente akustische Markenidentität über verschiedene Touchpoints hinweg aufbauen.
Für maßgeschneiderte Projekte arbeitet Stability AI mit der Sound-Branding-Agentur Amp (WPP-Gruppe) zusammen. Über die Plattform WPP Open wird Stable Audio 2.5 künftig globalen Kunden bereitgestellt – ein klares Signal, dass KI-Sound nicht nur ein Kreativ-Gadget, sondern ein Business-Tool ist.
Ein neuer Kurs für Stability AI
Nachdem das Unternehmen lange durch Bildmodelle bekannt war, rückt nun Audio in den Fokus. Angesichts der jüngsten Investitionen durch WPP und wachsender Konkurrenz, etwa von Meta, könnte die neue Ausrichtung ein Rettungsanker sein – und gleichzeitig der Türöffner für eine neue Ära im Corporate Sound Branding.