21. Mai 2026

Stable Audio 3.0: Offene KI-Musikmodelle mit Fokus auf Lizenzsicherheit

Stability AI stellt mit Stable Audio 3.0 eine neue Modellgeneration für KI-Audio vor. Besonders interessant ist dabei nicht nur die technische Leistung, sondern auch die klare Positionierung: Drei Modelle erscheinen mit offenen Gewichten, das Training soll vollständig auf lizenzierten Daten basieren.

Die neue Modellfamilie besteht aus vier Varianten. Stable Audio 3.0 Small SFX und Stable Audio 3.0 Small arbeiten jeweils mit 459 Millionen Parametern und erzeugen Audiotracks von bis zu zwei Minuten Länge. Während Small SFX auf Soundeffekte spezialisiert ist und auch für Smartphones sowie Consumer-Laptops gedacht ist, richtet sich Small an kurze Musikstücke.

Mit Stable Audio 3.0 Medium steigt Stability AI auf 1,4 Milliarden Parameter und Stücke von bis zu 6:20 Minuten. Diese drei Varianten stehen als Open-Weights-Modelle auf Hugging Face bereit. Das größte Modell, Stable Audio 3.0 Large mit 2,7 Milliarden Parametern, bleibt dagegen geschlossen und ist über die Stability-AI-API, fal.ai oder als gehostete Enterprise-Variante verfügbar.

Technisch setzt Stability AI auf eine neue Architektur mit semantisch-akustischem Autoencoder. Dadurch sollen längere und flexiblere Audioausgaben möglich werden. Besonders praxisnah ist die sekundengenaue Steuerung der Generierung. Für Kreativ-Teams kann das bedeuten: weniger starre Samples, mehr Kontrolle über Länge, Struktur und Bearbeitung.

Hinzu kommen LoRA-Trainingsmöglichkeiten für Stable Audio 3.0 Small und Medium. Unternehmen und Produzenten können Modelle damit auf eigene Audiobibliotheken anpassen. Auch Inpainting ist vorgesehen: Einzelne Segmente eines Musikstücks lassen sich bearbeiten, mehrere Bereiche gleichzeitig verändern und bestehende Tracks über ihren ursprünglichen Endpunkt hinaus verlängern.

Ein wichtiger Punkt ist die Lizenzierung. Unter der Stability AI Community License gehören die generierten Audiodateien den Nutzern und dürfen kommerziell verwendet werden. Organisationen mit mehr als einer Million US-Dollar Jahresumsatz sollen allerdings eine Enterprise-Lizenz abschließen. Diese bietet zusätzliche kommerzielle Abdeckung und rechtliche Freistellung.

Gerade dieser Aspekt dürfte für Unternehmen entscheidend sein. Während Anbieter wie Suno und Udio in Rechtsstreitigkeiten mit der Musikindustrie stehen, betont Stability AI wiederholt den Einsatz lizenzierter Trainingsdaten. Kooperationen mit Universal Music Group und Warner Music Group unterstreichen diese Strategie.

Der Zeitpunkt ist nicht zufällig gewählt. Nach juristischen Auseinandersetzungen rund um KI-Training, Memorisierung und reproduzierbare geschützte Inhalte wächst der Druck auf Anbieter generativer Musikmodelle. Wer KI-Audio produktiv einsetzen will, achtet inzwischen nicht mehr nur auf Klangqualität, sondern auch auf Herkunft der Trainingsdaten, Nutzungsrechte und Absicherung im kommerziellen Einsatz.

Für Stability AI ist Stable Audio 3.0 zugleich ein weiterer Schritt vom Bild-KI-Pionier hin zum spezialisierten Anbieter für Audio-KI. Nach Stable Diffusion, Stable Audio 2.0, Stable Audio Open und Stable Audio 2.5 entsteht nun eine einheitlichere technische Grundlage für kommende lizenzierte Profimodelle.

Für Unternehmen, Agenturen und Musikplattformen ist Stable Audio 3.0 deshalb mehr als ein weiteres KI-Musiktool. Es zeigt, wohin sich der Markt bewegt: leistungsfähige Modelle, flexible Anpassung, offene Varianten und ein deutlich stärkerer Fokus auf rechtlich belastbare Datenbasis.


Wir führen seit Jahren Beratung zu KI (Künstlicher Intelligenz) für KMUs (Klein- und Mittelständische Unternehmen) erfolgreich durch.

Mehr zu aktuellen Themen der #KI (Künstlichen Intelligenz) oder zu

Ihrem individuellen, optimalen "KI-Masterplan" für Ihr Unternehmen finden Sie in unserem Newsletter.

Abonnieren Sie den Newsletter hier:


Tags


Das könnte Sie auch interessieren

LinkedIn sagt KI-Spam den Kampf an

LinkedIn sagt KI-Spam den Kampf an

Abonnieren Sie jetzt unseren Newsletter!

>