
Stability AI lanciert Stable Audio 3.0 mit bis zu 6 Minuten Musik
Stability AI, bekannt durch Stable Diffusion, stellt mit Stable Audio 3.0 eine neue Modellfamilie für Audiogenerierung vor. Die vier Modelle umfassen zwei Small-Varianten (je 459M Parameter) für On-Device-Nutzung mit bis zu zwei Minuten Ausgabe, ein Medium-Modell (1,4B Parameter) sowie ein Large-Modell (2,7B Parameter). Medium und Large können vollständige Kompositionen von 6 Minuten 20 Sekunden erzeugen, die musikalische Struktur und melodische Kontinuität wahren – mehr als doppelt so lang wie Stable Audio 2.0 aus 2024. Der Vorgänger Stable Audio Open unterstützte lediglich bis zu 47 Sekunden. Small SFX, Small und Medium werden mit offenen Gewichten veröffentlicht; das Large-Modell ist kostenpflichtig über API und Self-Hosting verfügbar. Unternehmen mit mehr als 1 Million US-Dollar Umsatz benötigen eine Enterprise-Lizenz. Die Modelle sind auf vollständig lizenzierten Daten trainiert, Stability AI hat dafür Vereinbarungen mit Warner Music Group und Universal Music Group geschlossen. Als neuer Leiter des professionellen Musikbereichs stößt Ethan Kaplan zum Unternehmen, ehemaliger Chief Digital Officer bei Universal Audio und Fender.
- Small SFX und Small (je 459M Parameter) für On-Device-Sound und Musik bis 2 Minuten ausgelegt
- Medium (1,4B) und Large (2,7B) erzeugen Kompositionen bis 6 Min. 20 Sek. mit stabiler Melodiestruktur
- Drei Modelle mit offenen Gewichten; Large nur via API/Self-Hosting, Enterprise-Lizenz ab 1 Mio. USD Umsatz
- Deals mit Warner Music Group und Universal Music Group sichern vollständig lizenzierte Trainingsdaten
- Ethan Kaplan (ex-Universal Audio, ex-Fender) übernimmt Leitung des Professional-Music-Bereichs
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge

Stability AI lanciert Stable Audio 3.0 mit bis zu 6 Minuten Musik
Stability AI, bekannt durch Stable Diffusion, stellt mit Stable Audio 3.0 eine neue Modellfamilie für Audiogenerierung vor. Die vier Modelle umfassen zwei Small-Varianten (je 459M Parameter) für On-Device-Nutzung mit bis zu zwei Minuten Ausgabe, ein Medium-Modell (1,4B Parameter) sowie ein Large-Modell (2,7B Parameter). Medium und Large können vollständige Kompositionen von 6 Minuten 20 Sekunden erzeugen, die musikalische Struktur und melodische Kontinuität wahren – mehr als doppelt so lang wie Stable Audio 2.0 aus 2024. Der Vorgänger Stable Audio Open unterstützte lediglich bis zu 47 Sekunden. Small SFX, Small und Medium werden mit offenen Gewichten veröffentlicht; das Large-Modell ist kostenpflichtig über API und Self-Hosting verfügbar. Unternehmen mit mehr als 1 Million US-Dollar Umsatz benötigen eine Enterprise-Lizenz. Die Modelle sind auf vollständig lizenzierten Daten trainiert, Stability AI hat dafür Vereinbarungen mit Warner Music Group und Universal Music Group geschlossen. Als neuer Leiter des professionellen Musikbereichs stößt Ethan Kaplan zum Unternehmen, ehemaliger Chief Digital Officer bei Universal Audio und Fender.
- Small SFX und Small (je 459M Parameter) für On-Device-Sound und Musik bis 2 Minuten ausgelegt
- Medium (1,4B) und Large (2,7B) erzeugen Kompositionen bis 6 Min. 20 Sek. mit stabiler Melodiestruktur
- Drei Modelle mit offenen Gewichten; Large nur via API/Self-Hosting, Enterprise-Lizenz ab 1 Mio. USD Umsatz
- Deals mit Warner Music Group und Universal Music Group sichern vollständig lizenzierte Trainingsdaten
- Ethan Kaplan (ex-Universal Audio, ex-Fender) übernimmt Leitung des Professional-Music-Bereichs
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.