Stability AI lanciert Stable Audio 3.0 mit bis zu 6 Minuten Musik

Warum es zählt

Die Modelle basieren auf vollständig lizenzierten Daten – gestützt durch Deals mit Warner Music Group und Universal Music Group – und setzen damit einen Standard für rechtssichere Musikgenerierung. Für Entwickler sind drei Modelle (bis 1,4B Parameter) offen zugänglich und modifizierbar.

— Lumeric Redaktion

Stability AI, bekannt durch Stable Diffusion, stellt mit Stable Audio 3.0 eine neue Modellfamilie für Audiogenerierung vor. Die vier Modelle umfassen zwei Small-Varianten (je 459M Parameter) für On-Device-Nutzung mit bis zu zwei Minuten Ausgabe, ein Medium-Modell (1,4B Parameter) sowie ein Large-Modell (2,7B Parameter). Medium und Large können vollständige Kompositionen von 6 Minuten 20 Sekunden erzeugen, die musikalische Struktur und melodische Kontinuität wahren – mehr als doppelt so lang wie Stable Audio 2.0 aus 2024. Der Vorgänger Stable Audio Open unterstützte lediglich bis zu 47 Sekunden. Small SFX, Small und Medium werden mit offenen Gewichten veröffentlicht; das Large-Modell ist kostenpflichtig über API und Self-Hosting verfügbar. Unternehmen mit mehr als 1 Million US-Dollar Umsatz benötigen eine Enterprise-Lizenz. Die Modelle sind auf vollständig lizenzierten Daten trainiert, Stability AI hat dafür Vereinbarungen mit Warner Music Group und Universal Music Group geschlossen. Als neuer Leiter des professionellen Musikbereichs stößt Ethan Kaplan zum Unternehmen, ehemaliger Chief Digital Officer bei Universal Audio und Fender.

Was wir noch wissen

Small SFX und Small (je 459M Parameter) für On-Device-Sound und Musik bis 2 Minuten ausgelegt
Medium (1,4B) und Large (2,7B) erzeugen Kompositionen bis 6 Min. 20 Sek. mit stabiler Melodiestruktur
Drei Modelle mit offenen Gewichten; Large nur via API/Self-Hosting, Enterprise-Lizenz ab 1 Mio. USD Umsatz
Deals mit Warner Music Group und Universal Music Group sichern vollständig lizenzierte Trainingsdaten
Ethan Kaplan (ex-Universal Audio, ex-Fender) übernimmt Leitung des Professional-Music-Bereichs

Quelle lesentechcrunch.com

Multimodal Open Source Foundation Modelle

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Stability AI lanciert Stable Audio 3.0 mit bis zu 6 Minuten Musik

ToolsGPT Stable Diffusion ElevenLabs

CompaniesOpenAI Google DeepMind AWS AI

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Small SFX und Small (je 459M Parameter) für On-Device-Sound und Musik bis 2 Minuten ausgelegt
Medium (1,4B) und Large (2,7B) erzeugen Kompositionen bis 6 Min. 20 Sek. mit stabiler Melodiestruktur
Drei Modelle mit offenen Gewichten; Large nur via API/Self-Hosting, Enterprise-Lizenz ab 1 Mio. USD Umsatz
Deals mit Warner Music Group und Universal Music Group sichern vollständig lizenzierte Trainingsdaten
Ethan Kaplan (ex-Universal Audio, ex-Fender) übernimmt Leitung des Professional-Music-Bereichs

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Stability AI lanciert Stable Audio 3.0 mit bis zu 6 Minuten Musik

Frag die KI zum Artikel

Verwandte Beiträge

Stability AI lanciert Stable Audio 3.0 mit bis zu 6 Minuten Musik

Frag die KI zum Artikel

Verwandte Beiträge