ByteDance veröffentlicht Lance: Multimodales Open-Source-Modell mit 3B Parametern

Warum es zählt

Lance zeigt, dass starke multimodale Fähigkeiten – von Bildbearbeitung bis Videogenerierung – auf 3B-Parameter-Niveau erreichbar sind und lokal auf Consumer-Hardware laufen könnten. Das Training from scratch mit nur 128 A100-GPUs deutet auf vergleichsweise niedrige Ressourcenkosten hin.

— Lumeric Redaktion

Lance ist ByteDances neues natives multimodales Modell, das mit einem „Unified"-Ansatz vier Aufgaben in einem einzigen Framework abdeckt: Bildverstehen, Bildgenerierung, Bildbearbeitung und Videogenerierung. Bemerkenswert ist die Effizienz: Mit nur 3B aktiven Parametern soll Lance laut ByteDance starke Ergebnisse auf einschlägigen Benchmarks für alle drei Generierungsaufgaben erzielen. Das Modell wurde vollständig from scratch trainiert – ohne Rückgriff auf vortrainierte Einzelmodelle –, unter Verwendung eines mehrstufigen Multi-Task-Rezepts. Das Trainingsbudget belief sich auf 128 A100-GPUs, was für ein Modell dieser Breite vergleichsweise kompakt ist. ByteDance veröffentlicht Lance als Open-Source-Modell, was lokales Deployment und Community-Feintuning ermöglicht. Der Ansatz, multimodale Generierung und Verständnis in einem kleinen Modell zu vereinen, ist für Entwickler interessant, die ressourcenschonende All-in-One-Lösungen suchen.

Was wir noch wissen

Lance unterstützt Bild- und Videoverstehen sowie -generierung und Bildbearbeitung in einem einzigen Framework.
Training vollständig from scratch mit einem mehrstufigen Multi-Task-Rezept (staged multi-task recipe).
Trainingsbudget: 128 A100-GPUs – vergleichsweise kompakt für ein natives multimodales Modell.
ByteDance veröffentlicht Lance als Open-Source-Modell (Quelle: r/LocalLLaMA).
Starke Performance auf Benchmarks für Bildgenerierung, Bildbearbeitung und Videogenerierung laut Hersteller.

Quelle lesenreddit.com

Multimodal Open Source Foundation Modelle

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

ByteDance veröffentlicht Lance: Multimodales Open-Source-Modell mit 3B Parametern

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Lance unterstützt Bild- und Videoverstehen sowie -generierung und Bildbearbeitung in einem einzigen Framework.
Training vollständig from scratch mit einem mehrstufigen Multi-Task-Rezept (staged multi-task recipe).
Trainingsbudget: 128 A100-GPUs – vergleichsweise kompakt für ein natives multimodales Modell.
ByteDance veröffentlicht Lance als Open-Source-Modell (Quelle: r/LocalLLaMA).
Starke Performance auf Benchmarks für Bildgenerierung, Bildbearbeitung und Videogenerierung laut Hersteller.

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

ByteDance veröffentlicht Lance: Multimodales Open-Source-Modell mit 3B Parametern

Frag die KI zum Artikel

Verwandte Beiträge

ByteDance veröffentlicht Lance: Multimodales Open-Source-Modell mit 3B Parametern

Frag die KI zum Artikel

Verwandte Beiträge