PrismML: Bonsai Image 4B läuft als 1-Bit-Diffusionsmodell im Browser via WebGPU

Warum es zählt

Mit ~3 GB statt ~16 GB (FLUX.2 Klein 4B) ermöglichen diese Modelle echte Browser-Inferenz ohne Server-Backend – ein relevanter Schritt für datenschutzkonforme, edge-seitige Bildgenerierung direkt im Client.

— Lumeric Redaktion

PrismML hat mit Bonsai Image 4B zwei stark quantisierte Text-to-Image-Diffusionstransformer veröffentlicht: eine binäre (1-Bit) und eine ternäre Variante. Beide Modelle haben 4 Milliarden Parameter, kommen aber auf lediglich rund 3 GB Speicherbedarf – zum Vergleich: das ähnlich große FLUX.2 Klein 4B belegt rund 16 GB. Dank dieser Kompression ist es möglich, die Modelle vollständig lokal im Browser über die WebGPU-API auszuführen, ohne dass ein Server-Backend benötigt wird. Die Modelle sind unter der Apache-2.0-Lizenz frei verfügbar und werden über eine offizielle Collection auf Hugging Face bereitgestellt. Eine interaktive Demo steht im Hugging Face Space „webml-community/bonsai-image-webgpu" zur Verfügung. Der Ansatz der Binarisierung bzw. Ternarisierung von Diffusionstransformern ist für die lokale und edge-seitige Bildgenerierung besonders relevant, da er die Hardware-Anforderungen drastisch senkt.

Was wir noch wissen

Zwei Varianten: Binary (1-Bit) und Ternary – beide auf Basis eines 4B-Parameter-Diffusionstransformers
Modellgröße: ~3 GB, FLUX.2 Klein 4B zum Vergleich: ~16 GB
Vollständige Browser-Inferenz via WebGPU ohne Server-Backend möglich
Apache-2.0-Lizenz – kommerzielle Nutzung erlaubt
Demo verfügbar im HF Space webml-community/bonsai-image-webgpu

Quelle lesenreddit.com

Foundation Modelle Inferenz Infra Open Source

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

PrismML: Bonsai Image 4B läuft als 1-Bit-Diffusionsmodell im Browser via WebGPU

ToolsHugging Face

CompaniesHugging Face

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Zwei Varianten: Binary (1-Bit) und Ternary – beide auf Basis eines 4B-Parameter-Diffusionstransformers
Modellgröße: ~3 GB, FLUX.2 Klein 4B zum Vergleich: ~16 GB
Vollständige Browser-Inferenz via WebGPU ohne Server-Backend möglich
Apache-2.0-Lizenz – kommerzielle Nutzung erlaubt
Demo verfügbar im HF Space webml-community/bonsai-image-webgpu

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

PrismML: Bonsai Image 4B läuft als 1-Bit-Diffusionsmodell im Browser via WebGPU

Frag die KI zum Artikel

Verwandte Beiträge

PrismML: Bonsai Image 4B läuft als 1-Bit-Diffusionsmodell im Browser via WebGPU

Frag die KI zum Artikel

Verwandte Beiträge