PrismML: Bonsai Image 4B läuft als 1-Bit-Diffusionsmodell im Browser via WebGPU
PrismML hat mit Bonsai Image 4B zwei stark quantisierte Text-to-Image-Diffusionstransformer veröffentlicht: eine binäre (1-Bit) und eine ternäre Variante. Beide Modelle haben 4 Milliarden Parameter, kommen aber auf lediglich rund 3 GB Speicherbedarf – zum Vergleich: das ähnlich große FLUX.2 Klein 4B belegt rund 16 GB. Dank dieser Kompression ist es möglich, die Modelle vollständig lokal im Browser über die WebGPU-API auszuführen, ohne dass ein Server-Backend benötigt wird. Die Modelle sind unter der Apache-2.0-Lizenz frei verfügbar und werden über eine offizielle Collection auf Hugging Face bereitgestellt. Eine interaktive Demo steht im Hugging Face Space „webml-community/bonsai-image-webgpu" zur Verfügung. Der Ansatz der Binarisierung bzw. Ternarisierung von Diffusionstransformern ist für die lokale und edge-seitige Bildgenerierung besonders relevant, da er die Hardware-Anforderungen drastisch senkt.
- Zwei Varianten: Binary (1-Bit) und Ternary – beide auf Basis eines 4B-Parameter-Diffusionstransformers
- Modellgröße: ~3 GB, FLUX.2 Klein 4B zum Vergleich: ~16 GB
- Vollständige Browser-Inferenz via WebGPU ohne Server-Backend möglich
- Apache-2.0-Lizenz – kommerzielle Nutzung erlaubt
- Demo verfügbar im HF Space webml-community/bonsai-image-webgpu
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com3w
Peanut-Modell debütiert als Top-8-Text-to-Image-Modell, Open Weights folgen
- FORSCHUNGarxiv.org0mo
L2P: Lernbarer linearer Prädiktor beschleunigt Diffusion Transformers bis 7,18×
- FORSCHUNGhuggingface.co2w
L2P: Transfer-Paradigma bringt Pixel-Diffusion auf Consumer-GPUs
- FORSCHUNGarxiv.org1w
NanoQuant: Sub-1-Bit-Quantisierung bringt Llama2-70B auf 8-GB-Consumer-GPU
PrismML: Bonsai Image 4B läuft als 1-Bit-Diffusionsmodell im Browser via WebGPU
PrismML hat mit Bonsai Image 4B zwei stark quantisierte Text-to-Image-Diffusionstransformer veröffentlicht: eine binäre (1-Bit) und eine ternäre Variante. Beide Modelle haben 4 Milliarden Parameter, kommen aber auf lediglich rund 3 GB Speicherbedarf – zum Vergleich: das ähnlich große FLUX.2 Klein 4B belegt rund 16 GB. Dank dieser Kompression ist es möglich, die Modelle vollständig lokal im Browser über die WebGPU-API auszuführen, ohne dass ein Server-Backend benötigt wird. Die Modelle sind unter der Apache-2.0-Lizenz frei verfügbar und werden über eine offizielle Collection auf Hugging Face bereitgestellt. Eine interaktive Demo steht im Hugging Face Space „webml-community/bonsai-image-webgpu" zur Verfügung. Der Ansatz der Binarisierung bzw. Ternarisierung von Diffusionstransformern ist für die lokale und edge-seitige Bildgenerierung besonders relevant, da er die Hardware-Anforderungen drastisch senkt.
- Zwei Varianten: Binary (1-Bit) und Ternary – beide auf Basis eines 4B-Parameter-Diffusionstransformers
- Modellgröße: ~3 GB, FLUX.2 Klein 4B zum Vergleich: ~16 GB
- Vollständige Browser-Inferenz via WebGPU ohne Server-Backend möglich
- Apache-2.0-Lizenz – kommerzielle Nutzung erlaubt
- Demo verfügbar im HF Space webml-community/bonsai-image-webgpu
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com3w
Peanut-Modell debütiert als Top-8-Text-to-Image-Modell, Open Weights folgen
- FORSCHUNGarxiv.org0mo
L2P: Lernbarer linearer Prädiktor beschleunigt Diffusion Transformers bis 7,18×
- FORSCHUNGhuggingface.co2w
L2P: Transfer-Paradigma bringt Pixel-Diffusion auf Consumer-GPUs
- FORSCHUNGarxiv.org1w
NanoQuant: Sub-1-Bit-Quantisierung bringt Llama2-70B auf 8-GB-Consumer-GPU