Gemma 4 31B-it-DFlash-Quantisierung auf Hugging Face veröffentlicht
Ein Nutzer hat eine DFlash-Variante von Googles Gemma-4-31B-it auf Hugging Face veröffentlicht. Für den lokalen Einsatz via llama.cpp muss noch ein offener Pull Request gemergt werden.
- Modell verfügbar unter: huggingface.co/z-lab/gemma-4-31B-it-DFlash
- llama.cpp-Unterstützung hängt von PR #22105 im ggml-org/llama.cpp-Repository ab
- Veröffentlichung durch Community-Nutzer, nicht durch Google selbst
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com2w
Z-Lab veröffentlicht DFlash für Gemma 4 26B-A4B – schnellere Spekulative Decodierung
- MEINUNGreddit.com1w
Gemma 4 31B mit MTP in llama.cpp: Nutzer suchen Workaround für getrennte GGUF-Dateien
- LAUNCHreddit.com2w
Gemma-4 26B A4B als NVFP4-GGUF mit Docker-Image verfügbar
- MEINUNGreddit.com4d
Community vergleicht abliterierte Gemma-4-Versionen von 31B und 26B-A4B
Gemma 4 31B-it-DFlash-Quantisierung auf Hugging Face veröffentlicht
Ein Nutzer hat eine DFlash-Variante von Googles Gemma-4-31B-it auf Hugging Face veröffentlicht. Für den lokalen Einsatz via llama.cpp muss noch ein offener Pull Request gemergt werden.
- Modell verfügbar unter: huggingface.co/z-lab/gemma-4-31B-it-DFlash
- llama.cpp-Unterstützung hängt von PR #22105 im ggml-org/llama.cpp-Repository ab
- Veröffentlichung durch Community-Nutzer, nicht durch Google selbst
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com2w
Z-Lab veröffentlicht DFlash für Gemma 4 26B-A4B – schnellere Spekulative Decodierung
- MEINUNGreddit.com1w
Gemma 4 31B mit MTP in llama.cpp: Nutzer suchen Workaround für getrennte GGUF-Dateien
- LAUNCHreddit.com2w
Gemma-4 26B A4B als NVFP4-GGUF mit Docker-Image verfügbar
- MEINUNGreddit.com4d
Community vergleicht abliterierte Gemma-4-Versionen von 31B und 26B-A4B