Gemma 4 31B-it-DFlash-Quantisierung auf Hugging Face veröffentlicht

Warum es zählt

Sobald der llama.cpp-PR #22105 gemergt ist, kann Gemma 4 31B mit DFlash-Attention lokal ausgeführt werden — relevant für alle, die das Modell effizient auf Consumer-Hardware betreiben wollen.

— Lumeric Redaktion

Ein Nutzer hat eine DFlash-Variante von Googles Gemma-4-31B-it auf Hugging Face veröffentlicht. Für den lokalen Einsatz via llama.cpp muss noch ein offener Pull Request gemergt werden.

Was wir noch wissen

Modell verfügbar unter: huggingface.co/z-lab/gemma-4-31B-it-DFlash
llama.cpp-Unterstützung hängt von PR #22105 im ggml-org/llama.cpp-Repository ab
Veröffentlichung durch Community-Nutzer, nicht durch Google selbst

Quelle lesenreddit.com

Open Source Inferenz Infra Foundation Modelle

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Gemma 4 31B-it-DFlash-Quantisierung auf Hugging Face veröffentlicht

ToolsLlama Hugging Face

CompaniesHugging Face

Warum es zählt

Sobald der llama.cpp-PR #22105 gemergt ist, kann Gemma 4 31B mit DFlash-Attention lokal ausgeführt werden — relevant für alle, die das Modell effizient auf Consumer-Hardware betreiben wollen.

— Lumeric Redaktion

Ein Nutzer hat eine DFlash-Variante von Googles Gemma-4-31B-it auf Hugging Face veröffentlicht. Für den lokalen Einsatz via llama.cpp muss noch ein offener Pull Request gemergt werden.

Was wir noch wissen

Modell verfügbar unter: huggingface.co/z-lab/gemma-4-31B-it-DFlash
llama.cpp-Unterstützung hängt von PR #22105 im ggml-org/llama.cpp-Repository ab
Veröffentlichung durch Community-Nutzer, nicht durch Google selbst

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Gemma 4 31B-it-DFlash-Quantisierung auf Hugging Face veröffentlicht

Frag die KI zum Artikel

Verwandte Beiträge

Gemma 4 31B-it-DFlash-Quantisierung auf Hugging Face veröffentlicht

Frag die KI zum Artikel

Verwandte Beiträge