G4-MeroMero-26B-A4B: Uncensored-Finetune von Gemma-4-26B mit KLD 0,0152

Warum es zählt

Das Modell bietet gegenüber dem 31B-Pendant geringere VRAM/RAM-Anforderungen bei niedrigem KLD-Wert, was es für lokale Deployments auf weniger leistungsstarker Hardware attraktiv macht.

— Lumeric Redaktion

Der Reddit-Nutzer LLMFan46 hat auf Anfrage der Community eine 26B-A4B-Variante seines MeroMero-Uncensored-Finetunes veröffentlicht. Basis ist das Gemma-4-26B-A4B-it-Modell von Google; der eigentliche Finetune-Autor ist zerofata. Das Modell erreicht eine KL-Divergenz von 0,0152 und zeigt bei einem standardisierten Refusal-Test lediglich 12 von 100 Verweigerungen. Im Vergleich dazu gilt die zuvor veröffentlichte 31B-Version als qualitativ überlegen, doch die 26B-A4B-Variante punktet mit deutlich niedrigerem VRAM- und RAM-Bedarf sowie höherer Inferenzgeschwindigkeit. Verfügbar ist das Modell sowohl als Safetensors als auch in GGUF-Format auf HuggingFace unter dem Account llmfan46, inklusive eigenem Benchmark.

Was wir noch wissen

Basiert auf Gemma-4-26B-A4B-it; Finetune-Ursprung von zerofata, Release durch LLMFan46
KL-Divergenz (KLD) von 0,0152 deutet auf geringe Abweichung vom Basismodell hin
Nur 12 von 100 Refusals im Benchmark – deutlich weniger als typische Basismodelle
Download als Safetensors und GGUF auf HuggingFace verfügbar
Vorgänger 31B-Version wird vom Autor als qualitativ besser eingestuft

Quelle lesenreddit.com

KLD 0,0152 / 12/100 Refusals

KL-Divergenz und Verweigerungsrate

Open Source Foundation Modelle Post Training

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

G4-MeroMero-26B-A4B: Uncensored-Finetune von Gemma-4-26B mit KLD 0,0152

ToolsHugging Face

CompaniesHugging Face Google DeepMind

Warum es zählt

Das Modell bietet gegenüber dem 31B-Pendant geringere VRAM/RAM-Anforderungen bei niedrigem KLD-Wert, was es für lokale Deployments auf weniger leistungsstarker Hardware attraktiv macht.

— Lumeric Redaktion

Was wir noch wissen

Basiert auf Gemma-4-26B-A4B-it; Finetune-Ursprung von zerofata, Release durch LLMFan46
KL-Divergenz (KLD) von 0,0152 deutet auf geringe Abweichung vom Basismodell hin
Nur 12 von 100 Refusals im Benchmark – deutlich weniger als typische Basismodelle
Download als Safetensors und GGUF auf HuggingFace verfügbar
Vorgänger 31B-Version wird vom Autor als qualitativ besser eingestuft

KLD 0,0152 / 12/100 Refusals

KL-Divergenz und Verweigerungsrate

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

G4-MeroMero-26B-A4B: Uncensored-Finetune von Gemma-4-26B mit KLD 0,0152

Frag die KI zum Artikel

Verwandte Beiträge

G4-MeroMero-26B-A4B: Uncensored-Finetune von Gemma-4-26B mit KLD 0,0152

Frag die KI zum Artikel

Verwandte Beiträge