G4-MeroMero-26B-A4B: Uncensored-Finetune von Gemma-4-26B mit KLD 0,0152
Der Reddit-Nutzer LLMFan46 hat auf Anfrage der Community eine 26B-A4B-Variante seines MeroMero-Uncensored-Finetunes veröffentlicht. Basis ist das Gemma-4-26B-A4B-it-Modell von Google; der eigentliche Finetune-Autor ist zerofata. Das Modell erreicht eine KL-Divergenz von 0,0152 und zeigt bei einem standardisierten Refusal-Test lediglich 12 von 100 Verweigerungen. Im Vergleich dazu gilt die zuvor veröffentlichte 31B-Version als qualitativ überlegen, doch die 26B-A4B-Variante punktet mit deutlich niedrigerem VRAM- und RAM-Bedarf sowie höherer Inferenzgeschwindigkeit. Verfügbar ist das Modell sowohl als Safetensors als auch in GGUF-Format auf HuggingFace unter dem Account llmfan46, inklusive eigenem Benchmark.
- Basiert auf Gemma-4-26B-A4B-it; Finetune-Ursprung von zerofata, Release durch LLMFan46
- KL-Divergenz (KLD) von 0,0152 deutet auf geringe Abweichung vom Basismodell hin
- Nur 12 von 100 Refusals im Benchmark – deutlich weniger als typische Basismodelle
- Download als Safetensors und GGUF auf HuggingFace verfügbar
- Vorgänger 31B-Version wird vom Autor als qualitativ besser eingestuft
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
G4-MeroMero-26B-A4B: Uncensored-Finetune von Gemma-4-26B mit KLD 0,0152
Der Reddit-Nutzer LLMFan46 hat auf Anfrage der Community eine 26B-A4B-Variante seines MeroMero-Uncensored-Finetunes veröffentlicht. Basis ist das Gemma-4-26B-A4B-it-Modell von Google; der eigentliche Finetune-Autor ist zerofata. Das Modell erreicht eine KL-Divergenz von 0,0152 und zeigt bei einem standardisierten Refusal-Test lediglich 12 von 100 Verweigerungen. Im Vergleich dazu gilt die zuvor veröffentlichte 31B-Version als qualitativ überlegen, doch die 26B-A4B-Variante punktet mit deutlich niedrigerem VRAM- und RAM-Bedarf sowie höherer Inferenzgeschwindigkeit. Verfügbar ist das Modell sowohl als Safetensors als auch in GGUF-Format auf HuggingFace unter dem Account llmfan46, inklusive eigenem Benchmark.
- Basiert auf Gemma-4-26B-A4B-it; Finetune-Ursprung von zerofata, Release durch LLMFan46
- KL-Divergenz (KLD) von 0,0152 deutet auf geringe Abweichung vom Basismodell hin
- Nur 12 von 100 Refusals im Benchmark – deutlich weniger als typische Basismodelle
- Download als Safetensors und GGUF auf HuggingFace verfügbar
- Vorgänger 31B-Version wird vom Autor als qualitativ besser eingestuft
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.