Benchmark-Vergleich: Gemma- und Qwen-Quantisierungen im Praxistest
CompaniesGoogle DeepMind
Warum es zählt
Die Tabelle erlaubt direkte Vergleiche über Modellgrößen und Quantisierungsstufen hinweg – etwa 9B-Q4 vs. 4B-Q8 – was mit KLD-Metriken allein nicht möglich ist. QAT-Varianten schneiden überraschend schwächer ab als reguläre Q4_K_S-Quants gleicher Größe.
— Lumeric Redaktion
Arithmetic / Presidents / Attention (contrived tests) · Spitzenwert
95.5%
Qwen3.6-27B-Q4_K_S
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Benchmark-Vergleich: Gemma- und Qwen-Quantisierungen im Praxistest
CompaniesGoogle DeepMind
Warum es zählt
Die Tabelle erlaubt direkte Vergleiche über Modellgrößen und Quantisierungsstufen hinweg – etwa 9B-Q4 vs. 4B-Q8 – was mit KLD-Metriken allein nicht möglich ist. QAT-Varianten schneiden überraschend schwächer ab als reguläre Q4_K_S-Quants gleicher Größe.
— Lumeric Redaktion
Arithmetic / Presidents / Attention (contrived tests) · Spitzenwert
95.5%
Qwen3.6-27B-Q4_K_S
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.