Benchmark-Vergleich: Gemma- und Qwen-Quantisierungen im Praxistest

Warum es zählt

Die Tabelle erlaubt direkte Vergleiche über Modellgrößen und Quantisierungsstufen hinweg – etwa 9B-Q4 vs. 4B-Q8 – was mit KLD-Metriken allein nicht möglich ist. QAT-Varianten schneiden überraschend schwächer ab als reguläre Q4_K_S-Quants gleicher Größe.

— Lumeric Redaktion

Quelle lesenreddit.com

Arithmetic / Presidents / Attention (contrived tests) · Spitzenwert

95.5%

Qwen3.6-27B-Q4_K_S

Evals Benchmarks Open Source Inferenz Infra

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Benchmark-Vergleich: Gemma- und Qwen-Quantisierungen im Praxistest

ToolsQwen Llama

CompaniesGoogle DeepMind

Warum es zählt

— Lumeric Redaktion

Arithmetic / Presidents / Attention (contrived tests) · Spitzenwert

95.5%

Qwen3.6-27B-Q4_K_S

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Benchmark-Vergleich: Gemma- und Qwen-Quantisierungen im Praxistest

Frag die KI zum Artikel

Verwandte Beiträge

Benchmark-Vergleich: Gemma- und Qwen-Quantisierungen im Praxistest

Frag die KI zum Artikel

Verwandte Beiträge