Qwen3-Coder Quantisierungs-Shootout: UD-Q5_K_M schlägt MXFP4 auf allen Qualitätsmetriken
Warum es zählt
Für Code-Generierung im Alltag liefert UD-Q5_K_M mit einer Mean-KL-Divergenz von 0,0217 deutlich stabilere Ausgaben als MXFP4 (0,0746) – Unsloth's dynamische Präzision zahlt sich bei langen Reasoning-Ketten konkret aus.
— Lumeric Redaktion
Ein Community-Test auf r/LocalLLaMA vergleicht vier Quantisierungsformate von Qwen3-Coder auf 3× RX 9700 PRO mit llama.cpp Vulkan. UD-Q5_K_M erzielt die beste Qualität bei nur 9 % Geschwindigkeitsnachteil gegenüber Q4_K_M.
Wikitext-2 Top-1 Token Agreement (Qwen3-Coder) · Spitzenwert
89.4%
MXFP4_MOE
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Qwen3-Coder Quantisierungs-Shootout: UD-Q5_K_M schlägt MXFP4 auf allen Qualitätsmetriken
Warum es zählt
Für Code-Generierung im Alltag liefert UD-Q5_K_M mit einer Mean-KL-Divergenz von 0,0217 deutlich stabilere Ausgaben als MXFP4 (0,0746) – Unsloth's dynamische Präzision zahlt sich bei langen Reasoning-Ketten konkret aus.
— Lumeric Redaktion
Ein Community-Test auf r/LocalLLaMA vergleicht vier Quantisierungsformate von Qwen3-Coder auf 3× RX 9700 PRO mit llama.cpp Vulkan. UD-Q5_K_M erzielt die beste Qualität bei nur 9 % Geschwindigkeitsnachteil gegenüber Q4_K_M.
Wikitext-2 Top-1 Token Agreement (Qwen3-Coder) · Spitzenwert
89.4%
MXFP4_MOE
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.