Qwen3.6-27B lokal schlägt Frontier-Modelle bei Canvas-Coding-Task
Ein Reddit-Nutzer hat auf einem Consumer-System (Ryzen 5 5600, 24 GB DDR4-3200, RX 5700 XT 8 GB) sieben lokale Modelle und vier Frontier-Modelle mit identischem Prompt verglichen: Aufgabe war eine einzige HTML-Datei mit Full-Page-Canvas-Animation – fahrendes Auto, Parallax-Hintergrund, rotierende Räder, Atmosphärenlicht, naiver JS/Canvas ohne Bibliotheken. Frontier-Modelle wurden über eine Perplexity-Subscription genutzt. Subjektiv landete Kimi k2.6 Thinking auf Platz 1, gefolgt von Qwen3.6-27B Q4_K_M (lokal) auf Platz 2 und dem Claude-opus-reasoning-destillierten Qwen3.6-27B auf Platz 3. Kleinere lokale Modelle wie Qwen3.5 4B und Gemma-4-31B-it schnitten schwächer ab. Die Inferenzgeschwindigkeit der lokalen 27B-Quants lag bei 2,65–2,70 tok/s, der MoE-Schnitt Qwen3.6-31B A3B erzielte 12,13 tok/s. Der Test ist rein subjektiv und auf eine einzelne visuelle Aufgabe beschränkt; eine systematische Evaluation fehlt. Der Autor fragt explizit, ob er bei der Frontier-Bewertung etwas übersieht.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Qwen3.6-27B lokal schlägt Frontier-Modelle bei Canvas-Coding-Task
Ein Reddit-Nutzer hat auf einem Consumer-System (Ryzen 5 5600, 24 GB DDR4-3200, RX 5700 XT 8 GB) sieben lokale Modelle und vier Frontier-Modelle mit identischem Prompt verglichen: Aufgabe war eine einzige HTML-Datei mit Full-Page-Canvas-Animation – fahrendes Auto, Parallax-Hintergrund, rotierende Räder, Atmosphärenlicht, naiver JS/Canvas ohne Bibliotheken. Frontier-Modelle wurden über eine Perplexity-Subscription genutzt. Subjektiv landete Kimi k2.6 Thinking auf Platz 1, gefolgt von Qwen3.6-27B Q4_K_M (lokal) auf Platz 2 und dem Claude-opus-reasoning-destillierten Qwen3.6-27B auf Platz 3. Kleinere lokale Modelle wie Qwen3.5 4B und Gemma-4-31B-it schnitten schwächer ab. Die Inferenzgeschwindigkeit der lokalen 27B-Quants lag bei 2,65–2,70 tok/s, der MoE-Schnitt Qwen3.6-31B A3B erzielte 12,13 tok/s. Der Test ist rein subjektiv und auf eine einzelne visuelle Aufgabe beschränkt; eine systematische Evaluation fehlt. Der Autor fragt explizit, ob er bei der Frontier-Bewertung etwas übersieht.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.