wird geladen

Qwen3.6-27B lokal schlägt Frontier-Modelle bei Canvas-Coding-Task · Lumeric

Beitrag

BENCHMARK

reddit.com· r/LocalLLaMA1mo

Qwen3.6-27B lokal schlägt Frontier-Modelle bei Canvas-Coding-Task

ToolsClaude GPT Gemini Qwen

CompaniesPerplexity

Warum es zählt

Qwen3.6-27B lokal (Q4_K_M, 2,70 tok/s) liefert bei visuell anspruchsvollen Vanilla-JS-Coding-Primitives Ergebnisse, die laut Tester stärker sind als einige Frontier-Modelle – relevant für Entwickler, die leistungsfähige lokale Inferenz auf Consumer-Hardware (RX 5700 XT 8 GB) evaluieren.

— Lumeric Redaktion

Ein Reddit-Nutzer hat auf einem Consumer-System (Ryzen 5 5600, 24 GB DDR4-3200, RX 5700 XT 8 GB) sieben lokale Modelle und vier Frontier-Modelle mit identischem Prompt verglichen: Aufgabe war eine einzige HTML-Datei mit Full-Page-Canvas-Animation – fahrendes Auto, Parallax-Hintergrund, rotierende Räder, Atmosphärenlicht, naiver JS/Canvas ohne Bibliotheken. Frontier-Modelle wurden über eine Perplexity-Subscription genutzt. Subjektiv landete Kimi k2.6 Thinking auf Platz 1, gefolgt von Qwen3.6-27B Q4_K_M (lokal) auf Platz 2 und dem Claude-opus-reasoning-destillierten Qwen3.6-27B auf Platz 3. Kleinere lokale Modelle wie Qwen3.5 4B und Gemma-4-31B-it schnitten schwächer ab. Die Inferenzgeschwindigkeit der lokalen 27B-Quants lag bei 2,65–2,70 tok/s, der MoE-Schnitt Qwen3.6-31B A3B erzielte 12,13 tok/s. Der Test ist rein subjektiv und auf eine einzelne visuelle Aufgabe beschränkt; eine systematische Evaluation fehlt. Der Autor fragt explizit, ob er bei der Frontier-Bewertung etwas übersieht.

Quelle lesenreddit.com

Foundation Modelle Open Source Coding Assistenten

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Verwandte Beiträge

BENCHMARK

reddit.com· r/LocalLLaMA1mo

Qwen3.6-27B lokal schlägt Frontier-Modelle bei Canvas-Coding-Task

ToolsClaude GPT Gemini Qwen

CompaniesPerplexity

Warum es zählt

Qwen3.6-27B lokal (Q4_K_M, 2,70 tok/s) liefert bei visuell anspruchsvollen Vanilla-JS-Coding-Primitives Ergebnisse, die laut Tester stärker sind als einige Frontier-Modelle – relevant für Entwickler, die leistungsfähige lokale Inferenz auf Consumer-Hardware (RX 5700 XT 8 GB) evaluieren.

— Lumeric Redaktion

Ein Reddit-Nutzer hat auf einem Consumer-System (Ryzen 5 5600, 24 GB DDR4-3200, RX 5700 XT 8 GB) sieben lokale Modelle und vier Frontier-Modelle mit identischem Prompt verglichen: Aufgabe war eine einzige HTML-Datei mit Full-Page-Canvas-Animation – fahrendes Auto, Parallax-Hintergrund, rotierende Räder, Atmosphärenlicht, naiver JS/Canvas ohne Bibliotheken. Frontier-Modelle wurden über eine Perplexity-Subscription genutzt. Subjektiv landete Kimi k2.6 Thinking auf Platz 1, gefolgt von Qwen3.6-27B Q4_K_M (lokal) auf Platz 2 und dem Claude-opus-reasoning-destillierten Qwen3.6-27B auf Platz 3. Kleinere lokale Modelle wie Qwen3.5 4B und Gemma-4-31B-it schnitten schwächer ab. Die Inferenzgeschwindigkeit der lokalen 27B-Quants lag bei 2,65–2,70 tok/s, der MoE-Schnitt Qwen3.6-31B A3B erzielte 12,13 tok/s. Der Test ist rein subjektiv und auf eine einzelne visuelle Aufgabe beschränkt; eine systematische Evaluation fehlt. Der Autor fragt explizit, ob er bei der Frontier-Bewertung etwas übersieht.

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Verwandte Beiträge