Qwen 3.6 35B A3B überzeugt als bestes kleines lokales LLM im Praxistest

Warum es zählt

Für lokale AI-Deployments zeigt der Test, dass kleine MoE-Modelle mit langen Kontextfenstern inzwischen komplexen akademischen Code verstehen – eine Fähigkeit, die vor wenigen Monaten selbst Top-Modellen wie Devstral Small 2 fehlte.

— Lumeric Redaktion

Der Reddit-Nutzer The_Paradoxy nutzt als persönlichen Benchmark die Fähigkeit kleiner lokaler Modelle, Code aus seinem akademischen Nischenbereich zu verstehen – Inhalte, die er als kaum in Trainingsdaten vertreten einschätzt. Noch vor wenigen Monaten war Devstral Small 2 der beste verfügbare Kandidat, allerdings mit nur nominaler Leistung. Im aktuellen Test verglich er vier Modelle: Qwen 3.6 35B A3B, Qwen 3.6 27B, Gemma 4 26B A4B und Nemotron 3 Nano – alle auf einer Dual-16GB-GPU-Konfiguration (32 GB VRAM). Die entscheidende Neuerung: Techniken wie Gated Delta Net, Hybrid Mamba2 und Sliding Window Attention ermöglichen deutlich längere Kontextfenster, was das Modellverständnis für längere Code-Paper-Kombinationen erheblich verbessert. Alle vier Modelle schnitten nach Angaben des Autors deutlich besser ab als frühere kleine Lokalmodelle. Qwen 3.6 35B A3B hob sich dabei als klarer Spitzenreiter hervor. Der Autor spekuliert, dass ein Mensch mit Unterstützung eines dieser Modelle leistungsfähiger sein könnte als Claude Opus 4.7 allein – eine subjektive, nicht kontrolliert gemessene Einschätzung.

Was wir noch wissen

Qwen 3.6 35B A3B wurde als bestes der vier getesteten Modelle eingestuft
Lange Kontextfenster durch Gated Delta Net, Hybrid Mamba2 und Sliding Window Attention als Schlüsseltechnik
Devstral Small 2 konnte aufgrund von RAM-Engpässen (32 GB) nicht im vollen Kontext getestet werden
Autor wünscht sich ein neues Mistral-Kleinmodell mit Gated Delta Net als potenziellen Thronfolger
Subjektive Einschätzung: Mensch + eines dieser Modelle > Claude Opus 4.7 allein

Quelle lesenreddit.com

Foundation Modelle Open Source Inferenz Infra

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Qwen 3.6 35B A3B überzeugt als bestes kleines lokales LLM im Praxistest

ToolsClaude Qwen Mistral

CompaniesMistral AI

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Qwen 3.6 35B A3B wurde als bestes der vier getesteten Modelle eingestuft
Lange Kontextfenster durch Gated Delta Net, Hybrid Mamba2 und Sliding Window Attention als Schlüsseltechnik
Devstral Small 2 konnte aufgrund von RAM-Engpässen (32 GB) nicht im vollen Kontext getestet werden
Autor wünscht sich ein neues Mistral-Kleinmodell mit Gated Delta Net als potenziellen Thronfolger
Subjektive Einschätzung: Mensch + eines dieser Modelle > Claude Opus 4.7 allein

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Qwen 3.6 35B A3B überzeugt als bestes kleines lokales LLM im Praxistest

Frag die KI zum Artikel

Verwandte Beiträge

Qwen 3.6 35B A3B überzeugt als bestes kleines lokales LLM im Praxistest

Frag die KI zum Artikel

Verwandte Beiträge