Qwen 3.6 35B A3B überzeugt als bestes kleines lokales LLM im Praxistest
Der Reddit-Nutzer The_Paradoxy nutzt als persönlichen Benchmark die Fähigkeit kleiner lokaler Modelle, Code aus seinem akademischen Nischenbereich zu verstehen – Inhalte, die er als kaum in Trainingsdaten vertreten einschätzt. Noch vor wenigen Monaten war Devstral Small 2 der beste verfügbare Kandidat, allerdings mit nur nominaler Leistung. Im aktuellen Test verglich er vier Modelle: Qwen 3.6 35B A3B, Qwen 3.6 27B, Gemma 4 26B A4B und Nemotron 3 Nano – alle auf einer Dual-16GB-GPU-Konfiguration (32 GB VRAM). Die entscheidende Neuerung: Techniken wie Gated Delta Net, Hybrid Mamba2 und Sliding Window Attention ermöglichen deutlich längere Kontextfenster, was das Modellverständnis für längere Code-Paper-Kombinationen erheblich verbessert. Alle vier Modelle schnitten nach Angaben des Autors deutlich besser ab als frühere kleine Lokalmodelle. Qwen 3.6 35B A3B hob sich dabei als klarer Spitzenreiter hervor. Der Autor spekuliert, dass ein Mensch mit Unterstützung eines dieser Modelle leistungsfähiger sein könnte als Claude Opus 4.7 allein – eine subjektive, nicht kontrolliert gemessene Einschätzung.
- Qwen 3.6 35B A3B wurde als bestes der vier getesteten Modelle eingestuft
- Lange Kontextfenster durch Gated Delta Net, Hybrid Mamba2 und Sliding Window Attention als Schlüsseltechnik
- Devstral Small 2 konnte aufgrund von RAM-Engpässen (32 GB) nicht im vollen Kontext getestet werden
- Autor wünscht sich ein neues Mistral-Kleinmodell mit Gated Delta Net als potenziellen Thronfolger
- Subjektive Einschätzung: Mensch + eines dieser Modelle > Claude Opus 4.7 allein
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Qwen 3.6 35B A3B überzeugt als bestes kleines lokales LLM im Praxistest
Der Reddit-Nutzer The_Paradoxy nutzt als persönlichen Benchmark die Fähigkeit kleiner lokaler Modelle, Code aus seinem akademischen Nischenbereich zu verstehen – Inhalte, die er als kaum in Trainingsdaten vertreten einschätzt. Noch vor wenigen Monaten war Devstral Small 2 der beste verfügbare Kandidat, allerdings mit nur nominaler Leistung. Im aktuellen Test verglich er vier Modelle: Qwen 3.6 35B A3B, Qwen 3.6 27B, Gemma 4 26B A4B und Nemotron 3 Nano – alle auf einer Dual-16GB-GPU-Konfiguration (32 GB VRAM). Die entscheidende Neuerung: Techniken wie Gated Delta Net, Hybrid Mamba2 und Sliding Window Attention ermöglichen deutlich längere Kontextfenster, was das Modellverständnis für längere Code-Paper-Kombinationen erheblich verbessert. Alle vier Modelle schnitten nach Angaben des Autors deutlich besser ab als frühere kleine Lokalmodelle. Qwen 3.6 35B A3B hob sich dabei als klarer Spitzenreiter hervor. Der Autor spekuliert, dass ein Mensch mit Unterstützung eines dieser Modelle leistungsfähiger sein könnte als Claude Opus 4.7 allein – eine subjektive, nicht kontrolliert gemessene Einschätzung.
- Qwen 3.6 35B A3B wurde als bestes der vier getesteten Modelle eingestuft
- Lange Kontextfenster durch Gated Delta Net, Hybrid Mamba2 und Sliding Window Attention als Schlüsseltechnik
- Devstral Small 2 konnte aufgrund von RAM-Engpässen (32 GB) nicht im vollen Kontext getestet werden
- Autor wünscht sich ein neues Mistral-Kleinmodell mit Gated Delta Net als potenziellen Thronfolger
- Subjektive Einschätzung: Mensch + eines dieser Modelle > Claude Opus 4.7 allein
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.