Diskussion: Qwen Code vs. andere Agentic-Harnesses für lokale Qwen-Modelle
Ein Reddit-Nutzer fragt nach Erfahrungsberichten zum Vergleich von Qwen Code mit anderen Coding-Harnesses wie Claude Code, OpenCode, Aider oder Cline für lokale Qwen-Modelle.
Qwen 3.7 auf Qwen Chat veröffentlicht
Alibabas neues Sprachmodell Qwen 3.7 ist auf der Plattform Qwen Chat erschienen. Details zu Parameterzahl, Architektur und Benchmarks sind aus dem Quelltext nicht ersichtlich.

Qwen AI veröffentlicht Qwen-Scope: Open-Source Sparse-Autoencoder-Suite für LLM-Interpretierbarkeit
Das Qwen-Team stellt Qwen-Scope vor, eine Open-Source-Suite auf Basis Sparse Autoencoder (SAE), die interne Features von LLMs sichtbar macht und als praktische Entwicklerwerkzeuge nutzbar macht.
Prompt-Variationen führen zu teils gegensätzlichen Ergebnissen bei Qwen und Gemma
Ein Reddit-Post vergleicht das Verhalten von Qwen 3.5, Qwen 3.6 und Gemma 4 bei zwei Versionen einer Mathematikaufgabe – kurz und kontextreich. Die Modelle zeigen stark unterschiedliche Erfolgsquoten je nach Prompting-Stil, was auf modellspezifische Anforderungen hindeutet.
Pi-Client drosselt Qwen 35B A3B Thinking-Verbosity ohne Modell-Reload
Ein Nutzer beobachtet, dass der Pi-Client Qwen 35B A3B via llama-server zu minimalem Reasoning bringt, während alle anderen Clients bei Budget -1 endlos denken – trotz identischem System-Prompt.
Community fragt: Kommen weitere Qwen 3.6 Modelle in 9B, 122B und 397B?
Ein Reddit-Thread auf r/LocalLLaMA fragt, ob Qwen weitere Modellgrößen (9B, 122B, 397B) mit dem 3.6-Update versehen wird – bislang gibt es keine offizielle Aussage dazu.
Community fragt nach Qwen-3.6 Distillaten in 9B und 14B für lokales Coding
Ein r/LocalLLaMA-Nutzer sucht nach kleineren Distillaten des Qwen-3.6-27B-Modells (9B/14B) für lokales Coding auf einer RTX 1000 mit 6 GB VRAM und berichtet von Tool-Calling-Problemen mit Qwen-3.5 9B.
Qwen 3.6 35B A3B überzeugt als bestes kleines lokales LLM im Praxistest
Ein Reddit-Nutzer testete vier kleine lokale Modelle (Qwen 3.6 35B A3B, Qwen 3.6 27B, Gemma 4 26B A4B, Nemotron 3 Nano) anhand akademischem Nischencode und krönte Qwen 3.6 35B A3B zum klaren Sieger.
ReAct-Agent mit Qwen 3.5 9B und Gemma 4 via LangGraph: Stabilitätsprobleme in Tool-Loops
Ein Entwickler beschreibt Probleme beim Aufbau eines ReAct-style Looping-Agents mit kleinen LLMs (Qwen 3.5 9B, Gemma 4) und LangGraph: Qwen generiert exzessive Reasoning-Tokens, Ausgaben werden abgeschnitten und rekursive Loops werden instabil.
Qwen 3.7 angekündigt: Neues Open-Weight-Modell von Alibaba erwartet
Alibabas Qwen-Team hat Qwen 3.7 angekündigt. Die Community wartet auf die Open-Weight-Veröffentlichung des Modells, das laut Hype als neuer Spitzenreiter gehandelt wird.
Qwen 3.6 vs. Gemma 4: Praxistest enthüllt Benchmark-Gaming bei Vision-Modellen
Ein lokaler Vergleichstest von Qwen 3.6 (31B) und Gemma 4 (27B) auf vLLM mit FP8-Quantisierung zeigt: Trotz besserer Benchmark-Werte verliert Qwen 3.6 in realen Vision-Aufgaben häufig gegen Gemma 4.
Qwen 3.6 27B/35B verdrängen ältere 30B-Modelle bei lokalen Setups
Reddit-Diskussion über die Marktposition von Qwen 3.6 27B und 35B: Nutzer berichten, dass diese Modelle ältere ~30B-Parameter-Modelle wie Qwen Coder 30B und Gemma obsolet machen – besonders bei Coding und Agent-Workflows.
Qwen 3.6 27B: Lokales AR-zu-Diffusion-Training auf RTX 5090 erprobt
Ein Entwickler erprobt das lokale Training von Qwen 3.6 27B als autoregressive-zu-Diffusion-Konvertierung auf einer RTX 5090 via QLoRA und nvfp4 – trotz Hardware-Zwischenfällen und fehlendem Abschlussmodell.
Community-Diskussion: Beste Q8-Quantisierung für Qwen 2.5 27B
Ein Reddit-Nutzer fragt nach der besten Q8-Quantisierung für Qwen 2.5 27B, da niedrigere Quants bei Coding-Aufgaben Fehler produzieren – und erwägt den Wechsel zu Qwen 2.5 35B-A3B Q8.
Qwen kündigt baldige Veröffentlichung der 3.7-Modelle an
Laut einem Reddit-Post auf r/LocalLLaMA plant Qwen die Veröffentlichung von Modellen der Generation 3.7 in Kürze. Details zu Parametergröße oder Fähigkeiten sind aus dem Snippet nicht bekannt.
Qwen 3.6 27B im GGUF-Format mit MTP-Optimierung verfügbar
Ein Nutzer berichtet von positiven Erfahrungen mit Qwen 3.6 27B in Q4.0-Quantisierung und MTP-Version für LLAMA.cpp. Auf AMD iGPU mit 64 GB unified Memory erreicht das Modell vergleichbare Geschwindigkeiten wie Qwen 3.5 9B.
Qwen 3.6 27B: Q4_K_M vs. Q6 bei agentischen Workloads im Vergleich
Ein Reddit-Nutzer berichtet, dass Q4_K_M bei Qwen 3.6 27B deutlich mehr Fehler produziert als Q6 – bei agentischen Aufgaben mehrere Fehler pro Stunde statt alle paar Tage.
Community fordert Qwen 3.7 Open-Source-Release: Wann kommt das Modell?
Ein viraler Reddit-Post auf r/LocalLLaMA thematisiert humorvoll die Community-Ungeduld über den ausstehenden Open-Source-Release von Qwen 3.7 – egal ob 9B, 27B oder 122B Parameter.
hipEngine: ROCm-native LLM-Inferenz für RDNA3 übertrifft llama.cpp bei Qwen 3.6
hipEngine ist eine neue Open-Source-Inferenz-Engine (AGPLv3) für AMD RDNA3-GPUs, die Qwen 3.6 MoE mit HIP/C++-Kerneln schneller als llama.cpp ausführt – bei 512-Token-Prefill auf der 7900 XTX bis zu 2718 tok/s gegenüber 2436 tok/s (llama.cpp HIP).
Continue.dev mit Qwen 3.6 und llama.cpp: Config-Probleme bei Tool Calls
Ein Reddit-Nutzer fragt nach funktionierenden Continue.dev-Konfigurationen für Qwen 3.6 mit llama-server, da sein Setup nach fehlerhaften Tool Calls hängt.

Qwen 3.7 Max von Alibaba jetzt im Vercel AI Gateway verfügbar
Alibabas Qwen 3.7 Max ist ab sofort über das Vercel AI Gateway abrufbar. Das Modell ist auf Agentenworkflows ausgelegt und unterstützt Coding, Office-Automatisierung und langfristige autonome Ausführung.
ByteShape: Qwen 3.6 35B GGUF – NTP vs. MTP Quantisierung im Hardware-Vergleich
ByteShape hat Qwen 3.6 35B GGUF in NTP- und MTP-Varianten veröffentlicht und auf GPUs (RTX 4090 bis 5060 Ti) sowie CPUs (Intel, Ryzen, Raspberry Pi 5) verglichen. MTP bringt auf GPUs 20–40 % mehr Generierungsgeschwindigkeit, ist auf CPUs aber nicht empfehlenswert.
Qwen 3.6 27B F16 besteht Pacman-Benchmark als erster lokaler Coding-Agent
Ein Nutzer auf r/LocalLLaMA entwickelte einen eigenen Coding-Benchmark (Pac-Man-Klon per One-Shot) und testete zahlreiche Modelle – Qwen 3.6 27B im F16-Format ist das erste Modell, das überzeugend abschneidet.
Qwen 35B A3B überzeugt im Agentic-Coding-Einsatz auf Consumer-Hardware
Ein Nutzer berichtet von positiven Erfahrungen mit Qwen 35B A3B für agentic Coding via Claude Code und llama.cpp auf einer 4090+5060-Ti-Kombination – das Modell schlägt in seinem Use-Case Gemma4 26B.
Community-Hilferuf: Continue.dev friert bei Qwen-3.6-Modellen bei Coding-Calls ein
Ein Nutzer berichtet von einem Bug in Continue.dev (VS-Code-Extension): Qwen-3.6-Modelle (27B dense und 35B/A3B MoE) zeigen bei Coding-Anfragen oder Datei-Reads nur den Thinking-Block, aber keine eigentliche Ausgabe.
Reddit-Diskussion: Qwen 3.5 4B für Roleplay-Finetuning geeignet?
Ein r/LocalLLaMA-Nutzer fragt nach Erfahrungen beim Finetuning von Qwen 3.5 4B (Heretic-Variante) für Roleplay-Anwendungen und sucht Tipps zur Erstellung synthetischer Datensätze aus Frontier-APIs.
Multi-Token Prediction für Qwen auf LLaMA.cpp: +40 % Durchsatz mit MTP und TurboQuant
Ein Community-Entwickler hat Multi-Token Prediction (MTP) für Qwen-Modelle in LLaMA.cpp mit TurboQuant integriert und erreicht damit 34 statt 21 Tokens/s – ein Plus von ~40 % bei 90 % Akzeptanzrate.
Community sucht Image2Image-Alternativen zu Qwen-Image-Edit-2511
Ein Reddit-Nutzer fragt nach Image2Image-Modellen, die mit Qwen-Image-Edit-2511 mithalten oder es übertreffen – bei vergleichbarer Größe. FLUX.2-9B wird als nicht überzeugend eingestuft, FLUX.2-dev als zu groß.
Qwen 3.6 35B löst Linux-WLAN-Problem auf 10.000 Meter Höhe
Ein Nutzer löste während eines Fluges ein DNS-Problem seines Ubuntu-Laptops mit Hilfe des lokal laufenden Qwen 3.6 35B (MoE, 3B aktive Parameter) – der Agent fand einen nmcli-Fix in Sekunden.
Qwen kostenloser Zugang offenbar eingeschränkt oder abgeschaltet
Ein Reddit-Nutzer berichtet, dass Qwen nicht mehr kostenlos nutzbar ist. Details und Hintergrund sind aus dem verfügbaren Auszug nicht ersichtlich.