Community-Hilferuf: Continue.dev friert bei Qwen-3.6-Modellen bei Coding-Calls ein

Warum es zählt

Wer Continue.dev mit lokalen Qwen-3.6-Modellen via llama.cpp betreibt, kann auf einen reproduzierbaren Hänger bei Tool-Calls stoßen – auch das Anwenden von Code-Blöcken friert ein. Ein Workaround ist bisher nicht bekannt.

— Lumeric Redaktion

Der Reddit-Nutzer /u/Jorlen schildert ein reproduzierbares Problem beim Einsatz der VS-Code-Extension Continue.dev in Kombination mit Qwen-3.6-Modellen – konkret dem 27B-Dense- und dem 35B/A3B-MoE-Modell. Einfache Chat-Anfragen funktionieren problemlos, doch sobald Coding-Aufgaben oder Datei-Lesevorgänge ausgelöst werden, erscheint zwar der Thinking-Block des Modells, die eigentliche Ausgabe bleibt jedoch aus. Als Backend kommt die Docker-Server-Variante von llama.cpp zum Einsatz. Der Nutzer hat das Reasoning-Budget-Setting von llama.cpp variiert und bestätigt dessen Wirksamkeit: Bei 1024 Token stoppt das Modell den Denkprozess abrupt. Das Chat-Template funktioniert laut Bericht in anderen Frontends wie Roo und Zoo korrekt. Wenn das Modell ausnahmsweise doch Ausgaben liefert, friert Continue.dev beim Versuch ein, die generierten Code-Blöcke anzuwenden. Der Beitrag ist ein Community-Hilferuf ohne bisherigen bestätigten Fix.

Was wir noch wissen

Betroffen: Continue.dev (VS-Code-Extension) mit Qwen 3.6 Dense 27B und 35B/A3B MoE via llama.cpp Docker-Server
Symptom: Thinking-Block erscheint, eigentliche Code-Ausgabe bleibt aus – nur bei Tool-/Coding-Calls, nicht bei einfachem Chat
Reasoning-Budget-Setting in llama.cpp bestätigt funktionsfähig: Modell stoppt Thinking bei exakt 1024 Token
Chat-Template funktioniert in Roo/Zoo-Frontend korrekt – Problem scheint Continue.dev-spezifisch
Sekundäres Problem: Selbst bei gelegentlichen Ausgaben friert die "Apply Code Block"-Funktion in Continue.dev ein

Quelle lesenreddit.com

Coding Assistenten Open Source Inferenz Infra

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Community-Hilferuf: Continue.dev friert bei Qwen-3.6-Modellen bei Coding-Calls ein

ToolsQwen Continue Llama

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Betroffen: Continue.dev (VS-Code-Extension) mit Qwen 3.6 Dense 27B und 35B/A3B MoE via llama.cpp Docker-Server
Symptom: Thinking-Block erscheint, eigentliche Code-Ausgabe bleibt aus – nur bei Tool-/Coding-Calls, nicht bei einfachem Chat
Reasoning-Budget-Setting in llama.cpp bestätigt funktionsfähig: Modell stoppt Thinking bei exakt 1024 Token
Chat-Template funktioniert in Roo/Zoo-Frontend korrekt – Problem scheint Continue.dev-spezifisch
Sekundäres Problem: Selbst bei gelegentlichen Ausgaben friert die "Apply Code Block"-Funktion in Continue.dev ein

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Community-Hilferuf: Continue.dev friert bei Qwen-3.6-Modellen bei Coding-Calls ein

Frag die KI zum Artikel

Verwandte Beiträge

Community-Hilferuf: Continue.dev friert bei Qwen-3.6-Modellen bei Coding-Calls ein

Frag die KI zum Artikel

Verwandte Beiträge