Qwen3.6-35b-a3b spielt Roguelike DCSS – MTP-Version zeigt Tool-Call-Bugs

CompaniesNVIDIA

Warum es zählt

Die MTP-Version von Qwen3.6-35b-a3b produziert kaputte Tool-Calls und blockiert damit den Geschwindigkeitsvorteil – wichtig für alle, die Qwen-Modelle in agentischen Workflows mit Tool-Use einsetzen. DCSS eignet sich als praxisnaher Benchmark für LLM-Agenten jenseits klassischer Eval-Zahlen.

— Lumeric Redaktion

Ein Nutzer im Subreddit r/LocalLLaMA setzt das Modell Qwen3.6-35b-a3b in der quantisierten Variante q4_k_xl als autonomen Spielagenten für das Open-Source-Roguelike Dungeon Crawl Stone Soup (DCSS) ein. Das Setup läuft lokal via LM Studio auf einer Nvidia RTX 5090 mit 240k Kontext und 8k Output-Tokens. Die Non-MTP-Version des Modells navigiert das Spiel eigenständig, erkundet Dungeon-Ebenen, besiegt Gegner und verwaltet Inventar – der Charakter „BunnyLvl114032", ein Minotaur Fighter auf Dungeon-Ebene 3, überstand mehrere Kämpfe ohne Schaden. Die MTP-Version hingegen schreibt sämtliche Ausgaben in Tool- und Thinking-Blöcke, was zu kaputten Tool-Calls und Spielabbrüchen führt und den erwarteten Speed-Vorteil zunichte macht. Das Skill-Skript für den Agenten wurde in einem Loop aus Codex und Qwen-Playtests generiert. Als Screenshot- und Zustandsquelle nutzt der Bot DCSS-eigene Mechanismen: Screenshots nach jeder Aktion sowie Character Dumps via „#"-Taste in das Morgue-Verzeichnis. Der Ansatz dient dem Nutzer als Alternative zu klassischen Benchmarks – reale Spielperformance statt reiner Eval-Zahlen.

Was wir noch wissen

Modell: qwen3.6-35b-a3b@q4_k_xl, Non-MTP-Version, läuft auf RTX 5090 via LM Studio
Parameter: 240k Kontext, 8k Output, Temp 0.6, TopK 20, Rep. Penalty 1.0, Pres. Penalty 1.5, TopP 0.95
MTP-Version erzeugt fehlerhafte Tool-Calls und gibt alles in Tool/Thinking-Blöcke aus
Charakter BunnyLvl114032 (Minotaur Fighter, XL 5) auf D:3 – kein Schaden genommen, EV 9
Skill-Skript wurde durch einen Codex+Qwen-Playtest-Loop automatisch generiert

Quelle lesenreddit.com

Agents Open Source Evals Benchmarks

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Qwen3.6-35b-a3b spielt Roguelike DCSS – MTP-Version zeigt Tool-Call-Bugs

ToolsLM Studio GPT Qwen NVIDIA Hardware

CompaniesNVIDIA

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Modell: qwen3.6-35b-a3b@q4_k_xl, Non-MTP-Version, läuft auf RTX 5090 via LM Studio
Parameter: 240k Kontext, 8k Output, Temp 0.6, TopK 20, Rep. Penalty 1.0, Pres. Penalty 1.5, TopP 0.95
MTP-Version erzeugt fehlerhafte Tool-Calls und gibt alles in Tool/Thinking-Blöcke aus
Charakter BunnyLvl114032 (Minotaur Fighter, XL 5) auf D:3 – kein Schaden genommen, EV 9
Skill-Skript wurde durch einen Codex+Qwen-Playtest-Loop automatisch generiert

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Qwen3.6-35b-a3b spielt Roguelike DCSS – MTP-Version zeigt Tool-Call-Bugs

Frag die KI zum Artikel

Verwandte Beiträge

Qwen3.6-35b-a3b spielt Roguelike DCSS – MTP-Version zeigt Tool-Call-Bugs

Frag die KI zum Artikel

Verwandte Beiträge