Qwen3.6-35b-a3b spielt Roguelike DCSS – MTP-Version zeigt Tool-Call-Bugs
Ein Nutzer im Subreddit r/LocalLLaMA setzt das Modell Qwen3.6-35b-a3b in der quantisierten Variante q4_k_xl als autonomen Spielagenten für das Open-Source-Roguelike Dungeon Crawl Stone Soup (DCSS) ein. Das Setup läuft lokal via LM Studio auf einer Nvidia RTX 5090 mit 240k Kontext und 8k Output-Tokens. Die Non-MTP-Version des Modells navigiert das Spiel eigenständig, erkundet Dungeon-Ebenen, besiegt Gegner und verwaltet Inventar – der Charakter „BunnyLvl114032", ein Minotaur Fighter auf Dungeon-Ebene 3, überstand mehrere Kämpfe ohne Schaden. Die MTP-Version hingegen schreibt sämtliche Ausgaben in Tool- und Thinking-Blöcke, was zu kaputten Tool-Calls und Spielabbrüchen führt und den erwarteten Speed-Vorteil zunichte macht. Das Skill-Skript für den Agenten wurde in einem Loop aus Codex und Qwen-Playtests generiert. Als Screenshot- und Zustandsquelle nutzt der Bot DCSS-eigene Mechanismen: Screenshots nach jeder Aktion sowie Character Dumps via „#"-Taste in das Morgue-Verzeichnis. Der Ansatz dient dem Nutzer als Alternative zu klassischen Benchmarks – reale Spielperformance statt reiner Eval-Zahlen.
- Modell: qwen3.6-35b-a3b@q4_k_xl, Non-MTP-Version, läuft auf RTX 5090 via LM Studio
- Parameter: 240k Kontext, 8k Output, Temp 0.6, TopK 20, Rep. Penalty 1.0, Pres. Penalty 1.5, TopP 0.95
- MTP-Version erzeugt fehlerhafte Tool-Calls und gibt alles in Tool/Thinking-Blöcke aus
- Charakter BunnyLvl114032 (Minotaur Fighter, XL 5) auf D:3 – kein Schaden genommen, EV 9
- Skill-Skript wurde durch einen Codex+Qwen-Playtest-Loop automatisch generiert
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- MEINUNGreddit.com1d
Qwen 3.6 27B: Q4_K_M vs. Q6 bei agentischen Workloads im Vergleich
- LAUNCHreddit.com1w
Reddit-Nutzer baut Meta-Agenten in reinem Python auf Qwen3-35B
- MEINUNGreddit.com3w
Claude Code 4.7 vs. OpenCode Qwen 3.6 im Spiele-Vergleich
- MEINUNGreddit.com3w
Qwen 3.6 27B/35B kämpft mit Tool-Calling und File-Operationen in lokalen Setups
Qwen3.6-35b-a3b spielt Roguelike DCSS – MTP-Version zeigt Tool-Call-Bugs
Ein Nutzer im Subreddit r/LocalLLaMA setzt das Modell Qwen3.6-35b-a3b in der quantisierten Variante q4_k_xl als autonomen Spielagenten für das Open-Source-Roguelike Dungeon Crawl Stone Soup (DCSS) ein. Das Setup läuft lokal via LM Studio auf einer Nvidia RTX 5090 mit 240k Kontext und 8k Output-Tokens. Die Non-MTP-Version des Modells navigiert das Spiel eigenständig, erkundet Dungeon-Ebenen, besiegt Gegner und verwaltet Inventar – der Charakter „BunnyLvl114032", ein Minotaur Fighter auf Dungeon-Ebene 3, überstand mehrere Kämpfe ohne Schaden. Die MTP-Version hingegen schreibt sämtliche Ausgaben in Tool- und Thinking-Blöcke, was zu kaputten Tool-Calls und Spielabbrüchen führt und den erwarteten Speed-Vorteil zunichte macht. Das Skill-Skript für den Agenten wurde in einem Loop aus Codex und Qwen-Playtests generiert. Als Screenshot- und Zustandsquelle nutzt der Bot DCSS-eigene Mechanismen: Screenshots nach jeder Aktion sowie Character Dumps via „#"-Taste in das Morgue-Verzeichnis. Der Ansatz dient dem Nutzer als Alternative zu klassischen Benchmarks – reale Spielperformance statt reiner Eval-Zahlen.
- Modell: qwen3.6-35b-a3b@q4_k_xl, Non-MTP-Version, läuft auf RTX 5090 via LM Studio
- Parameter: 240k Kontext, 8k Output, Temp 0.6, TopK 20, Rep. Penalty 1.0, Pres. Penalty 1.5, TopP 0.95
- MTP-Version erzeugt fehlerhafte Tool-Calls und gibt alles in Tool/Thinking-Blöcke aus
- Charakter BunnyLvl114032 (Minotaur Fighter, XL 5) auf D:3 – kein Schaden genommen, EV 9
- Skill-Skript wurde durch einen Codex+Qwen-Playtest-Loop automatisch generiert
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- MEINUNGreddit.com1d
Qwen 3.6 27B: Q4_K_M vs. Q6 bei agentischen Workloads im Vergleich
- LAUNCHreddit.com1w
Reddit-Nutzer baut Meta-Agenten in reinem Python auf Qwen3-35B
- MEINUNGreddit.com3w
Claude Code 4.7 vs. OpenCode Qwen 3.6 im Spiele-Vergleich
- MEINUNGreddit.com3w
Qwen 3.6 27B/35B kämpft mit Tool-Calling und File-Operationen in lokalen Setups