Praxisbericht: Qwen3-35B lokal löst Bugs, die Claude Sonnet 4.6 nicht schaffte
Ein Reddit-Nutzer schildert seinen zweimonatigen Weg durch verschiedene KI-Coding-Assistenten für ein Python-Pygame-Projekt mit inzwischen rund 30.000 Zeilen Code in 55 Modulen. Er startete mit Claude Opus (zu teuer), wechselte zu Claude Sonnet 4.6 (Copilot Pro+ mit zusätzlichen Premium-Anfragen), stieß dort aber zunehmend auf Längenbeschränkungen und erfolglose Debugging-Versuche trotz langer Reasoning-Phasen. Der Wechsel zu Qwen3.6-35B-A3B (Q6_K-Quantisierung) über Ollama und Cline lief auf einem System mit RTX 5090 und einer Quadro RTX 4000 Pro (56 GB VRAM gesamt) mit 250.000 Token Kontextfenster. Das Modell löste mehrere Bugs, an denen Sonnet 4.6 gescheitert war. Als strukturelle Vorarbeit hatte er mit Claude Opus zuvor den monolithischen Code in kleinere, thematisch getrennte Module aufgeteilt – was die Arbeit mit beiden Folgemodellen deutlich verbesserte. Der Nutzer plant, Copilot Pro+ vorerst zu kündigen, sobald Claude Opus den aktuellen Code abschließend begutachtet hat.
- Projekt: Python-Pygame-Spiel, ~30.000 Zeilen Code, 55 Module, Entwicklungszeit ~2 Monate
- Hardware: RTX 5090 + Quadro RTX 4000 Pro, insgesamt 56 GB VRAM
- Lokales Setup: Ollama + Cline, Qwen3.6-35B-A3B-UD-Q6_K mit 250k Token Kontextfenster
- Claude Opus wurde initial für Code-Modularisierung genutzt – als strukturelle Grundlage für spätere Modelle
- Kostenfaktor: Nutzer zahlte ~3× den Copilot-Pro+-Preis zusätzlich für Premium-Anfragen bei Sonnet 4.6
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Praxisbericht: Qwen3-35B lokal löst Bugs, die Claude Sonnet 4.6 nicht schaffte
Ein Reddit-Nutzer schildert seinen zweimonatigen Weg durch verschiedene KI-Coding-Assistenten für ein Python-Pygame-Projekt mit inzwischen rund 30.000 Zeilen Code in 55 Modulen. Er startete mit Claude Opus (zu teuer), wechselte zu Claude Sonnet 4.6 (Copilot Pro+ mit zusätzlichen Premium-Anfragen), stieß dort aber zunehmend auf Längenbeschränkungen und erfolglose Debugging-Versuche trotz langer Reasoning-Phasen. Der Wechsel zu Qwen3.6-35B-A3B (Q6_K-Quantisierung) über Ollama und Cline lief auf einem System mit RTX 5090 und einer Quadro RTX 4000 Pro (56 GB VRAM gesamt) mit 250.000 Token Kontextfenster. Das Modell löste mehrere Bugs, an denen Sonnet 4.6 gescheitert war. Als strukturelle Vorarbeit hatte er mit Claude Opus zuvor den monolithischen Code in kleinere, thematisch getrennte Module aufgeteilt – was die Arbeit mit beiden Folgemodellen deutlich verbesserte. Der Nutzer plant, Copilot Pro+ vorerst zu kündigen, sobald Claude Opus den aktuellen Code abschließend begutachtet hat.
- Projekt: Python-Pygame-Spiel, ~30.000 Zeilen Code, 55 Module, Entwicklungszeit ~2 Monate
- Hardware: RTX 5090 + Quadro RTX 4000 Pro, insgesamt 56 GB VRAM
- Lokales Setup: Ollama + Cline, Qwen3.6-35B-A3B-UD-Q6_K mit 250k Token Kontextfenster
- Claude Opus wurde initial für Code-Modularisierung genutzt – als strukturelle Grundlage für spätere Modelle
- Kostenfaktor: Nutzer zahlte ~3× den Copilot-Pro+-Preis zusätzlich für Premium-Anfragen bei Sonnet 4.6
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.