Praxisbericht: Qwen3-35B lokal löst Bugs, die Claude Sonnet 4.6 nicht schaffte

ToolsOllama Claude Qwen Cline GitHub Copilot

Warum es zählt

Für Entwickler mit leistungsstarker Hardware (hier: RTX 5090 + 56 GB VRAM) kann das lokale Betreiben von Qwen3.6-35B via Ollama/Cline eine kosteneffiziente Alternative zu Cloud-Modellen sein – besonders bei großen Codebasen mit viel Kontext.

— Lumeric Redaktion

Ein Reddit-Nutzer schildert seinen zweimonatigen Weg durch verschiedene KI-Coding-Assistenten für ein Python-Pygame-Projekt mit inzwischen rund 30.000 Zeilen Code in 55 Modulen. Er startete mit Claude Opus (zu teuer), wechselte zu Claude Sonnet 4.6 (Copilot Pro+ mit zusätzlichen Premium-Anfragen), stieß dort aber zunehmend auf Längenbeschränkungen und erfolglose Debugging-Versuche trotz langer Reasoning-Phasen. Der Wechsel zu Qwen3.6-35B-A3B (Q6_K-Quantisierung) über Ollama und Cline lief auf einem System mit RTX 5090 und einer Quadro RTX 4000 Pro (56 GB VRAM gesamt) mit 250.000 Token Kontextfenster. Das Modell löste mehrere Bugs, an denen Sonnet 4.6 gescheitert war. Als strukturelle Vorarbeit hatte er mit Claude Opus zuvor den monolithischen Code in kleinere, thematisch getrennte Module aufgeteilt – was die Arbeit mit beiden Folgemodellen deutlich verbesserte. Der Nutzer plant, Copilot Pro+ vorerst zu kündigen, sobald Claude Opus den aktuellen Code abschließend begutachtet hat.

Was wir noch wissen

Projekt: Python-Pygame-Spiel, ~30.000 Zeilen Code, 55 Module, Entwicklungszeit ~2 Monate
Hardware: RTX 5090 + Quadro RTX 4000 Pro, insgesamt 56 GB VRAM
Lokales Setup: Ollama + Cline, Qwen3.6-35B-A3B-UD-Q6_K mit 250k Token Kontextfenster
Claude Opus wurde initial für Code-Modularisierung genutzt – als strukturelle Grundlage für spätere Modelle
Kostenfaktor: Nutzer zahlte ~3× den Copilot-Pro+-Preis zusätzlich für Premium-Anfragen bei Sonnet 4.6

Quelle lesenreddit.com

Open Source Coding Assistenten Inferenz Infra

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Praxisbericht: Qwen3-35B lokal löst Bugs, die Claude Sonnet 4.6 nicht schaffte

ToolsOllama Claude Qwen Cline GitHub Copilot

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Projekt: Python-Pygame-Spiel, ~30.000 Zeilen Code, 55 Module, Entwicklungszeit ~2 Monate
Hardware: RTX 5090 + Quadro RTX 4000 Pro, insgesamt 56 GB VRAM
Lokales Setup: Ollama + Cline, Qwen3.6-35B-A3B-UD-Q6_K mit 250k Token Kontextfenster
Claude Opus wurde initial für Code-Modularisierung genutzt – als strukturelle Grundlage für spätere Modelle
Kostenfaktor: Nutzer zahlte ~3× den Copilot-Pro+-Preis zusätzlich für Premium-Anfragen bei Sonnet 4.6

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Praxisbericht: Qwen3-35B lokal löst Bugs, die Claude Sonnet 4.6 nicht schaffte

Frag die KI zum Artikel

Verwandte Beiträge

Praxisbericht: Qwen3-35B lokal löst Bugs, die Claude Sonnet 4.6 nicht schaffte

Frag die KI zum Artikel

Verwandte Beiträge