Qwen 3.6-35B mit VS Code als lokaler Coding-Assistent: Vollständige Test-Suite beim ersten Versuch
Der Post dokumentiert eine produktiv eingesetzte Setup-Konfiguration für lokale Inference: Qwen 3.6-35B läuft über llama-cpp mit Vulkan auf einem AMD R9700 mit 262k Token-Kontext. Der Nutzer verarbeitet eine komplexe Prompt (Bike-Shop-Tracker-App in React/TypeScript mit Playwright-Tests) und berichtet von hoher Code-Qualität beim ersten Durchsatz — die generierte Website war sofort lauffähig, und eine komplette Test-Suite erforderte nur eine manuelle Korrektur. Die Integration erfolgt über VS Code's native chatLanguageModels.json mit Custom-Endpoint (llm.home.arpa). Sampling-Parameter stammen von Qwen's eigenem "precise coding"-Preset (temp 0.6, top-p 0.95, top-k 20). Der Beitrag repräsentiert praktische Evidence, dass mittlere Open-Source-Modelle heute für professionelle Entwicklungsaufgaben lokal wirtschaftlich sinnvoll sind.
- Qwen 3.6-35B (Q5_K_XL) auf AMD R9700; 262k Token Kontext mit Flash-Attention und KV-Cache in q8_0
- VS Code Integration über Custom-Endpoint mit Tool-Calling, max. 180k Input / 10k Output Tokens
- "Precise Coding" Sampling direkt von Hugging-Face-Kartei übernommen: temp 0.6, top-p 0.95, top-k 20, repeat-penalty 1.0
- Testfall: React+TypeScript Single-Page-App (Bike-Service-Tracker) mit Playwright-Tests — erste Version funktionsfähig mit nur 1 manuellen Bug-Fix
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- MEINUNGreddit.com3w
Qwen3-27B lokal als Coding-Assistent: Praxisbericht mit RTX 6000 Pro und VSCode
- MEINUNGreddit.com1w
Qwen 35B A3B überzeugt im Agentic-Coding-Einsatz auf Consumer-Hardware
- MEINUNGreddit.com1w
Praxisbericht: Qwen3-35B lokal löst Bugs, die Claude Sonnet 4.6 nicht schaffte
- MEINUNGreddit.com3w
Qwen 3.6 in Echtzeit-Projekt gescheitert: Developer beklagt mangelnde Coding-Fähigkeiten
Qwen 3.6-35B mit VS Code als lokaler Coding-Assistent: Vollständige Test-Suite beim ersten Versuch
Der Post dokumentiert eine produktiv eingesetzte Setup-Konfiguration für lokale Inference: Qwen 3.6-35B läuft über llama-cpp mit Vulkan auf einem AMD R9700 mit 262k Token-Kontext. Der Nutzer verarbeitet eine komplexe Prompt (Bike-Shop-Tracker-App in React/TypeScript mit Playwright-Tests) und berichtet von hoher Code-Qualität beim ersten Durchsatz — die generierte Website war sofort lauffähig, und eine komplette Test-Suite erforderte nur eine manuelle Korrektur. Die Integration erfolgt über VS Code's native chatLanguageModels.json mit Custom-Endpoint (llm.home.arpa). Sampling-Parameter stammen von Qwen's eigenem "precise coding"-Preset (temp 0.6, top-p 0.95, top-k 20). Der Beitrag repräsentiert praktische Evidence, dass mittlere Open-Source-Modelle heute für professionelle Entwicklungsaufgaben lokal wirtschaftlich sinnvoll sind.
- Qwen 3.6-35B (Q5_K_XL) auf AMD R9700; 262k Token Kontext mit Flash-Attention und KV-Cache in q8_0
- VS Code Integration über Custom-Endpoint mit Tool-Calling, max. 180k Input / 10k Output Tokens
- "Precise Coding" Sampling direkt von Hugging-Face-Kartei übernommen: temp 0.6, top-p 0.95, top-k 20, repeat-penalty 1.0
- Testfall: React+TypeScript Single-Page-App (Bike-Service-Tracker) mit Playwright-Tests — erste Version funktionsfähig mit nur 1 manuellen Bug-Fix
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- MEINUNGreddit.com3w
Qwen3-27B lokal als Coding-Assistent: Praxisbericht mit RTX 6000 Pro und VSCode
- MEINUNGreddit.com1w
Qwen 35B A3B überzeugt im Agentic-Coding-Einsatz auf Consumer-Hardware
- MEINUNGreddit.com1w
Praxisbericht: Qwen3-35B lokal löst Bugs, die Claude Sonnet 4.6 nicht schaffte
- MEINUNGreddit.com3w
Qwen 3.6 in Echtzeit-Projekt gescheitert: Developer beklagt mangelnde Coding-Fähigkeiten