SmallCode: Coding-Agent für lokale 4B-Modelle erreicht 87 % auf Benchmarks

ToolsOllama LM Studio Claude Claude Code GPT Qwen Cursor

CompaniesOpenAI

Warum es zählt

Entwickler, die auf lokale Inferenz setzen, erhalten mit SmallCode einen Agenten, der durch Compound-Tools, automatische Fehler-Feedback-Schleifen und Token-Budgeting auch mit 4B-Modellen zuverlässig funktioniert – ohne Cloud-Abhängigkeit für ~95 % der Aufgaben.

— Lumeric Redaktion

SmallCode wurde als direkte Reaktion auf die Schwäche bestehender Coding-Agenten wie OpenCode, Cursor und Claude Code mit kleinen lokalen Modellen entwickelt. Der Autor, Reddit-Nutzer /u/Glittering_Focus1538, kritisiert, dass diese Tools de facto GPT-5.4- oder Claude-Opus-Modelle voraussetzen und mit lokalen Modellen wie Gemma oder Qwen durch fehlschlagende Tool-Calls, Kontext-Overflows und kollabierendes Multi-Step-Reasoning versagen. SmallCode löst dies durch mehrere architektonische Tricks: Compound-Tools bündeln bis zu vier Tool-Calls in einen einzigen Aufruf, da kleine Modelle nach drei aufeinanderfolgenden Calls an Kohärenz verlieren. Eine Improvement-Loop kompiliert und lintet generierten Code sofort und speist Fehler automatisch zurück. Bei wiederholtem Scheitern zerlegt der Agent das Problem in kleinere Teilaufgaben. Als letzter Ausweg eskaliert SmallCode optional zu einem Cloud-Modell – laut Autor trifft das nur etwa 5 % der Fälle. Ein Code-Graph indexiert die gesamte Codebasis als Symbolnetz, statt per grep zu suchen. Das Tool ist via npm installierbar, MIT-lizenziert und unterstützt LM Studio, Ollama sowie jeden OpenAI-kompatiblen Endpunkt. OpenCode erreicht mit 14B-Modellen laut Autor nur ~75 % auf demselben Benchmark.

Was wir noch wissen

SmallCode schlägt OpenCode (~75 % mit 14B-Modellen) mit einem Gemma-4B-Modell (87/100 Tasks)
Compound-Tools fassen bis zu 4 Einzelschritte zusammen und halbieren laut Autor die Fehlerrate
Token-Budgeting hält Kontext innerhalb des 32k–256k-Fensters kleiner Modelle durch Zusammenfassung und Trunkierung
Code-Graph-Index (Funktionen, Klassen, Call-Graph) ersetzt Grep-Suche für präzisere Kontextauswahl
Installation per npm install -g smallcode; MIT-lizenziert auf GitHub verfügbar

Quelle lesenreddit.com

87/100 Tasks

Benchmark-Aufgaben mit Gemma 4B gelöst

Coding Assistenten Open Source Agents

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

SmallCode: Coding-Agent für lokale 4B-Modelle erreicht 87 % auf Benchmarks

ToolsOllama LM Studio Claude Claude Code GPT Qwen Cursor

CompaniesOpenAI

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

SmallCode schlägt OpenCode (~75 % mit 14B-Modellen) mit einem Gemma-4B-Modell (87/100 Tasks)
Compound-Tools fassen bis zu 4 Einzelschritte zusammen und halbieren laut Autor die Fehlerrate
Token-Budgeting hält Kontext innerhalb des 32k–256k-Fensters kleiner Modelle durch Zusammenfassung und Trunkierung
Code-Graph-Index (Funktionen, Klassen, Call-Graph) ersetzt Grep-Suche für präzisere Kontextauswahl
Installation per npm install -g smallcode; MIT-lizenziert auf GitHub verfügbar

87/100 Tasks

Benchmark-Aufgaben mit Gemma 4B gelöst

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

SmallCode: Coding-Agent für lokale 4B-Modelle erreicht 87 % auf Benchmarks

Frag die KI zum Artikel

Verwandte Beiträge

SmallCode: Coding-Agent für lokale 4B-Modelle erreicht 87 % auf Benchmarks

Frag die KI zum Artikel

Verwandte Beiträge