Qwen3.5 4B als PI-Agent: SOTA auf TerminalBench in der 4B-Klasse

Warum es zählt

Ein 4B-Modell mit SOTA-Ergebnis auf TerminalBench zeigt, dass agentenspezifisches Finetuning kleiner Modelle kompetitiv sein kann – relevant für On-Device- oder ressourcenarme Agent-Deployments.

— Lumeric Redaktion

Der Reddit-Nutzer /u/Mysterious_Hearing14 hat Qwen3.5 4B auf synthetischen Traces aus Hermes- und PI-Agent-Pipelines finegetunet, mit einem Trainingskontext von 32.000 Tokens. Das resultierende Modell soll laut Autor State-of-the-Art auf TerminalBench in der 4B-Parameterklasse erreichen – und damit rund 10 % der Benchmark-Skala abdecken. Das Modell ist über einen HuggingFace Space als kostenlose Demo abrufbar und kann dort einfache Coding-Aufgaben in einer Sandbox ausführen. Zusätzlich werden ein GGUF-Quantisierungs-Format sowie eine uncensored Variante angeboten. Das Projekt adressiert damit den Bedarf an schlanken, lokal ausführbaren Agenten-Modellen, die für Terminal- und Coding-Tasks optimiert sind.

Was wir noch wissen

Basismodell: Qwen3.5 4B, finegetunet auf Hermes- und PI-Agent-Traces
Trainingskontext: 32.000 Tokens
Inference läuft über HuggingFace Serverless, kostenlose Demo verfügbar
Verfügbare Formate: Standard-HF-Modell, GGUF-Quant, Uncensored-Variante
Benchmark: SOTA auf TerminalBench in der 4B-Klasse (ca. 10 % der Skala)

Quelle lesenreddit.com

Agents Open Source Foundation Modelle

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Qwen3.5 4B als PI-Agent: SOTA auf TerminalBench in der 4B-Klasse

ToolsQwen Hugging Face

CompaniesHugging Face

Warum es zählt

Ein 4B-Modell mit SOTA-Ergebnis auf TerminalBench zeigt, dass agentenspezifisches Finetuning kleiner Modelle kompetitiv sein kann – relevant für On-Device- oder ressourcenarme Agent-Deployments.

— Lumeric Redaktion

Was wir noch wissen

Basismodell: Qwen3.5 4B, finegetunet auf Hermes- und PI-Agent-Traces
Trainingskontext: 32.000 Tokens
Inference läuft über HuggingFace Serverless, kostenlose Demo verfügbar
Verfügbare Formate: Standard-HF-Modell, GGUF-Quant, Uncensored-Variante
Benchmark: SOTA auf TerminalBench in der 4B-Klasse (ca. 10 % der Skala)

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Qwen3.5 4B als PI-Agent: SOTA auf TerminalBench in der 4B-Klasse

Frag die KI zum Artikel

Verwandte Beiträge

Qwen3.5 4B als PI-Agent: SOTA auf TerminalBench in der 4B-Klasse

Frag die KI zum Artikel

Verwandte Beiträge