Qwen3.5 4B als PI-Agent: SOTA auf TerminalBench in der 4B-Klasse
Der Reddit-Nutzer /u/Mysterious_Hearing14 hat Qwen3.5 4B auf synthetischen Traces aus Hermes- und PI-Agent-Pipelines finegetunet, mit einem Trainingskontext von 32.000 Tokens. Das resultierende Modell soll laut Autor State-of-the-Art auf TerminalBench in der 4B-Parameterklasse erreichen – und damit rund 10 % der Benchmark-Skala abdecken. Das Modell ist über einen HuggingFace Space als kostenlose Demo abrufbar und kann dort einfache Coding-Aufgaben in einer Sandbox ausführen. Zusätzlich werden ein GGUF-Quantisierungs-Format sowie eine uncensored Variante angeboten. Das Projekt adressiert damit den Bedarf an schlanken, lokal ausführbaren Agenten-Modellen, die für Terminal- und Coding-Tasks optimiert sind.
- Basismodell: Qwen3.5 4B, finegetunet auf Hermes- und PI-Agent-Traces
- Trainingskontext: 32.000 Tokens
- Inference läuft über HuggingFace Serverless, kostenlose Demo verfügbar
- Verfügbare Formate: Standard-HF-Modell, GGUF-Quant, Uncensored-Variante
- Benchmark: SOTA auf TerminalBench in der 4B-Klasse (ca. 10 % der Skala)
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org3w
Terminus-4B: 4B-Modell ersetzt Frontier-LLMs bei Agentic Terminal Tasks
- LAUNCHreddit.com3w
Qwen/WebWorld: Open-Source Web-World-Model-Serie auf Basis von Qwen3
- BENCHMARKreddit.com1w
Qwen3.6-35B-A3B übertrifft Gemini 2.5 Pro auf Terminal-Bench 2.0
- MEINUNGreddit.com3d
Community-Test: Qwen3.6 35B A3B als bestes Modell für lokale Agentic-Nutzung?
Qwen3.5 4B als PI-Agent: SOTA auf TerminalBench in der 4B-Klasse
Der Reddit-Nutzer /u/Mysterious_Hearing14 hat Qwen3.5 4B auf synthetischen Traces aus Hermes- und PI-Agent-Pipelines finegetunet, mit einem Trainingskontext von 32.000 Tokens. Das resultierende Modell soll laut Autor State-of-the-Art auf TerminalBench in der 4B-Parameterklasse erreichen – und damit rund 10 % der Benchmark-Skala abdecken. Das Modell ist über einen HuggingFace Space als kostenlose Demo abrufbar und kann dort einfache Coding-Aufgaben in einer Sandbox ausführen. Zusätzlich werden ein GGUF-Quantisierungs-Format sowie eine uncensored Variante angeboten. Das Projekt adressiert damit den Bedarf an schlanken, lokal ausführbaren Agenten-Modellen, die für Terminal- und Coding-Tasks optimiert sind.
- Basismodell: Qwen3.5 4B, finegetunet auf Hermes- und PI-Agent-Traces
- Trainingskontext: 32.000 Tokens
- Inference läuft über HuggingFace Serverless, kostenlose Demo verfügbar
- Verfügbare Formate: Standard-HF-Modell, GGUF-Quant, Uncensored-Variante
- Benchmark: SOTA auf TerminalBench in der 4B-Klasse (ca. 10 % der Skala)
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org3w
Terminus-4B: 4B-Modell ersetzt Frontier-LLMs bei Agentic Terminal Tasks
- LAUNCHreddit.com3w
Qwen/WebWorld: Open-Source Web-World-Model-Serie auf Basis von Qwen3
- BENCHMARKreddit.com1w
Qwen3.6-35B-A3B übertrifft Gemini 2.5 Pro auf Terminal-Bench 2.0
- MEINUNGreddit.com3d
Community-Test: Qwen3.6 35B A3B als bestes Modell für lokale Agentic-Nutzung?