StepFun veröffentlicht Step 3.7 Flash: 196B MoE lokal auf 128 GB RAM

ToolsGPT Gemini NVIDIA Hardware DeepSeek OpenRouter

Warum es zählt

Das Modell erreicht auf SWE-Bench Pro 56,26% und übertrifft damit DeepSeek V4 Flash – bei deutlich geringerem aktivem Parameteraufwand. Für Teams mit 128-GB-Maschinen ist es eine ernsthafte lokale Option für Agenten- und Coding-Workflows.

— Lumeric Redaktion

Step 3.7 Flash ist das neueste Modell des chinesischen KI-Unternehmens StepFun und positioniert sich in der sogenannten „Flash-Klasse" – also leichtgewichtigen, schnellen Modellen für den praktischen Einsatz. Die MoE-Architektur (Mixture-of-Experts) mit 196B Gesamtparametern aktiviert im Betrieb nur 11B Parameter gleichzeitig, was den lokalen Betrieb auf Maschinen mit 128 GB RAM ermöglicht. Für Bildverarbeitung ist ein dedizierter 1,8B-Parameter-ViT (Vision Transformer) integriert. Auf SWE-Bench Pro erzielt das Modell 56,26% und liegt damit knapp vor DeepSeek V4 Flash (55,6%) und Gemini 3.5 Flash (55,1%). Im DeepSearchQA-Benchmark erreicht es einen F1-Score von 92,82% – nahe an GPT 5.5 (93,98%). Beim HLE-Benchmark mit Tool-Nutzung kommt Step 3.7 Flash auf 47,2%. Wer das Modell nicht selbst hosten möchte, findet es über OpenRouter und NVIDIA NIM.

Was wir noch wissen

MoE-Architektur: 196B Gesamtparameter, davon nur 11B aktiv – minimaler Rechenaufwand zur Inferenzzeit
Integrierter 1,8B-ViT für multimodale Vision-Fähigkeiten direkt im Modell
DeepSearchQA F1: 92,82% – knapp unter GPT 5.5 mit 93,98%
HLE mit Tools: 47,2% – stark für ein Flash-Tier-Modell
Verfügbar auf OpenRouter und NVIDIA NIM für Cloud-Nutzung ohne Self-Hosting

Quelle lesenreddit.com

SWE-Bench Pro · Spitzenwert

56.26%

Step 3.7 Flash

Foundation Modelle Open Source Multimodal

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

StepFun veröffentlicht Step 3.7 Flash: 196B MoE lokal auf 128 GB RAM

ToolsGPT Gemini NVIDIA Hardware DeepSeek OpenRouter

CompaniesDeepSeek NVIDIA

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

MoE-Architektur: 196B Gesamtparameter, davon nur 11B aktiv – minimaler Rechenaufwand zur Inferenzzeit
Integrierter 1,8B-ViT für multimodale Vision-Fähigkeiten direkt im Modell
DeepSearchQA F1: 92,82% – knapp unter GPT 5.5 mit 93,98%
HLE mit Tools: 47,2% – stark für ein Flash-Tier-Modell
Verfügbar auf OpenRouter und NVIDIA NIM für Cloud-Nutzung ohne Self-Hosting

SWE-Bench Pro · Spitzenwert

56.26%

Step 3.7 Flash

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

StepFun veröffentlicht Step 3.7 Flash: 196B MoE lokal auf 128 GB RAM

Frag die KI zum Artikel

Verwandte Beiträge

StepFun veröffentlicht Step 3.7 Flash: 196B MoE lokal auf 128 GB RAM

Frag die KI zum Artikel

Verwandte Beiträge