StepFun veröffentlicht Step 3.7 Flash: 196B MoE lokal auf 128 GB RAM
Step 3.7 Flash ist das neueste Modell des chinesischen KI-Unternehmens StepFun und positioniert sich in der sogenannten „Flash-Klasse" – also leichtgewichtigen, schnellen Modellen für den praktischen Einsatz. Die MoE-Architektur (Mixture-of-Experts) mit 196B Gesamtparametern aktiviert im Betrieb nur 11B Parameter gleichzeitig, was den lokalen Betrieb auf Maschinen mit 128 GB RAM ermöglicht. Für Bildverarbeitung ist ein dedizierter 1,8B-Parameter-ViT (Vision Transformer) integriert. Auf SWE-Bench Pro erzielt das Modell 56,26% und liegt damit knapp vor DeepSeek V4 Flash (55,6%) und Gemini 3.5 Flash (55,1%). Im DeepSearchQA-Benchmark erreicht es einen F1-Score von 92,82% – nahe an GPT 5.5 (93,98%). Beim HLE-Benchmark mit Tool-Nutzung kommt Step 3.7 Flash auf 47,2%. Wer das Modell nicht selbst hosten möchte, findet es über OpenRouter und NVIDIA NIM.
- MoE-Architektur: 196B Gesamtparameter, davon nur 11B aktiv – minimaler Rechenaufwand zur Inferenzzeit
- Integrierter 1,8B-ViT für multimodale Vision-Fähigkeiten direkt im Modell
- DeepSearchQA F1: 92,82% – knapp unter GPT 5.5 mit 93,98%
- HLE mit Tools: 47,2% – stark für ein Flash-Tier-Modell
- Verfügbar auf OpenRouter und NVIDIA NIM für Cloud-Nutzung ohne Self-Hosting
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
StepFun veröffentlicht Step 3.7 Flash: 196B MoE lokal auf 128 GB RAM
Step 3.7 Flash ist das neueste Modell des chinesischen KI-Unternehmens StepFun und positioniert sich in der sogenannten „Flash-Klasse" – also leichtgewichtigen, schnellen Modellen für den praktischen Einsatz. Die MoE-Architektur (Mixture-of-Experts) mit 196B Gesamtparametern aktiviert im Betrieb nur 11B Parameter gleichzeitig, was den lokalen Betrieb auf Maschinen mit 128 GB RAM ermöglicht. Für Bildverarbeitung ist ein dedizierter 1,8B-Parameter-ViT (Vision Transformer) integriert. Auf SWE-Bench Pro erzielt das Modell 56,26% und liegt damit knapp vor DeepSeek V4 Flash (55,6%) und Gemini 3.5 Flash (55,1%). Im DeepSearchQA-Benchmark erreicht es einen F1-Score von 92,82% – nahe an GPT 5.5 (93,98%). Beim HLE-Benchmark mit Tool-Nutzung kommt Step 3.7 Flash auf 47,2%. Wer das Modell nicht selbst hosten möchte, findet es über OpenRouter und NVIDIA NIM.
- MoE-Architektur: 196B Gesamtparameter, davon nur 11B aktiv – minimaler Rechenaufwand zur Inferenzzeit
- Integrierter 1,8B-ViT für multimodale Vision-Fähigkeiten direkt im Modell
- DeepSearchQA F1: 92,82% – knapp unter GPT 5.5 mit 93,98%
- HLE mit Tools: 47,2% – stark für ein Flash-Tier-Modell
- Verfügbar auf OpenRouter und NVIDIA NIM für Cloud-Nutzung ohne Self-Hosting
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.