Step 3.7 Flash auf zwei Blackwell RTX Pro 6000: Erste Benchmarks und Konfigurationsdaten
Nutzer Signal_Ad657 aus der r/LocalLLaMA-Community hat Step 3.7 Flash auf einem Dual-GPU-System mit zwei NVIDIA Blackwell RTX Pro 6000 in Betrieb genommen. Als Quantisierungsformat kommt NVfp4 zum Einsatz, was auf die neue Blackwell-Architektur zugeschnitten ist. Veröffentlicht wurden erste Konfigurationsdateien sowie frühe Messwerte zur Inferenzgeschwindigkeit (Tokens per Second) für allgemeine Aufgaben. Die vollständigen und erweiterten Benchmark-Ergebnisse stehen noch aus und sollen nachgeliefert werden. Die Konfigurationen und Testergebnisse sind im öffentlichen GitHub-Repository „MMBT-Messy-Model-Bench-Tests" von Light-Heart-Labs unter dem Pfad hardware-tests/step3.7-flash-nvfp4-dual-blackwell-2026-05-28 abrufbar. Der Beitrag ist ein früher Community-Bericht ohne redaktionelle Prüfung, bietet aber konkrete Hardware-Referenzkonfigurationen für Nutzer, die ähnliche Setups planen.
- Modell: Step 3.7 Flash, Quantisierungsformat NVfp4 – optimiert für Blackwell-Architektur.
- Hardware: Zwei NVIDIA Blackwell RTX Pro 6000 GPUs im Dual-Betrieb.
- Erste Messgröße: Tokens per Second bei allgemeiner Inferenz – konkrete Werte folgen mit Extended-Bench.
- Konfigurationsdaten und Rohdaten im GitHub-Repo Light-Heart-Labs/MMBT-Messy-Model-Bench-Tests veröffentlicht.
- Erweiterter Benchmarklauf läuft noch; Follow-up-Post vom Autor angekündigt.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Step 3.7 Flash auf zwei Blackwell RTX Pro 6000: Erste Benchmarks und Konfigurationsdaten
Nutzer Signal_Ad657 aus der r/LocalLLaMA-Community hat Step 3.7 Flash auf einem Dual-GPU-System mit zwei NVIDIA Blackwell RTX Pro 6000 in Betrieb genommen. Als Quantisierungsformat kommt NVfp4 zum Einsatz, was auf die neue Blackwell-Architektur zugeschnitten ist. Veröffentlicht wurden erste Konfigurationsdateien sowie frühe Messwerte zur Inferenzgeschwindigkeit (Tokens per Second) für allgemeine Aufgaben. Die vollständigen und erweiterten Benchmark-Ergebnisse stehen noch aus und sollen nachgeliefert werden. Die Konfigurationen und Testergebnisse sind im öffentlichen GitHub-Repository „MMBT-Messy-Model-Bench-Tests" von Light-Heart-Labs unter dem Pfad hardware-tests/step3.7-flash-nvfp4-dual-blackwell-2026-05-28 abrufbar. Der Beitrag ist ein früher Community-Bericht ohne redaktionelle Prüfung, bietet aber konkrete Hardware-Referenzkonfigurationen für Nutzer, die ähnliche Setups planen.
- Modell: Step 3.7 Flash, Quantisierungsformat NVfp4 – optimiert für Blackwell-Architektur.
- Hardware: Zwei NVIDIA Blackwell RTX Pro 6000 GPUs im Dual-Betrieb.
- Erste Messgröße: Tokens per Second bei allgemeiner Inferenz – konkrete Werte folgen mit Extended-Bench.
- Konfigurationsdaten und Rohdaten im GitHub-Repo Light-Heart-Labs/MMBT-Messy-Model-Bench-Tests veröffentlicht.
- Erweiterter Benchmarklauf läuft noch; Follow-up-Post vom Autor angekündigt.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.