Nemotron Super 120B schlägt GPT-OSS und Qwen bei Prompt-Processing im Deep-Context
Warum es zählt
Wer große Codebasen lokal analysiert, profitiert von Nemotrons flachem PP-Abfall bis 400K Token – GPT-OSS 120B und Qwen 3.5 122B fallen früher unter die 100-TPS-Nutzbarkeitsgrenze. Token-Generierung bleibt Nemotrons Schwäche unterhalb 128K Kontext.
— Lumeric Redaktion
llama-bench Prompt Processing (PP) @ ~32K Context, TPS · Spitzenwert
100%
Nemotron Super 120B
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Nemotron Super 120B schlägt GPT-OSS und Qwen bei Prompt-Processing im Deep-Context
Warum es zählt
Wer große Codebasen lokal analysiert, profitiert von Nemotrons flachem PP-Abfall bis 400K Token – GPT-OSS 120B und Qwen 3.5 122B fallen früher unter die 100-TPS-Nutzbarkeitsgrenze. Token-Generierung bleibt Nemotrons Schwäche unterhalb 128K Kontext.
— Lumeric Redaktion
llama-bench Prompt Processing (PP) @ ~32K Context, TPS · Spitzenwert
100%
Nemotron Super 120B
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.