Nemotron Super 120B schlägt GPT-OSS und Qwen bei Prompt-Processing im Deep-Context

Warum es zählt

Wer große Codebasen lokal analysiert, profitiert von Nemotrons flachem PP-Abfall bis 400K Token – GPT-OSS 120B und Qwen 3.5 122B fallen früher unter die 100-TPS-Nutzbarkeitsgrenze. Token-Generierung bleibt Nemotrons Schwäche unterhalb 128K Kontext.

— Lumeric Redaktion

Quelle lesenreddit.com

llama-bench Prompt Processing (PP) @ ~32K Context, TPS · Spitzenwert

100%

Nemotron Super 120B

Foundation Modelle Inferenz Infra Evals Benchmarks

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Nemotron Super 120B schlägt GPT-OSS und Qwen bei Prompt-Processing im Deep-Context

ToolsGPT Qwen Llama

Warum es zählt

— Lumeric Redaktion

llama-bench Prompt Processing (PP) @ ~32K Context, TPS · Spitzenwert

100%

Nemotron Super 120B

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Nemotron Super 120B schlägt GPT-OSS und Qwen bei Prompt-Processing im Deep-Context

Frag die KI zum Artikel

Verwandte Beiträge

Nemotron Super 120B schlägt GPT-OSS und Qwen bei Prompt-Processing im Deep-Context

Frag die KI zum Artikel

Verwandte Beiträge