Jetson Orin NX mit Gemma 4 26B: 14,65 tok/s bei 66K Kontext

Warum es zählt

Zeigt, dass MoE-Modelle wie Gemma 4 26B auch auf Edge-Hardware mit 40W brauchbare Inferenzgeschwindigkeit und langen Kontext für Agenten-Workloads liefern können – relevant für lokale, stromsparende Agent-Deployments.

— Lumeric Redaktion

Quelle lesenreddit.com

14,65 tok/s

Token-Generierung bei ~8K Kontext auf Jetson Orin NX

Agents Inferenz Infra Open Source

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Jetson Orin NX mit Gemma 4 26B: 14,65 tok/s bei 66K Kontext

ToolsQwen Llama

Warum es zählt

— Lumeric Redaktion

14,65 tok/s

Token-Generierung bei ~8K Kontext auf Jetson Orin NX

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Jetson Orin NX mit Gemma 4 26B: 14,65 tok/s bei 66K Kontext

Frag die KI zum Artikel

Verwandte Beiträge

Jetson Orin NX mit Gemma 4 26B: 14,65 tok/s bei 66K Kontext

Frag die KI zum Artikel

Verwandte Beiträge