Google veröffentlicht DiffusionGemma 26B als Open-Weight-Modell mit 500+ Tokens/s
Warum es zählt
DiffusionGemma kombiniert Open-Weights (Apache 2.0) mit sehr hoher Inferenzgeschwindigkeit (500+ Tokens/s). Für AI-Builder ist es über NVIDIA NIM aktuell kostenlos nutzbar – relevant für latenzkritische Anwendungen.
— Lumeric Redaktion
500+ Tokens/s
Inferenzgeschwindigkeit via NVIDIA NIM API
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Google veröffentlicht DiffusionGemma 26B als Open-Weight-Modell mit 500+ Tokens/s
Warum es zählt
DiffusionGemma kombiniert Open-Weights (Apache 2.0) mit sehr hoher Inferenzgeschwindigkeit (500+ Tokens/s). Für AI-Builder ist es über NVIDIA NIM aktuell kostenlos nutzbar – relevant für latenzkritische Anwendungen.
— Lumeric Redaktion
500+ Tokens/s
Inferenzgeschwindigkeit via NVIDIA NIM API
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.