Google veröffentlicht DiffusionGemma 26B als Open-Weight-Modell mit 500+ Tokens/s

Warum es zählt

DiffusionGemma kombiniert Open-Weights (Apache 2.0) mit sehr hoher Inferenzgeschwindigkeit (500+ Tokens/s). Für AI-Builder ist es über NVIDIA NIM aktuell kostenlos nutzbar – relevant für latenzkritische Anwendungen.

— Lumeric Redaktion

Quelle lesensimonwillison.net

500+ Tokens/s

Inferenzgeschwindigkeit via NVIDIA NIM API

Foundation Modelle Open Source Inferenz Infra

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

LAUNCH

simonwillison.net· Simon Willison's Weblog3h