Chrome-Extension Dobby macht Gemini Nano ohne GPU direkt nutzbar

Warum es zählt

Wer Gemini Nano für lokale Inferenz nutzen will, braucht damit keine Dev-Tools mehr – ein Ein-Klick-Install reicht. Die 9.216-Token-Sessiongrenze und das RAM-Minimum von 16 GB sind die relevanten Constraints für Integrationsentscheidungen.

— Lumeric Redaktion

Google Chrome lädt Gemini Nano – das Modell bezeichnet sich selbst als Gemma – seit kurzem still im Hintergrund herunter. Die Inferenz läuft vollständig lokal im Browser, ohne Cloud-Anbindung. Der Entwickler /u/Some-Cauliflower4902 hat darauf aufbauend die Chrome-Extension „Dobby" gebaut, um das Modell über eine normale Benutzeroberfläche ansprechen zu können, statt es umständlich über die Browser-DevTools zu bedienen. Voraussetzungen sind lediglich Google Chrome, 16 GB RAM und freier Festplattenspeicher – keine separate Laufzeitumgebung wie llama.cpp oder vLLM notwendig. Der Entwickler schätzt die Inferenzgeschwindigkeit auf seinem Laptop auf rund 20 Token/s ohne GPU; exakte Zahlen liegen nicht vor, da Chrome das Scheduling vollständig übernimmt. Pro Sitzung stehen 9.216 Tokens zur Verfügung, ein von Chrome gesetztes Limit. Die Extension ist im Chrome Web Store als Ein-Klick-Install verfügbar; der Quellcode liegt auf GitHub unter dem Namen „Dobby".

Was wir noch wissen

Modell läuft vollständig lokal in Chrome, keine Cloud-Verbindung erforderlich
Geschätzte Inferenzgeschwindigkeit: ~20 Token/s auf einem Laptop ohne GPU
Session-Limit: 9.216 Tokens, fest von Chrome vorgegeben
Mindestanforderungen: Google Chrome + 16 GB RAM + freier Speicherplatz
Quellcode auf GitHub (herryupmay/Dobby), Ein-Klick-Install im Chrome Web Store verfügbar

Quelle lesenreddit.com

Open Source Inferenz Infra Developer Tooling

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Chrome-Extension Dobby macht Gemini Nano ohne GPU direkt nutzbar

ToolsGemini Llama

CompaniesGoogle DeepMind

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Modell läuft vollständig lokal in Chrome, keine Cloud-Verbindung erforderlich
Geschätzte Inferenzgeschwindigkeit: ~20 Token/s auf einem Laptop ohne GPU
Session-Limit: 9.216 Tokens, fest von Chrome vorgegeben
Mindestanforderungen: Google Chrome + 16 GB RAM + freier Speicherplatz
Quellcode auf GitHub (herryupmay/Dobby), Ein-Klick-Install im Chrome Web Store verfügbar

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Chrome-Extension Dobby macht Gemini Nano ohne GPU direkt nutzbar

Frag die KI zum Artikel

Verwandte Beiträge

Chrome-Extension Dobby macht Gemini Nano ohne GPU direkt nutzbar

Frag die KI zum Artikel

Verwandte Beiträge