Chrome-Extension Dobby macht Gemini Nano ohne GPU direkt nutzbar
Google Chrome lädt Gemini Nano – das Modell bezeichnet sich selbst als Gemma – seit kurzem still im Hintergrund herunter. Die Inferenz läuft vollständig lokal im Browser, ohne Cloud-Anbindung. Der Entwickler /u/Some-Cauliflower4902 hat darauf aufbauend die Chrome-Extension „Dobby" gebaut, um das Modell über eine normale Benutzeroberfläche ansprechen zu können, statt es umständlich über die Browser-DevTools zu bedienen. Voraussetzungen sind lediglich Google Chrome, 16 GB RAM und freier Festplattenspeicher – keine separate Laufzeitumgebung wie llama.cpp oder vLLM notwendig. Der Entwickler schätzt die Inferenzgeschwindigkeit auf seinem Laptop auf rund 20 Token/s ohne GPU; exakte Zahlen liegen nicht vor, da Chrome das Scheduling vollständig übernimmt. Pro Sitzung stehen 9.216 Tokens zur Verfügung, ein von Chrome gesetztes Limit. Die Extension ist im Chrome Web Store als Ein-Klick-Install verfügbar; der Quellcode liegt auf GitHub unter dem Namen „Dobby".
- Modell läuft vollständig lokal in Chrome, keine Cloud-Verbindung erforderlich
- Geschätzte Inferenzgeschwindigkeit: ~20 Token/s auf einem Laptop ohne GPU
- Session-Limit: 9.216 Tokens, fest von Chrome vorgegeben
- Mindestanforderungen: Google Chrome + 16 GB RAM + freier Speicherplatz
- Quellcode auf GitHub (herryupmay/Dobby), Ein-Klick-Install im Chrome Web Store verfügbar
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- MEINUNGreddit.com3w
Gemma4 26B läuft flüssig auf CPU-only-System mit 32 GB RAM
- MEINUNGreddit.com2w
Chrome lädt heimlich ~4 GB Gemini Nano herunter – Community sucht GGUF-Version
- BENCHMARKreddit.com1w
Gemma 4 mit LiteRT-LM auf Mobilgeräten: 1,5–2 GB statt 4–5 GB Speicherbedarf
- LAUNCHreddit.com2w
Gemma 4 läuft offline im Browser via WebGPU und steuert Roboter Reachy Mini
Chrome-Extension Dobby macht Gemini Nano ohne GPU direkt nutzbar
Google Chrome lädt Gemini Nano – das Modell bezeichnet sich selbst als Gemma – seit kurzem still im Hintergrund herunter. Die Inferenz läuft vollständig lokal im Browser, ohne Cloud-Anbindung. Der Entwickler /u/Some-Cauliflower4902 hat darauf aufbauend die Chrome-Extension „Dobby" gebaut, um das Modell über eine normale Benutzeroberfläche ansprechen zu können, statt es umständlich über die Browser-DevTools zu bedienen. Voraussetzungen sind lediglich Google Chrome, 16 GB RAM und freier Festplattenspeicher – keine separate Laufzeitumgebung wie llama.cpp oder vLLM notwendig. Der Entwickler schätzt die Inferenzgeschwindigkeit auf seinem Laptop auf rund 20 Token/s ohne GPU; exakte Zahlen liegen nicht vor, da Chrome das Scheduling vollständig übernimmt. Pro Sitzung stehen 9.216 Tokens zur Verfügung, ein von Chrome gesetztes Limit. Die Extension ist im Chrome Web Store als Ein-Klick-Install verfügbar; der Quellcode liegt auf GitHub unter dem Namen „Dobby".
- Modell läuft vollständig lokal in Chrome, keine Cloud-Verbindung erforderlich
- Geschätzte Inferenzgeschwindigkeit: ~20 Token/s auf einem Laptop ohne GPU
- Session-Limit: 9.216 Tokens, fest von Chrome vorgegeben
- Mindestanforderungen: Google Chrome + 16 GB RAM + freier Speicherplatz
- Quellcode auf GitHub (herryupmay/Dobby), Ein-Klick-Install im Chrome Web Store verfügbar
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- MEINUNGreddit.com3w
Gemma4 26B läuft flüssig auf CPU-only-System mit 32 GB RAM
- MEINUNGreddit.com2w
Chrome lädt heimlich ~4 GB Gemini Nano herunter – Community sucht GGUF-Version
- BENCHMARKreddit.com1w
Gemma 4 mit LiteRT-LM auf Mobilgeräten: 1,5–2 GB statt 4–5 GB Speicherbedarf
- LAUNCHreddit.com2w
Gemma 4 läuft offline im Browser via WebGPU und steuert Roboter Reachy Mini