Token-Speed-Visualizer macht Inferenzgeschwindigkeit subjektiv erfahrbar
Token-pro-Sekunde-Angaben sind in der Local-LLM-Community allgegenwärtig, aber ihre praktische Bedeutung bleibt für viele abstrakt. Reddit-Nutzer MikeNonect hat deshalb ein schlichtes Browser-Tool unter mikeveerman.github.io/tokenspeed/ veröffentlicht, das beliebige Tokens/s-Werte in Echtzeit simuliert. Nutzer können so direkt erleben, wie sich etwa 10, 21 oder 50 Tokens/s beim Lesen von Text, Code oder Reasoning-Ausgaben anfühlen. Als Beispiel nennt der Post Qwen 3.6-27B mit 21 Tokens/s. Das Tool unterstützt drei Modi: reiner Text, Code sowie Reasoning mit Code. Es richtet sich an alle, die lokale Modelle auf eigener Hardware betreiben und Kaufentscheidungen oder Setup-Optimierungen anhand von Geschwindigkeitsdaten treffen wollen.
- Tool läuft vollständig im Browser, kein Install nötig: mikeveerman.github.io/tokenspeed/
- Drei Simulationsmodi: Text, Code, Reasoning + Code
- Beispielwert im Post: Qwen 3.6-27B bei 21 Tokens/s
- Ziel: objektive Zahlen in subjektiv erfahrbare Geschwindigkeit übersetzen
- Veröffentlicht von Reddit-Nutzer /u/MikeNonect auf r/LocalLLaMA
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Token-Speed-Visualizer macht Inferenzgeschwindigkeit subjektiv erfahrbar
Token-pro-Sekunde-Angaben sind in der Local-LLM-Community allgegenwärtig, aber ihre praktische Bedeutung bleibt für viele abstrakt. Reddit-Nutzer MikeNonect hat deshalb ein schlichtes Browser-Tool unter mikeveerman.github.io/tokenspeed/ veröffentlicht, das beliebige Tokens/s-Werte in Echtzeit simuliert. Nutzer können so direkt erleben, wie sich etwa 10, 21 oder 50 Tokens/s beim Lesen von Text, Code oder Reasoning-Ausgaben anfühlen. Als Beispiel nennt der Post Qwen 3.6-27B mit 21 Tokens/s. Das Tool unterstützt drei Modi: reiner Text, Code sowie Reasoning mit Code. Es richtet sich an alle, die lokale Modelle auf eigener Hardware betreiben und Kaufentscheidungen oder Setup-Optimierungen anhand von Geschwindigkeitsdaten treffen wollen.
- Tool läuft vollständig im Browser, kein Install nötig: mikeveerman.github.io/tokenspeed/
- Drei Simulationsmodi: Text, Code, Reasoning + Code
- Beispielwert im Post: Qwen 3.6-27B bei 21 Tokens/s
- Ziel: objektive Zahlen in subjektiv erfahrbare Geschwindigkeit übersetzen
- Veröffentlicht von Reddit-Nutzer /u/MikeNonect auf r/LocalLLaMA
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.