wird geladen
RTX 5090 mit Qwen3.5-4B: Nutzer meldet Deckelung bei 250 Token/s in llama.cpp · Lumeric