wird geladen
llama.cpp WebGPU: bis zu 3,78× schnellerer Prefill für K-Quants · Lumeric