wird geladen
llama.cpp Pipeline-Parallelismus verschwendet bis zu 1,5 GB VRAM ohne Speed-Vorteil · Lumeric