wird geladen
llama.cpp: VRAM-Optimierungstricks für größeren Kontext auf der GPU · Lumeric