wird geladen
llama.cpp-Fork ermöglicht Überspringen ganzer Transformer-Blöcke zur Laufzeit · Lumeric