wird geladen
MTP auf vLLM und llama.cpp: 3,34× schnellere Inferenz für Gemma 4 und Qwen 3.6 · Lumeric