wird geladen
AutoMegaKernel kompiliert Llama-Modelle in einen einzigen CUDA-Megakernel · Lumeric