wird geladen
vLLM integriert nativen HIP W4A16-Kernel für ROCm-GPUs · Lumeric