wird geladen
Xiaomi behauptet 1.000+ Token/s auf 1-Billion-Parameter-MoE mit 8 GPUs · Lumeric