wird geladen
Asynchrones Pipeline Parallelism für LLM-Training mit Muon-Optimizer stabilisiert · Lumeric