wird geladen
μP-Methode ermöglicht effizienten Warm-Start beim Upscaling kleiner Sprachmodelle · Lumeric