wird geladen
Knowledge Distillation von DeepSeek-R1 auf Qwen2.5-7B verbessert Mathe-Reasoning · Lumeric