wird geladen
Quantisierung verlängert Reasoning-Ketten: Versteckter Compute-Overhead bei Low-Bit-Modellen · Lumeric