wird geladen
OckBench: Neuer Benchmark misst Token-Effizienz von LLM-Reasoning · Lumeric