wird geladen
IsoSci: Benchmark trennt Reasoning von Wissensabruf bei LLMs · Lumeric