wird geladen
SOOHAK-Benchmark: KI-Modelle scheitern daran, unlösbare Matheaufgaben zu erkennen · Lumeric