wird geladen
DeFAb: Benchmark zeigt massive Schwächen bei defeasiblem Schlussfolgern in Frontier-Modellen · Lumeric