wird geladen
GPT-5.4 löst 95 % eines Lean-Verifikations-Benchmarks mit agentengeführter Baumsuche · Lumeric