wird geladen
BuilderBench: Neuer Benchmark testet Explorationsfähigkeiten von KI-Agenten · Lumeric