wird geladen
CoffeeBench: Neuer Benchmark für LLM-Agenten in Multi-Agenten-Wirtschaftssimulationen · Lumeric