wird geladen
RigorBench: Neuer Benchmark misst Prozessdisziplin in AI-Coding-Agenten · Lumeric