wird geladen
SafeClawBench: Neuer Benchmark trennt Schadensebenen bei Tool-nutzenden LLM-Agenten · Lumeric