wird geladen
PhysTool-Bench: MLLMs scheitern bei physischer Werkzeugnutzung · Lumeric