wird geladen
LLM-Physik-Benchmark: Claude, GPT-5.5 und Gemini scheitern in fiktiven Physikwelten · Lumeric