wird geladen
MACCO verbessert kompositionelles Verstehen in Vision-Language-Modellen · Lumeric