wird geladen
RLHF für Audio-Captioning: Präferenzalignment ohne Ground-Truth-Daten · Lumeric