wird geladen
STDR: Visuelles Reward-Learning für robuste RL-Manipulation aus Expert-Videos · Lumeric