wird geladen
LLM-basierte Schwachstellenerkennung: GRPO-RL übertrifft SFT und Preference-Optimierung · Lumeric