★ Begriff· Safety & Alignment
Red-Teaming
Strukturiertes Testen eines KI-Systems durch eine Adversarial-Group, die Schwachstellen sucht (Jailbreaks, Bias, Misbrauch). Pflicht-Praxis bei Frontier-Lab-Releases.
Verwandte Tools
Auch bekannt als
red teaming · adversarial testing
Aktivität
1
Mentions in den letzten 7 Tagen
4 Wochen
⚡neu · 1×