★ Begriff· Training & Inferenz
RLHF
Reinforcement Learning from Human Feedback — Pretrained-Modell wird mit menschlichen Bewertungen („Antwort A oder B besser?") gepolisht. Macht aus rohem GPT einen ChatGPT. Standardmethode seit 2022.
Verwandte Tools
Auch bekannt als
reinforcement learning from human feedback
Aktivität
10
Mentions in den letzten 7 Tagen
4 Wochen
⚡neu · 10×
Zuletzt erwähnt in
- DenoiseRL: RL-Framework lernt aus fehlerhaften Reasoning-Traces2026-05-28
- Training Strata: Persistente Verhaltensartefakte in LLMs durch Langzeit-Interaktion identifiziert2026-05-28
- Reward Bias Substitution: Einseitige RLHF-Korrekturen verschieben nur den Optimierungsdruck2026-05-28
- AdaDPO: Selbstadaptives DPO mit ausgeglichenen Gradienten-Updates2026-05-28
- 103-Milliarden-Token-Usenet-Korpus (1980–2013) als Trainingsdaten veröffentlicht2026-05-27