★ Begriff· Training & Inferenz
RLAIF
Reinforcement Learning from AI Feedback — Variante von RLHF, bei der ein anderes LLM die Bewertungen liefert statt Menschen. Skaliert günstiger, Anthropic-zentriertes Konzept (Constitutional AI).
Verwandte Tools
Auch bekannt als
reinforcement learning from ai feedback