★ Begriff· Evaluation
Eval-Harness
Standardisiertes Test-Framework, in dem ein Modell gegen viele Benchmarks gleichzeitig läuft. Bekannt: lm-evaluation-harness von EleutherAI. Open-Source-Modelle werden so vergleichbar gemacht.
Verwandte Tools
Auch bekannt als
eval harness · evaluation harness · lm-evaluation-harness
Aktivität
1
Mentions in den letzten 7 Tagen
4 Wochen
⚡neu · 1×