★ Begriff· Evaluation
MMLU
Massive Multitask Language Understanding — 57 Wissensgebiete (Mathe, Recht, Medizin, Geschichte). Lange der Standard-Benchmark für „Allgemeinwissen", inzwischen von Top-Models auf >90% saturated.
Verwandte Tools
Auch bekannt als
massive multitask language understanding
Aktivität
5
Mentions in den letzten 7 Tagen
4 Wochen
⚡neu · 5×
Zuletzt erwähnt in
- Neural Interaction Law: Tiefe-Breite-Verhältnis bestimmt Generalisierungseffizienz von LLMs2026-05-28
- TCP-MCP: Co-Evolution von Prompts und Kommunikationstopologien für Multi-Agenten-Systeme2026-05-28
- MARI: Energiebasiertes Multi-Adapter-Framework für LLM-Alignment ohne Gewichtsänderung2026-05-28
- ARBITER verbessert Majority-Vote-Genauigkeit bei Test-Time-Sampling2026-05-27
- Max-Window DTS-Strategie ermöglicht nahezu verlustfreies HiF8 W8A8 QAT für OpenPangu-Embedded-1B2026-05-27