Benchmark-Yourself: Menschen treten gegen Open-Source-LLMs an
Die unter benchmark-yourself.streamlit.app erreichbare Web-App wurde von Reddit-Nutzer /u/JLeonsarmiento auf r/LocalLLaMA vorgestellt. Sie ermöglicht es, sich in fünf verschiedenen Benchmarks – darunter offenbar BBQ – direkt mit Open-Source-LLMs zu messen und erhält danach einen persönlichen Score. Der Ersteller betont, keine Verbindung zu Streamlit oder oMLX zu haben. Die Ergebnisse sollen laut Post auch auf LinkedIn oder im Lebenslauf geteilt werden können – die Community nutzt den Thread bislang zum kollektiven Ergebnis-Vergleich.
- 5 Benchmarks verfügbar, darunter BBQ (Bias Benchmark for QA)
- Gehostet als Streamlit-App unter benchmark-yourself.streamlit.app
- Scores können ins LinkedIn-Profil oder den Lebenslauf übernommen werden
- Kein kommerzieller Hintergrund laut Autor – keine Verbindung zu Streamlit oder oMLX
- Community auf r/LocalLLaMA nutzt den Thread zum gegenseitigen Score-Vergleich
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
Benchmark-Yourself: Menschen treten gegen Open-Source-LLMs an
Die unter benchmark-yourself.streamlit.app erreichbare Web-App wurde von Reddit-Nutzer /u/JLeonsarmiento auf r/LocalLLaMA vorgestellt. Sie ermöglicht es, sich in fünf verschiedenen Benchmarks – darunter offenbar BBQ – direkt mit Open-Source-LLMs zu messen und erhält danach einen persönlichen Score. Der Ersteller betont, keine Verbindung zu Streamlit oder oMLX zu haben. Die Ergebnisse sollen laut Post auch auf LinkedIn oder im Lebenslauf geteilt werden können – die Community nutzt den Thread bislang zum kollektiven Ergebnis-Vergleich.
- 5 Benchmarks verfügbar, darunter BBQ (Bias Benchmark for QA)
- Gehostet als Streamlit-App unter benchmark-yourself.streamlit.app
- Scores können ins LinkedIn-Profil oder den Lebenslauf übernommen werden
- Kein kommerzieller Hintergrund laut Autor – keine Verbindung zu Streamlit oder oMLX
- Community auf r/LocalLLaMA nutzt den Thread zum gegenseitigen Score-Vergleich
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.