Benchmark
Harder MMLU variant focused on expert-level knowledge and reasoning.
Tulostaulukko
Tähän benchmarkiin ei ole vielä julkaistu validoituja tuloksia.
Tietoa benchmarkista
- Päivitetty
- 21.3.2026
Harder MMLU variant focused on expert-level knowledge and reasoning.
Oletuksena mukana ovat vain ajantasaiset julkiset mallit. Avaa halutessasi myös vanhemmat ja poistuvat rivit.
Tähän benchmarkiin ei ole vielä julkaistu validoituja tuloksia.