MMLU-Pro

By

maalis 20, 2026
Benchmark

Harder MMLU variant focused on expert-level knowledge and reasoning.

Tulostaulukko

Näytä myös vanhat mallit (4)

Oletuksena mukana ovat vain ajantasaiset julkiset mallit. Avaa halutessasi myös vanhemmat ja poistuvat rivit.

Tähän benchmarkiin ei ole vielä julkaistu validoituja tuloksia.

Tietoa benchmarkista

Päivitetty
21.3.2026

By