Benchmark
Advanced mathematical reasoning benchmark based on AIME 2024.
Tulostaulukko
Tähän benchmarkiin ei ole vielä julkaistu validoituja tuloksia.
Tietoa benchmarkista
- Päivitetty
- 21.3.2026
Advanced mathematical reasoning benchmark based on AIME 2024.
Oletuksena mukana ovat vain ajantasaiset julkiset mallit. Avaa halutessasi myös vanhemmat ja poistuvat rivit.
Tähän benchmarkiin ei ole vielä julkaistu validoituja tuloksia.