AIME 2024

By

maalis 20, 2026
Benchmark

Advanced mathematical reasoning benchmark based on AIME 2024.

Tulostaulukko

Näytä myös vanhat mallit (15)

Oletuksena mukana ovat vain ajantasaiset julkiset mallit. Avaa halutessasi myös vanhemmat ja poistuvat rivit.

Tähän benchmarkiin ei ole vielä julkaistu validoituja tuloksia.

Tietoa benchmarkista

Päivitetty
21.3.2026

By