Benchmark
Humanity's Last Exam mittaa laaja-alaista huipputason päättelyä matematiikasta humanistisiin aloihin. Se on tarkoituksella vaikea, joten erot mallien välillä näkyvät siinä tavallista selvemmin.
Laaja-alainen huipputason päättely
Kärkitulos 48,4 %
Mediaani 36,75 %
Tuloshaitari 8,7 % - 48,4 %
Tulostaulukko
| Sija | Malli | Tulos | Lähde |
|---|---|---|---|
| #1 | 48,4 % | ||
| #2 | 44,4 % | ||
| #3 | 42,7 % | ||
| #4 | 40 % | ||
| #5 | 39,8 % | ||
| #6 | 33,7 % | ||
| #7 | 33,2 % | ||
| #8 | 25,4 % | ||
| #9 | 16,7 % | ||
| #10 | 8,7 % |
Tietoa benchmarkista
- Mitä tämä mittaa
- Laaja-alainen huipputason päättely
- Päivitetty
- 21.3.2026
