Benchmark
GPQA mittaa vaikeaa luonnontieteellistä päättelyä asiantuntijatasoisilla kysymyksillä. Se palkitsee harkintaa, ei pelkkää muistia.
Tieteellinen päättely
Kärkitulos 94,4 %
Mediaani 90,15 %
Tuloshaitari 71,2 % - 94,4 %
Tulostaulukko
| Sija | Malli | Tulos | Lähde |
|---|---|---|---|
| #1 | 94,4 % | ||
| #2 | 94,3 % | ||
| #3 | 92,8 % | ||
| #4 | 91,3 % | ||
| #5 | 90,4 % | ||
| #6 | 89,9 % | ||
| #7 | 87,5 % | ||
| #8 | 86,9 % | ||
| #9 | 82,3 % | ||
| #10 | 71,2 % |
Tietoa benchmarkista
- Mitä tämä mittaa
- Tieteellinen päättely
- Päivitetty
- 21.3.2026
- Linkki
- Avaa lähde
