SimpleQA

By

maalis 21, 2026
Benchmark

Short-form factual question-answering benchmark.

Kärkitulos 94 %
Mediaani 94 %
Tuloshaitari 94 % - 94 %

Tulostaulukko

Näytä myös vanhat mallit (1)

Oletuksena mukana ovat vain ajantasaiset julkiset mallit. Avaa halutessasi myös vanhemmat ja poistuvat rivit.

SijaMalliTulosLähde
#1
Grok 4 xAI
94 % xAI · Päivitetty 21.3.2026

Tietoa benchmarkista

Päivitetty
21.3.2026

By