Research-Eval (Reka)

By

maalis 21, 2026
Benchmark

Research-style reasoning and synthesis benchmark.

Kärkitulos 63,9 %
Mediaani 60,95 %
Tuloshaitari 58 % - 63,9 %

Tulostaulukko

Näytä myös vanhat mallit (1)

Oletuksena mukana ovat vain ajantasaiset julkiset mallit. Avaa halutessasi myös vanhemmat ja poistuvat rivit.

SijaMalliTulosLähde
#163,9 % xAI · Päivitetty 21.3.2026
#2
Grok 4 xAI
58 % xAI · Päivitetty 21.3.2026

Tietoa benchmarkista

Päivitetty
21.3.2026

By