Benchmark
Benchmark for multi-step grounded reasoning with retrieved context.
Kärkitulos 87,6 %
Mediaani 87,6 %
Tuloshaitari 87,6 % - 87,6 %
Tulostaulukko
| Sija | Malli | Tulos | Lähde |
|---|---|---|---|
| #1 | 87,6 % |
Tietoa benchmarkista
- Päivitetty
- 21.3.2026
Benchmark for multi-step grounded reasoning with retrieved context.
| Sija | Malli | Tulos | Lähde |
|---|---|---|---|
| #1 | Grok 4.1 Fast xAI | 87,6 % | xAI · Päivitetty 21.3.2026 |