Benchmark
Agent benchmark focused on realistic retail support workflows.
Kärkitulos 91,7 %
Mediaani 90,55 %
Tuloshaitari 89,4 % - 91,7 %
Tulostaulukko
| Sija | Malli | Tulos | Lähde |
|---|---|---|---|
| #1 | 91,7 % | ||
| #2 | 89,4 % |
Tietoa benchmarkista
- Päivitetty
- 21.3.2026
Agent benchmark focused on realistic retail support workflows.
| Sija | Malli | Tulos | Lähde |
|---|---|---|---|
| #1 | Claude Sonnet 4.6 Anthropic | 91,7 % | Anthropic · Päivitetty 21.3.2026 |
| #2 | Claude Opus 4.6 Anthropic | 89,4 % | Anthropic · Päivitetty 21.3.2026 |