ARC-AGI-2

By

maalis 20, 2026
Benchmark

Abstraction and reasoning benchmark for novel visual problems.

Kärkitulos 83,3 %
Mediaani 68,8 %
Tuloshaitari 15,9 % - 83,3 %

Tulostaulukko

Näytä myös vanhat mallit (5)

Oletuksena mukana ovat vain ajantasaiset julkiset mallit. Avaa halutessasi myös vanhemmat ja poistuvat rivit.

SijaMalliTulosLähde
#1
GPT-5.4 pro OpenAI
83,3 % OpenAI · Päivitetty 21.3.2026
#2
GPT-5.4 OpenAI
73,3 % OpenAI · Päivitetty 21.3.2026
#3
Claude Opus 4.6 Anthropic
68,8 % Anthropic · Päivitetty 21.3.2026
#458,3 % Anthropic · Päivitetty 21.3.2026
#5
Grok 4 xAI
15,9 % xAI · Päivitetty 21.3.2026

Tietoa benchmarkista

Päivitetty
21.3.2026

By