MMMU-Pro

By

maalis 20, 2026
Benchmark

Multimodal benchmark for advanced visual and textual reasoning.

Kärkitulos 81,2 %
Mediaani 80,5 %
Tuloshaitari 73,9 % - 81,2 %

Tulostaulukko

Näytä myös vanhat mallit (9)

Oletuksena mukana ovat vain ajantasaiset julkiset mallit. Avaa halutessasi myös vanhemmat ja poistuvat rivit.

SijaMalliTulosLähde
#1
Gemini 3 Flash Google DeepMind
81,2 % Google · Päivitetty 21.3.2026
#2
GPT-5.4 OpenAI
81,2 % OpenAI · Päivitetty 21.3.2026
#3
Gemini 3.1 Pro Google DeepMind
80,5 % Google · Päivitetty 21.3.2026
#474,5 % Anthropic · Päivitetty 21.3.2026
#5
Claude Opus 4.6 Anthropic
73,9 % Anthropic · Päivitetty 21.3.2026

Tietoa benchmarkista

Päivitetty
21.3.2026

By