Google DeepMindin nykyinen vaativan työn lippulaivamalli pitkään kontekstiin, multimodaaliseen ymmärrykseen ja raskaisiin reasoning-tehtäviin.
Benchmark-tulokset
Julkaistut benchmark-rivit, jotka mallille on saatu varmennettua lähteistä.
| Benchmark | Tulos | Sija | Lahde | Paivitetty |
|---|---|---|---|---|
| Humanity’s Last Exam | 44,40 % | #2 / 30 | Google official | 21.3.2026 |
| GPQA | 94,30 % | #2 / 39 | Google official | 21.3.2026 |
| Swe Bench Verified 2025 | 80,60 % | #2 / 25 | Google official | 21.3.2026 |
| MMMU-Pro | 80,50 % | #3 / 14 | Google official | 21.3.2026 |
| BrowseComp | 85,90 % | #2 / 14 | Google official | 21.3.2026 |
| ARC-AGI-3 | 0,22 % | #3 / 4 | ARC Prize Leaderboard | 25.3.2026 |
| BullshitBench v2 | 37,00 % | #13 / 31 | BullshitBench v2 | 17.3.2026 |
Mallin tiedot
- Yritys
- Google DeepMind
- Kategoria
- Kuva ja ääni
- Malliperhe
- Gemini 3.1
- Julkaistu
- 19.2.2026
- Konteksti
- 1 048 576
- Maksimiulostulo
- 65 536
- Tietokatko
- January 2025
- Syöte
- text, image, video, audio, pdf
- Tuloste
- text
- Input-hinta (USD)
- 2,00 USD / 1M tokenia
- Output-hinta (USD)
- 12,00 USD / 1M tokenia
- Dokumentaatio
- https://deepmind.google/models/gemini/pro/
