GPT-5.2 on mallimerkinta, joka on mukana virallisella Scale Labsin SWE-Bench Pro -leaderboardilla. Mallisivu on lisatty benchmark-vertailun kattavuuden vuoksi, jotta benchmarkista voi siirtya myos yksittaiseen malliin ja provideriin.
Edellisen sukupolven frontier GPT-5 -malli ammattilaiskäyttöön, kun tarvitaan vahvaa yleislaatua ja säädettävää päättelyä ilman aivan uusinta 5.4-versiota.
Benchmark-tulokset
Julkaistut benchmark-rivit, jotka mallille on saatu varmennettua lähteistä.
| Benchmark | Tulos | Sija | Lahde | Paivitetty |
|---|---|---|---|---|
| Humanity’s Last Exam | 34,50 % | #7 / 30 | OpenAI official | 21.3.2026 |
| GPQA | 92,40 % | #5 / 39 | OpenAI official | 21.3.2026 |
| Swe Bench Verified 2025 | 80,00 % | #3 / 25 | OpenAI official | 21.3.2026 |
| MMMU-Pro | 79,50 % | #4 / 14 | OpenAI official | 21.3.2026 |
| Toolathlon | 46,30 % | #2 / 5 | OpenAI official | 21.3.2026 |
| BrowseComp | 65,80 % | #5 / 14 | OpenAI official | 21.3.2026 |
| MCP-Atlas | 60,60 % | #3 / 7 | OpenAI official | 21.3.2026 |
| tau2-bench Telecom | 98,70 % | #3 / 8 | OpenAI official | 21.3.2026 |
| OSWorld Verified | 47,30 % | #4 / 5 | OpenAI official | 21.3.2026 |
| ARC-AGI-2 | 52,90 % | #6 / 10 | OpenAI official | 21.3.2026 |
| SWE-Bench Pro (julkinen aineisto) | 29,94 % | #11 / 20 | Scale Labs | 16.1.2026 |
| BullshitBench v2 | 38,00 % | #12 / 31 | BullshitBench v2 | 17.3.2026 |
Mallin tiedot
- Yritys
- OpenAI
- Kategoria
- Kuva ja ääni
- Malliperhe
- GPT-5
- Julkaistu
- 11.12.2025
- Konteksti
- 400 000
- Maksimiulostulo
- 128 000
- Tietokatko
- Aug 31, 2025
- Päättelytasot
- none, low, medium, high, xhigh
- Syöte
- text, image
- Tuloste
- text
- Input-hinta (USD)
- 1,75 USD / 1M tokenia
- Output-hinta (USD)
- 14,00 USD / 1M tokenia
- Dokumentaatio
- https://developers.openai.com/docs/models/gpt-5.2
