Anthropic on tekoaly-yhtio, jonka Claude-mallit nakyvat usein koodaus- ja reasoning-benchmarkien karjessa. Tama yrityssivu varmistaa, etta SWE-Bench Pro -benchmarkin olennaiset mallit voidaan linkittaa myos provider-tasolle.
Keskeiset mallit nyt
Kuratoitu näkymä tämän hetken keskeisiin ja ajankohtaisiin malleihin.
Claude Opus 4.6
Anthropicin nykyinen raskas Claude-lippulaiva kaikkein vaativimpiin agentti-, tutkimus- ja koodaustehtäviin.
Paras valinta, kun tarvitaan Anthropicin tämän hetken korkein laatu eikä vasteajan tai hinnan tarvitse olla sarjan pienin.
Claude Sonnet 4.6
Anthropicin nykyinen tasapainoinen Claude-malli nopeuden, laadun ja agenttikyvykkyyden yhdistelmään.
Yleinen oletus, kun haetaan Anthropicin ajantasainen tuotantomalli koodaukseen, agenteille ja vaativaan yleiskäyttöön.
Claude Haiku 4.5
Anthropicin nopein nykyinen Claude-malli suurivolyymisiin, matalaviiveisiin ja kustannusherkkiin työnkulkuihin.
Valitse tämä, kun halutaan nykyinen Claude-sarjan nopea ja halvempi tuotantomalli ilman Opus- tai Sonnet-tason hintaa.
Vertaa malleja
Claude Opus 4.6
Anthropicin nykyinen raskas Claude-lippulaiva kaikkein vaativimpiin agentti-, tutkimus- ja koodaustehtäviin.
Paras valinta, kun tarvitaan Anthropicin tämän hetken korkein laatu eikä vasteajan tai hinnan tarvitse olla sarjan pienin.
Claude Sonnet 4.6
Anthropicin nykyinen tasapainoinen Claude-malli nopeuden, laadun ja agenttikyvykkyyden yhdistelmään.
Yleinen oletus, kun haetaan Anthropicin ajantasainen tuotantomalli koodaukseen, agenteille ja vaativaan yleiskäyttöön.
Claude Haiku 4.5
Anthropicin nopein nykyinen Claude-malli suurivolyymisiin, matalaviiveisiin ja kustannusherkkiin työnkulkuihin.
Valitse tämä, kun halutaan nykyinen Claude-sarjan nopea ja halvempi tuotantomalli ilman Opus- tai Sonnet-tason hintaa.
Benchmark-kohokohdat
Nopea näkymä siihen, missä tämän yrityksen julkiset mallit näkyvät varmennetuissa benchmarkeissa.
Swe Bench Verified 2025
BullshitBench v2
MMMLU
Ajankohtaiset mallit
Yleismallit
3- Claude Opus 4.5
Claude Opus 4.5 on virallisella Scale Labsin SWE-Bench Pro -leaderboardilla nakyva mallimerkinta.
Benchmarkit: SWE-Bench Pro (julkinen aineisto) 45,9 % (#1/20)
- Claude Sonnet 4
Claude Sonnet 4 on virallisella Scale Labsin SWE-Bench Pro -leaderboardilla nakyva mallimerkinta.
Benchmarkit: SWE-Bench Pro (julkinen aineisto) 42,7 % (#4/20)
- Claude Sonnet 4.5
Claude Sonnet 4.5 on virallisella Scale Labsin SWE-Bench Pro -leaderboardilla nakyva mallimerkinta.
Benchmarkit: SWE-Bench Pro (julkinen aineisto) 43,6 % (#2/20)


