Anthropic

Byadmin

joulu 5, 2025

Anthropic on tekoaly-yhtio, jonka Claude-mallit nakyvat usein koodaus- ja reasoning-benchmarkien karjessa. Tama yrityssivu varmistaa, etta SWE-Bench Pro -benchmarkin olennaiset mallit voidaan linkittaa myos provider-tasolle.

Keskeiset mallit nyt

Kuratoitu näkymä tämän hetken keskeisiin ja ajankohtaisiin malleihin.

Vertaa malleja

Benchmark-kohokohdat

Nopea näkymä siihen, missä tämän yrityksen julkiset mallit näkyvät varmennetuissa benchmarkeissa.

Ajankohtaiset mallit

Yleismallit

3
  • Claude Opus 4.5

    Claude Opus 4.5 on virallisella Scale Labsin SWE-Bench Pro -leaderboardilla nakyva mallimerkinta.

    Benchmarkit: SWE-Bench Pro (julkinen aineisto) 45,9 % (#1/20)

  • Claude Sonnet 4

    Claude Sonnet 4 on virallisella Scale Labsin SWE-Bench Pro -leaderboardilla nakyva mallimerkinta.

    Benchmarkit: SWE-Bench Pro (julkinen aineisto) 42,7 % (#4/20)

  • Claude Sonnet 4.5

    Claude Sonnet 4.5 on virallisella Scale Labsin SWE-Bench Pro -leaderboardilla nakyva mallimerkinta.

    Benchmarkit: SWE-Bench Pro (julkinen aineisto) 43,6 % (#2/20)