Ranskalainen Mistral AI on Euroopan lupaavin tekoäly-yritys, joka tunnetaan Mistral -tekoälymalleistaan. Heidän uusin julkaisunsa, Mistral 3 -malliperhe, koostuu yhdestä huipputason frontier-mallista (Mistral Large 3) ja kolmesta pienemmästä Ministral 3 -mallista (3B, 8B ja 14B).
Mallit on suunniteltu alusta asti monimodaalisiksi ja monikielisiksi: ne ymmärtävät sekä tekstiä että kuvia ja tukevat kymmeniä kieliä eurooppalaisista murteista aasialaisiin suurkieliin. Tärkeää on myös se, että Mistral AI tarjoaa painot avoimen Apache 2.0 -lisenssin alla, mikä antaa kehittäjille ja organisaatioille mahdollisuuden ajaa malleja omassa ympäristössään, muokata niitä ja rakentaa niihin uusia ominaisuuksia vapaasti.
Mikä Mistral 3 on?
Mistral 3:n kruununjalokivi on Mistral Large 3, Granular Mixture‑of‑Experts -arkkitehtuuriin perustuva malli, jolla on yhteensä noin 675 miljardia parametria. Malli on kuitenkin rakennettu siten, että jokaisella tokenilla aktivoituu vain noin 41 miljardia parametria, mikä optimoi laskentatehon ja mahdollistaa suuremman kapasiteetin ilman kohtuutonta kustannusta.
Large 3:n kontekstipituus on 256 000 tokenia, mikä tarkoittaa, että se pystyy käsittelemään satojen sivujen dokumenttikokonaisuuksia yhdellä kertaa. Malli on myös aidosti monimodaalinen: se yhdistää tekstin, koodin ja kuvat samaan kokonaisuuteen ja mahdollistaa laajojen agentti- ja työkalukutsujen käytön suoraan API-rajapinnan kautta.
Ministral 3 -mallit (3B, 8B ja 14B) täydentävät kokonaisuutta. Ne ovat pienempiä ja tiiviimpiä malleja, jotka sopivat paremmin reunalaitteisiin ja yksittäisille GPU:ille. Jokaisesta on saatavilla Base-, Instruct- ja
Reasoning-versiot erilaisiin käyttötarkoituksiin: perusversio soveltuu omien sovellusten pohjaksi, Instruct on valmiiksi ohjattu keskustelumalli ja Reasoning tarjoaa syvempää päättelykykyä esimerkiksi kooditehtäviin ja matemaattisiin ongelmiin. Näissäkin malleissa on 256k tokenin konteksti ja tuki monikielisyydelle sekä kuvalliselle syötteelle, mikä poistaa tarpeen yhdistellä eri työkaluja.
Onko Mistral 3 teknisesti perässä vai mukana kärjessä?
Moni epäili etukäteen, että eurooppalainen malli olisi väistämättä kilpailijoitaan jäljessä. Ensimmäiset testit ja dokumentaation lukemat osoittavat kuitenkin päinvastaista. Parametrimäärä, kontekstipituus ja MoE‑arkkitehtuuri ovat samalla tasolla kuin yhdysvaltalaisten ja kiinalaisten huippumallien, kuten Googlen Gemini-mallien tai OpenAI:n GPT-sarjan.
Se, että Mistral 3 on suunniteltu monimodaaliseksi alusta asti, tekee siitä joustavamman kuin monet mallit, joihin kuvien tuki on liitetty vasta myöhemmissä versioissa. Hugging Face -yhteisössä Large 3 on arvioitu frontier-tason avoimeksi malliksi, joka soveltuu niin agenttikäyttöön kuin laajoihin käännös- ja luokittelutehtäviin.
Erityisen kiinnostavaa on se, että Reasoning-versiona Ministral 3 14B on pärjännyt monissa avoimissa testeissä yhtä hyvin kuin monet paljon suuremmat mallit.
Ensimmäisten käyttäjien raportit kertovat, että Mistral 3 -mallit toimivat luotettavasti useilla kielillä, mukaan lukien suomi, ja osaavat käsitellä kaavioita ja taulukoita kuvista. Tämä viittaa siihen, ettei kyse ole vuosia jälkeen jääneestä teknologiasta vaan aidosta eturintaman kilpailijasta avoimien mallien kentässä.
Missä eurooppalainen tekoäly on silti jäljessä?
Mistral 3 ei kuitenkaan pyyhi pois kaikkia Euroopan heikkouksia tekoälykilvassa. Ensimmäinen haaste liittyy infrastruktuuriin ja laskentatehoon. Yhdysvalloissa ja Kiinassa rakennetaan jatkuvasti valtavia datakeskuksia ja investoidaan miljardeja malleihin. Guardianin mukaan vuonna 2024 Yhdysvalloissa julkaistiin noin 40 merkittävää suurta kielimallia ja Kiinassa 15, kun taas Euroopassa luku jäi kolmeen.
EU on käynnistänyt miljardiluokan ”AI‑gigafactory”-ohjelman kuroakseen kiinni tämän eron, mutta se on vasta alkutekijöissään. Jos malleja ei voi ajaa kotimaisessa ympäristössä, monet eurooppalaiset toimijat joutuvat turvautumaan amerikkalaisiin tai aasialaisiin pilvipalveluihin, mikä heikentää suvereniteettia.
Toinen pullonkaula on rahoitus ja yritysekosysteemi. Start-up-yritykset kuten Mistral AI toimivat murto-osalla siitä pääomasta, jota yhdysvaltalaiset jättiläiset käyttävät. Tämä näkyy esimerkiksi siinä, että tutkimusyhteistyötä tehdään varovaisemmin ja tuotantoon tarjottavat ratkaisut ovat usein kapeampia.
Kolmas haaste on käyttöönotto ja näkyvyys. Eurooppalaiset mallit eivät ole kuluttajamarkkinoilla yhtä tunnettuja kuin ChatGPT tai Gemini. Palvelut tarjotaan usein isompien alustoiden kautta IBM:n, NVIDIAn tai Microsoftin kaltaisina tarjottuina API-paketteina. Tämä voi hidastaa niiden leviämistä ja tekee vaikeaksi kerätä käyttäjäpalautetta nopeasti. Lisäksi avoimien mallien latausmäärissä Kiina on ohittanut sekä Yhdysvallat että Euroopan, mikä kertoo Aasian markkinoiden nopeasta liikkeellelähdöstä.
Missä Eurooppa on yllättävän vahva?
Euroopan vahvuudet liittyvät sääntelyyn, avoimuuteen ja vertikaalisiin käyttötapauksiin. EU:n tietosuoja- ja tekoälysääntely on tiukempaa kuin Yhdysvalloissa tai Kiinassa, mutta se myös pakottaa kehittäjät suunnittelemaan mallinsa luottamusta herättävällä tavalla.
Mistral AI on tehnyt tästä valttikortin: se korostaa painojen avoimuutta, paikallista ajettavuutta ja datan suvereniteettia. Apache 2.0 -lisenssi antaa organisaatioille mahdollisuuden omistaa oman infrastruktuurinsa ja välttää riippuvuuden ulkopuolisista alustoista. Tämä on erityisen tärkeää julkiselle sektorille, rahoitusalalle ja puolustusteknologiaa kehittäville yrityksille, joille tietoturva on ehdoton.
Toinen vahvuus ovat tietyt toimialat, joissa Euroopalla on historiallista osaamista.Teollisuudessa ja logistiikassa eurooppalaiset yritykset hakevat ratkaisuja, joissa tekoäly analysoi koneiden tuottamaa kuva- ja anturidataa ja ehdottaa toimenpiteitä. Nämä sovellukset ovat usein kriittisiä ja vaativat mallien valvottua käyttöä, mikä suosii avoimia ja helposti auditoitavia malleja.
Kuinka paljon Eurooppa siis on perässä?
Yhteenvetona voidaan todeta, että Mistral 3 osoittaa eurooppalaisen tekoälyn olevan kohtuullisella tasolla, mutta silti selkeästi edelleen USA:ta ja Kiinaa perässä. Mallit kilpailevat parametreissa, kontekstissa ja ominaisuuksissa avoimien ja monien suljettujen mallien kanssa. Haasteet
liittyvät enemmän tuotanto- ja käyttöönottoympäristöihin, pääoman saatavuuteen ja globaalin näkyvyyden puutteeseen kuin itse mallien laatuun.
Tulemme hieman myöhemmin arvioimaan, miten Mistralin mallit tarkalleen sijoittuvat kyvykkyytensä puolesta.

