Tilde, Läti keeletehnoloogiaettevõte, on kohandanud oma suure keelemudeli TildeOpen LLM tõlkimise jaoks ja integreerinud selle masintõlkeplatvormi, mis pakub usaldusväärseid ja kvaliteetseid tõlkeid 34 Euroopa keelde. Seni kujutas mudel endast eelkõige olulist teadussaavutust tehisintellekti arendamise vallas Euroopa keelte jaoks, kuid seda polnud veel kohandatud igapäevaseks kasutuseks laiemale kasutajaskonnale. Nüüd on see avalikult kättesaadav nii erakasutajate tõlkevajaduste täitmiseks kui ka igapäevatöö tarbeks.
Alates tänasest saab igaüks kasutada tõlkeplatvormi, mis pakub erakordselt kvaliteetset ja turvalist tõlget 34 Euroopa keelde (sh eesti, läti ja leedu keel). Samuti tagab see terminoloogia täpse kasutamise ning loob loomulikumad ja sujuvamad laused, tänu millele väheneb masintõlgitud tekstide järeltoimetamise vajadus.
TildeOpen pakub kvaliteeti, mis suudab konkureerida palju suuremate ülemaailmsete mudelitega, nagu ChatGPT-4.1, kuigi on umbes 60 korda väiksem. Võrdlustestide täpsed tulemused on kättesaadavad suurte keelemudelite edetabelis TildeBench.
Asutused saavad TildeOpeni juurutada asutusesiseselt või Euroopas asuvates pilvkeskkondades, säilitades täieliku kontrolli oma andmete üle. Erinevalt paljudest teistest globaalsetest tehisarulahendustest ei edastata andmeid kunagi Euroopast väljapoole. See on eriti oluline avaliku sektori asutuste ja ettevõtete jaoks, kes tegelevad tundliku sisuga teabega. Samas on võimalik mudelit kohandada konkreetsete vajaduste järgi, et pakkuda eriti täpseid ja usaldusväärseid tõlkeid.
„TildeOpeni integreerimine masintõlkesse on oluline samm selleks, et võimaldada tehisintellekti praktilist kasutamist Euroopa keelte jaoks. Meie eesmärk on tagada mitte ainult kvaliteetse keeletehnoloogia kättesaadavus, vaid ka see, et lahendus oleks igapäevatöös kasutamiseks usaldusväärne,“ ütleb Tilde tegevjuht Artūrs Vasiļevskis.
TildeOpen anti avatud lähtekoodiga alusmudelina Euroopa keelte jaoks välja platvormil Hugging Face 2025. aasta sügisel. See töötati välja Tilde teaduslaboris Euroopa Komisjoni tellimusel. Mudelil on 30 miljardit parameetrit ja seda on treenitud sadade miljardite sõnadega Euroopa keeltes, sh 29 miljardit lätikeelset tekstiüksust. See on suurim teadaolev andmemaht, mida on lätikeelse tehisintellekti arendamisel kasutatud. Mudel töötati välja pärast Euroopa Komisjoni korraldatud konkursi Large AI Grand Challenge võitmist ja selleks kasutati Soomes asuvat superarvutit LUMI.


