Latvijas valodu tehnoloģiju uzņēmums “Tilde” ir pielāgojis savu lielo valodas modeli TildeOpen LLM tulkošanai un integrējis to mašīntulkošanas platformā, kas nodrošinās kvalitatīvus un uzticamus tulkojumus 34 Eiropas valodām. Līdz šim modelis galvenokārt bija nozīmīgs zinātnisks sasniegums Eiropas valodu mākslīgā intelekta attīstībā, taču vēl nebija pielāgots ikdienas lietošanai plašākai auditorijai. Tagad tas ir publiski pieejams lietotājiem gan privātām tulkošanas vajadzībām, gan ikdienas darbam.
No šodienas ikviens var izmantot tulkošanas platformu, kas nodrošina īpaši kvalitatīvu un drošu tulkošanu 34 Eiropas valodās, tostarp arī latviešu, lietuviešu un igauņu, un paredz akurātu terminoloģijas lietojumu un dabiskākus, plūstošus teikumus, samazinot nepieciešamību mašīntulkotos tekstus labot.
TildeOpen kvalitātes ziņā spēj konkurēt ar daudz lielākiem globāliem modeļiem, piemēram, ChatGPT-4.1, lai gan ir aptuveni 60 reižu mazāks. Detalizēti salīdzinošo testu rezultāti ir pieejami lielo valodas modeļu ranžējumā TildeBench.
Organizācijas var izvietot TildeOpen savā infrastruktūrā vai Eiropas mākoņos, tādējādi saglabājot pilnīgu kontroli pār saviem datiem. Atšķirībā no daudziem globālajiem mākslīgā intelekta risinājumiem dati netiek nodoti ārpus Eiropas. Tas ir īpaši svarīgi valsts iestādēm un uzņēmumiem, kas strādā ar sensitīvu informāciju. Vienlaikus pastāv iespēja pielāgot modeli konkrētām vajadzībām, tādējādi nodrošinot īpaši precīzus un uzticamus tulkojumus.
“TildeOpen integrācija mašīntulkošanā ir nozīmīgs solis Eiropas valodu mākslīgā intelekta praktiskā lietošanā. Mūsu mērķis ir nodrošināt, lai augstas kvalitātes valodu tehnoloģijas būtu ne tikai pieejamas, bet arī uzticamas ikdienas darbā,” norāda “Tildes” vadītājs Artūrs Vasiļevskis.
TildeOpen 2025. gada rudenī platformā Hugging Face tika publicēts kā atvērtā koda pamatmodelis Eiropas valodām. Tas tika izstrādāts “Tildes” pētniecības laboratorijā Eiropas Komisijas uzdevumā. Modelim ir 30 miljardi parametru, un tas ir apmācīts ar simtiem miljardu vārdu no Eiropas valodām, tostarp 29 miljardiem latviešu valodas tekstvienību. Šis ir lielākais zināmais datu apjoms, kas izmantots latviešu valodas mākslīgā intelekta izstrādē. Modelis tika izstrādāts pēc uzvaras Eiropas Komisijas konkursā “Large AI Grand Challenge”, izmantojot superdatoru LUMI Somijā.


