Latvijos kalbos technologijų bendrovė „Tilde“ pritaikė savo didįjį kalbos modelį „TildeOpen LLM“ vertimo tikslams ir integravo jį į mašininio vertimo platformą, kuri patikimai ir itin kokybiškai verčia į 34 Europos kalbas ir iš jų. Iki šiol šis modelis buvo laikomas reikšmingu moksliniu pasiekimu kuriant dirbtinį intelektą Europos kalboms, bet dar nebuvo pritaikytas kasdienėms platesnės auditorijos reikmėms. Dabar jis prieinamas visuomenei tiek asmeniniais vertimo tikslais, tiek kasdieniam darbui.
Nuo šiandien visi gali naudotis itin kokybiška ir saugia vertimo į 34 Europos kalbas ir iš jų (įskaitant lietuvių, latvių ir estų kalbas) platforma, kuri užtikrina tikslų terminų vartojimą ir natūralesnius, sklandesnius sakinius, todėl sumažėja mašininio vertimo postredagavimo poreikis.
„TildeOpen“ yra 60 kartų mažesnis nei didieji pasauliniai modeliai, tokie kaip „ChatGPT-4.1“, tačiau jo vertimo kokybė yra itin konkurencinga. Detalūs lyginamųjų testų rezultatai pateikiami didžiųjų kalbų modelių reitinge „TildeBench“.
Organizacijos gali diegti „TildeOpen“ vietinėje aplinkoje arba Europoje veikiančioje debesijos infrastruktūroje, taip išlaikydamos visišką savo duomenų kontrolę. Priešingai nei daugelio pasaulinių DI sprendimų, šio modelio duomenys niekada neperduodami už Europos ribų. Tai ypač svarbu viešojo sektoriaus įstaigoms ir įmonėms, tvarkančioms neskelbtiną informaciją. Modelį taip pat galima pritaikyti pagal individualius poreikius, kad vertimas būtų ypač tikslus ir patikimas.
„TildeOpen“ integracija į mašininį vertimą yra reikšmingas žingsnis, leidžiantis praktiškai panaudoti dirbtinį intelektą Europos kalboms. Mūsų tikslas – užtikrinti, kad kokybiškos kalbos technologijos būtų ne tik lengvai prieinamos, bet ir patikimai veiktų kasdieniame darbe“, – sako „Tilde“ generalinis direktorius Artūrs Vasiļevskis.
2025 m. rudenį „TildeOpen“ buvo publikuotas Hugging Face platformoje kaip atvirojo kodo pamatinis Europos kalbų modelis. Jis buvo sukurtas „Tilde“ tyrimų laboratorijoje Europos Komisijos užsakymu. Modelis turi 30 mlrd. parametrų ir buvo mokomas naudojant šimtus milijardų žodžių Europos kalbomis, įskaitant 29 mlrd. latviškų teksto vienetų. Tai yra didžiausias žinomas duomenų kiekis, panaudotas kuriant Latvijos dirbtinį intelektą. Modelis buvo sukurtas laimėjus Europos Komisijos organizuotą konkursą „Large AI Grand Challenge“, naudojant Suomijoje esantį superkompiuterį LUMI.


