Vai MI laikmetā pastāv risks, ka varētu izzust valodas ar mazu runātāju skaitu? 

Laikā, kad globālā MI attīstība galvenokārt ir vērsta uz lielajām valodām, Baltijas valodu tehnoloģiju uzņēmums Tilde koncentrējas uz pretējo — to, lai arī valodām ar mazu runātāju skaitu digitālajā laikmetā būtu pieejami redzami, kvalitatīvi un konkurētspējīgi resursi. 

Uzņēmuma Tilde speciālisti ir pārliecināti, ka Eiropas valodu dzīvotspēja MI laikmetā nedrīkst būt atkarīga galvenokārt no angļu valodā izstrādātām tehnoloģijām vai ASV un Ķīnas uzņēmumiem. “Mūsu uzmanības centrā ir igauņu, latviešu, lietuviešu un citas Eiropā lietotās valodas. Ja iepriekš mūsu mērķis bija tulkošanas kvalitātes ziņā pārspēt Google Translate, tad šodien mēs varam konkurēt ar ChatGPT un citiem lielajiem valodas modeļiem,” saka uzņēmuma vadītājs Igaunijā Kalle Kūziks (Kalle Kuusik).

 

TildeOpen LLM ir pamatmodelis, kas īpaši izstrādāts Eiropas valodām

Protams, nav aizmirsta arī lielo valodas modeļu izstrāde. Tādējādi uzņēmums Tilde ir izveidojis savu pamatmodeli TildeOpen LLM, kas tiek izmantots par pamatu dažādām lietojuma iespējām, piemēram, mašīntulkošanai un teksta kopsavilkuma veidošanai, uzlabojot tulkošanas kvalitāti 34 Eiropas valodās plašākā atbalstīto valodu klāstā.

 

Populārākie ASV modeļi apmācībai izmanto datus, no kuriem aptuveni 90% ir angļu valodā. Tas nozīmē, ka šajos modeļos balstītie risinājumi ir ar spēcīgu angļu valodas ietekmi. Piemēram, igauņu valodā tas var izpausties gan kā svešvalodai raksturīga teikumu uzbūve, gan kā modeļa izdomāti jaunvārdi. TildeOpen ir veidots pēc principa, ka visas 34 valodas ir pārstāvētas vienlīdzīgi.

 

Uzņēmuma Tilde spēks ir arī tā zinātniskā kompetence — uzņēmumā strādā vairāk nekā desmit valodu tehnoloģiju speciālistu ar doktora grādu. “Mēs esam vienīgais uzņēmums Baltijā, kas no nulles izstrādājis jaunu lielo valodas modeli,” saka Kūziks.

 

Modeļa izstrādi atbalstīja Eiropas Komisija, kas sniedza iespēju izmantot Somijā esošo LUMI superdatoru un gandrīz divus miljonus GPU stundu. Modelis tika radīts pēc uzvaras Eiropas Komisijas rīkotajā konkursā “Large AI Grand Challenge”.

 

Mašīntulkošana, kas patiešām darbojas

“Vidējam lietotājam parasti pietiek ar vispārēja lietojuma modeļiem, piemēram, ChatGPT, bet profesionālā vidē to kvalitāte bieži vien nav pietiekama. Mūsu stiprā puse ir individuāli pielāgoti modeļi, kas ņem vērā uzņēmumā izmantoto terminoloģiju, valodas lietojuma specifiku un stilu. Uzņēmumi var izveidot savu terminoloģijas vārdnīcu vai apmācīt modeli, balstoties iepriekšējos tulkojumos. To visu ir ļoti grūti panākt ar globāliem liela mēroga risinājumiem,” piebilst Kūziks.

 

Papildus valodas precizitātei svarīga ir arī risinājuma tehniskā kvalitāte. Izmantojot uzņēmuma Tilde risinājumu, tiek garantēts, ka tulkojumā tiks saglabāts Word un PDF dokumentu oriģinālais formatējums, fonti un izkārtojums. Šīs ir nianses, kas bieži tiek zaudētas vai sajauktas, izmantojot vispārēja lietojuma modeļus.

 

Tas pats attiecas arī uz darbu tiešsaistē. “Automātiskā mājaslapu tulkošana Igaunijā vēl joprojām nav īpaši izplatīta, taču tā sniedz iespēju uzturēt saturu vienā valodā un automātiski piedāvāt apmeklētājiem versiju viņu dzimtajā valodā,” skaidro Kūziks. Tam ir tieša ietekme uz uzņēmējdarbību, jo cilvēki vairāk uzticas saturam savā dzimtajā valodā, un tas savukārt palielina pirkuma iespējamību.

 

“Arī kibernoziedznieki un krāpnieki saprot, ka, uzrunājot cilvēkus viņu dzimtajā valodā, krāpniecība izdodas labāk. Šādā gadījumā, protams, šīs darbības nav atbalstāmas.”

 

Pakalpojumu sniedzēja uzticamība un kontrole pār datiem

Strauji mainīgajā pasaulē arvien svarīgāka kļūst arī datu drošība. “ASV vai Ķīnas pakalpojumu sniedzēju gadījumā uzņēmumiem nav reālas kontroles pār saviem datiem, bet mēs esam tepat blakus — vietējais uzņēmums, kas uzņemas skaidru atbildību par informācijas pārvaldību,” saka Kūziks.

 

Pārliecība par to, ka informācija nenonāk ārpus Eiropas robežām, ir īpaši svarīga valsts iestādēm un organizācijām, kas strādā ar sensitīvu informāciju. “Risinājums ir izstrādāts saskaņā ar Eiropas Savienības Mākslīgā intelekta aktu un ir daļa no plašāka mērķa saglabāt kritiskās tehnoloģijas Eiropas pārziņā,” piebilst Kūziks.

 

Klienti var arī uzstādīt mašīntulkošanas platformu savā IT infrastruktūrā, kur visi dati būs pilnībā viņu kontrolē. Lielākā daļa pakalpojumu sniedzēju šādu iespēju nepiedāvā. Līdz šim dominējošā pieeja ir bijusi pārvietot visus pakalpojumus mākonī, taču daudziem klientiem vienīgais pieņemamais risinājums ir lokālā IT infrastruktūra.

 

Eiropas risinājums

“Mūsu mērķis ir piedāvāt risinājumus, kas patiešām darbojas un sniedz uzticamus rezultātus profesionālā vidē. Kā jau minēju, tas ir ārkārtīgi svarīgi. Īpaši valodām ar mazu runātāju skaitu,” uzsver Kūziks.


Eiropas uzņēmumiem un iestādēm tā ir reāla alternatīva globālajiem MI risinājumiem: droša, pielāgojama un tāda, kas izprot vietējās valodas nianses.

Jau vairāk nekā desmit gadus uzņēmums Tilde ar padziļinātu izpratni darbojas valodas tehnoloģiju jomā. Pašlaik uzņēmuma darbības fokuss ir mašīntulkošana, runas tehnoloģijas (transkripcija un runas sintēze), kā arī mākslīgā intelekta asistenti un sarunboti.


Raksts sākotnēji publicēts portālā aripaev.ee

Vai vēlaties ieviest AI savā organizācijā?

Sazinieties ar mums jau šodien un Uzziniet, kā mūsu risinājumi var uzlabot jūsu darbplūsmu