Sākums - Vai mākslīgā intelekta laikmets apdraud valodas ar nelielu runātāju skaitu?
Vai mākslīgā intelekta laikmets apdraud valodas ar nelielu runātāju skaitu?
Laikā, kad globālā MI izstrāde galvenokārt ir vērsta uz lielām valodām, Baltijas valodu tehnoloģiju uzņēmums Tilde koncentrējas uz pretējo – nodrošināt, ka valodas ar nelielu runātāju skaitu arī ir redzamas, kvalitatīvas un konkurētspējīgas digitālajā laikmetā.
Tilde ir pārliecināta, ka Eiropas valodu dzīvotspēja MI laikmetā nedrīkst būt atkarīga galvenokārt no angļu valodas tehnoloģijas vai ASV un Ķīnas uzņēmumiem. “Mūsu uzmanības centrā ir igauņu, latviešu, lietuviešu un citas Eiropā runātās valodas. Ja mūsu mērķis bija piedāvāt labāku tulkošanas kvalitāti nekā iepriekš Google Translate, šodien mēs varam pārspēt ChatGPT un citus lielus valodu modeļus,” saka uzņēmuma izpilddirektors Igaunijā Kalle Kuusik.
Tildeopen LVM ir fundamentāls modelis, kas īpaši izstrādāts Eiropas valodām
Protams, lielu valodas modeļu attīstība arī nav ignorēta. Tādējādi Tilde ir izveidojusi savu pamatmodeli TildeOpen LVM, kas ir pamatā īpašām lietojumprogrammām, piemēram, mašīntulkošanai un teksta apkopošanai, uzlabojot tulkošanas kvalitāti 34 Eiropas valodās plašākā atbalstīto valodu klāstā.
Visizplatītākajiem ASV modeļiem aptuveni 90 no apmācības datiem ir angļu valodā,% kas nozīmē, ka uz šī pamata izveidotie risinājumi ir izteikti neobjektīvi pret angļu valodu. Piemēram, igauņu valodā tas var izpausties gan ārēji skanošā teikuma struktūrā, gan modeļa izgudrotos vārdos. Tildeopen ir izveidots, pamatojoties uz principu, ka visas 34 valodas ir vienlīdzīgi pārstāvētas.
Tildes spēks ir arī tās zinātniskā kompetence – uzņēmumā strādā vairāk nekā desmit valodu tehnoloģiju eksperti ar doktora grādu. “Mēs esam vienīgais uzņēmums Baltijā, kas izstrādā jaunu lielu valodas modeli no nulles,” saka Kuusik.
Modeļa izstrādi atbalstīja Eiropas Komisija, kas ļāva Somijā izmantot LUMI superdatoru un gandrīz divus miljonus GPU stundu. Modelis tika izveidots pēc uzvaras Eiropas Komisijas lielajā AI Grand Challenge konkursā.
Mašīntulkošana, kas faktiski darbojas
“Vidusmēra lietotājam parasti pietiek ar tādiem vispārējiem modeļiem kā ChatGPT, bet profesionālā vidē to kvalitāte bieži vien ir nepietiekama. Mūsu spēks slēpjas pielāgotos modeļos, kuros tiek ņemta vērā uzņēmuma terminoloģija, specifika un stils. Uzņēmumi var izveidot savu terminoloģijas vārdnīcu vai apmācīt modeli, pamatojoties uz iepriekšējiem tulkojumiem. To visu ir ļoti grūti panākt ar globāliem liela mēroga risinājumiem,” piebilst Kuusiks.
Papildus lingvistiskajai precizitātei svarīga ir arī risinājuma tehniskā kvalitāte. Izmantojot Tildes risinājumu, varat būt drošs, ka tulkojums saglabās Word un PDF dokumentu sākotnējo formatējumu, fontus un izkārtojumu. Šīs ir detaļas, kas bieži tiek zaudētas vai sajauktas, izmantojot vispārīgos modeļus.
Tāda pati loģika attiecas arī uz tiešsaisti. “Mājas lapu automātiskā tulkošana Igaunijā joprojām nav tik izplatīta, bet tā ļauj saglabāt saturu vienā valodā un automātiski piedāvāt apmeklētājam versiju dzimtajā valodā,” skaidro Kuusik. Tas tieši ietekmē uzņēmējdarbību, jo cilvēki vairāk uzticas saturam savā dzimtajā valodā, kas palielina pirkuma veikšanas iespējamību.
«Pat kibernoziedznieki un krāpnieki saprot, ka vēršanās pie cilvēkiem viņu dzimtajā valodā padara krāpšanu veiksmīgāku. Viņu gadījumā, protams, šos soļus nevar piedot.”
Pakalpojumu sniedzēja uzticamība un datu kontrole
Strauji mainīgajā pasaulē arvien svarīgāka kļūst arī datu drošība. “ASV vai Ķīnas pakalpojumu sniedzēju gadījumā uzņēmumiem nav reālas kontroles pār saviem datiem, bet mēs esam šeit – vietējais uzņēmums, kas uzņemas skaidru atbildību par informācijas pārvaldību,” saka Kuusik.
Zināšanas par to, ka informācija nepamet Eiropu, ir īpaši svarīgas publiskajam sektoram un organizācijām, kas strādā ar sensitīvu informāciju. “Risinājums izstrādāts saskaņā ar Eiropas Savienības Mākslīgā intelekta aktu un ir daļa no plašāka mērķa nodrošināt kritisko tehnoloģiju kontroli Eiropā,” piebilst Kuusiks.
Klients var arī instalēt mašīntulkošanas platformu savā IT infrastruktūrā, kurā visi dati ir pilnībā viņa kontrolē. Šo iespēju piedāvā tikai daži pakalpojumu sniedzēji. Lai gan līdz šim dominējošā pieeja bija pārvietot visus pakalpojumus uz mākoni, daudziem klientiem vienīgais pieņemamais risinājums ir viņu pašu IT infrastruktūra.
Eiropas risinājums
“Mūsu mērķis ir piedāvāt risinājumus, kas patiešām darbojas profesionālā vidē un sniedz uzticamus rezultātus. Un, kā jau teicu, tas ir ļoti svarīgi, īpaši valodām ar nelielu runātāju skaitu,” uzsver Kuusik.
Tas dos Eiropas uzņēmumiem un iestādēm reālu alternatīvu globāliem MI risinājumiem: drošiem, pielāgojamiem un jutīgiem pret vietējās valodas niansēm.
Tilde jau vairāk nekā desmit gadus padziļināti strādā ar valodu tehnoloģijām. Mūsdienās uzņēmuma uzmanības centrā ir mašīntulkošana, runas tehnoloģijas (transkripcija un runas sintēze) un mākslīgā intelekta asistenti un virtuālie asistenti.
Raksts sākotnēji tika publicēts aripaev.ee
Vai vēlaties ieviest AI savā organizācijā?
Sazinieties ar mums jau šodien un Uzziniet, kā mūsu risinājumi var uzlabot jūsu darbplūsmu


