Daudzvalodu MI pētniecība un izstrāde

Tilde ir nozīmīgākais valodu tehnoloģiju pētniecības centrs Baltijas reģionā ar vairāk nekā 30 gadu pieredzi Eiropas pētniecības projektos un daudzos vietēja mēroga projektos Igaunijā, Latvijā un Lietuvā. Mūsu štata pētnieku komanda sadarbojas ar vadošajiem Eiropas pētniecības centriem, lai virzītos uz aizvien jauniem sasniegumiem tādās valodu tehnoloģiju jomās kā mašīntulkošana, dialoga MI un dialoga sistēmas, runas atpazīšana un sintēze, kā arī fundamentālie valodas modeļi.

Padziļinātas pētniecības kompetences jomas

Mašīntulkošana

Mēs ieviešam jauninājumus nozarei pielāgotā, adaptīvā un terminiem atbilstošā neironu mašīntulkošanā, izstrādājot metodes uzticamai darbībai, sistemātisku kļūdu mazināšanai un lielajiem valodas modeļiem.

Mēs koncentrējamies uz daudzvalodu dabiskās valodas izpratni, semantisko indeksēšanu, izgūšanas papildinātu ģenerēšanu, kuras pamatā ir LVM, un personalizāciju.

Dialoga MI

Mēs pētām kaskadētu un pilnīgu runas atpazīšanu un runas tulkošanu, vairāku runātāju un daudzvalodu runas sintēzi, runas atpazīšanu reāllaikā, automātisko subtitrēšanu un dublēšanu.

Runas tehnoloģijas

Mēs izstrādājam daudzvalodu nosaukto entitāšu atpazīšanu, anonimizāciju un pseidonimizāciju, terminu atpazīšanu un izvilkšanu, morfoloģisko analīzi, lemmatizāciju, vārdšķiru marķēšanu un citus rīkus.

Teksta analīze

Mēs uzturam lielāko terminu datu bāzi Eiropā — EuroTermBank, kā arī izstrādājam terminu pārvaldības un elektronisko vārdnīcu rīkus.

Zināšanu pārvaldība

Pašreizējie pētniecības projekti

Zemes novērošanas vairāku uzdevumu federācijas slānis

Eiropas kosmosa nozare integrē satelītus un zemes sensorus federācijas sistēmā, lai padarītu Zemes novērošanas resursus pieejamus uzņēmumiem un valsts dienestiem. Projekta DOMINO-E mērķis ir nodrošināt Zemes novērošanas pieejamību un reaģētspēju no kosmosa.

European Language Data Space

Izmantojot valodu datu telpu (Language Data Space — LDS), attiecīgās ieinteresētās puses varēs dalīties ar saviem valodu datiem un citiem valodu resursiem, kā arī gūt no tiem peļņu vienotā platformā, pilnībā ņemot vērā ES vērtības un nodrošinot atbilstību ES noteikumiem.

FORTISSIMO PLUS apakšprojekts: lokāli izvietojams uzņēmuma meklēšanas un jautājumu un atbilžu risinājums
Pašreizējās jaunākās atvērtās LLM nepietiekami atbalsta lielāko daļu Eiropas valodu, radot ievērojamas problēmas organizācijām, kas darbojas daudzvalodu vidē. Lai gan šie modeļi uzrāda saprātīgus rezultātus vairākās lielākajās Eiropas valodās, bieži vien tiem trūkst pietiekama pārklājuma un precizitātes daudzām citām valodām, tostarp Austrumeiropas valodām. Šā projekta mērķis ir novērst šo atšķirību, izstrādājot uz vietas izvietojamu AI balstītu uzņēmumu meklēšanas un jautājumu atbildēšanas risinājumu nepietiekami pārstāvētām Eiropas valodām, jo īpaši tām, kas ir Balto slāvu ģimenē. Projekts izveidos drošu, mērogojamu un pielāgojamu AI sistēmu, kas nemanāmi integrēsies organizācijas infrastruktūrā, nodrošinot stabilu datu privātumu un atbilstību stingrām pārvaldības prasībām.

Jaunākās publikācijas

0
0
0

Mūsu pētnieku komanda

Inguna Skadiņa

Dr. sc. comp., zinātniskā vadītāja

Raivis Skadiņš

Dr. sc. comp., pētījumu un izstrādes direktors

Andrejs Vasiļjevs

Dr. sc. comp., līdzdibinātājs, valdes loceklis

Jurgita Kapočiūtė-Dzikienė

Dr. sc. comp, vecākā pētniece

Mārcis Pinnis

Dr. sc. comp., pētniecības vadītājs

Matīss Rikters

Dr. sc. comp., pētnieks

Askars Salimbajevs

Dr. sc. comp., pētnieks

Daiga Deksne

Dr. philol., Mg. sc. comp., Mg. psych., programmatūras arhitekte

Toms_Bergmanis
Toms Bergmanis

Dr., M. inf., pētnieks

Inese Vīra

MA, vadošā lietotāja pieredzes dizainere

Rinalds Vīksna

Mg. sc. comp., pētnieks

Davis_Nicmanis
Dāvis Nicmanis

M. Sc. comp., pētnieks/izstrādātājs

Martins_Kronis
Martins Kronis

M. Sc. comp., pētnieks/izstrādātājs

Ingus_Pretkalnins
Ingus Jānis Pretkalniņš

B. Sc. math, pētnieks/izstrādātājs

Roberts_Rozis
Roberts Rozis

B. Sc. Comp.