Daudzvalodu MI pētniecība un izstrāde
Padziļinātas pētniecības kompetences jomas
Mašīntulkošana
Mēs ieviešam jauninājumus nozarei pielāgotā, adaptīvā un terminiem atbilstošā neironu mašīntulkošanā, izstrādājot metodes uzticamai darbībai, sistemātisku kļūdu mazināšanai un lielajiem valodas modeļiem.
Dialoga MI
Mēs koncentrējamies uz daudzvalodu dabiskās valodas izpratni, semantisko indeksēšanu, izgūšanas papildinātu ģenerēšanu, kuras pamatā ir LVM, un personalizāciju.
Runas tehnoloģijas
Mēs pētām kaskadētu un pilnīgu runas atpazīšanu un runas tulkošanu, vairāku runātāju un daudzvalodu runas sintēzi, runas atpazīšanu reāllaikā, automātisko subtitrēšanu un dublēšanu.
Teksta analīze
Mēs izstrādājam daudzvalodu nosaukto entitāšu atpazīšanu, anonimizāciju un pseidonimizāciju, terminu atpazīšanu un izvilkšanu, morfoloģisko analīzi, lemmatizāciju, vārdšķiru marķēšanu un citus rīkus.
Zināšanu pārvaldība
Mēs uzturam lielāko termbanku Eiropā - EuroTermBank, kā arī izstrādājam terminu pārvaldības un elektroniskās vārdnīcas rīkus.
Mūsu mašīntulkošanu tagad nodrošina TildeOpen LLM
Pašreizējie pētniecības projekti
Izmantojot valodu datu telpu (Language Data Space — LDS), attiecīgās ieinteresētās puses varēs dalīties ar saviem valodu datiem un citiem valodu resursiem, kā arī gūt no tiem peļņu vienotā platformā, pilnībā ņemot vērā ES vērtības un nodrošinot atbilstību ES noteikumiem.
Jaunākās publikācijas
Rinalds Vīksna un Inguna Skadiņa. 2025. Anonimizācija: rīks daudzvalodu dokumentu pseidonimizācijai. 15. Starptautiskās konferences par jaunākajiem sasniegumiem dabisko valodu apstrādē - dabisko valodu apstrāde ģeneratīvajā AI erae, 1327-1332.
Jurgita Kapočiūtė-Dzikienė, Daiga Deksne, Inguna Skadiņa, Raivis Skadiņš un Askars Salimbajevs. 2025. Vienvalodas un starpvalodu teksta klasifikācija. Datu zinātne lietojumprogrammās. Datorizlūkošanas pētījumi, vol. 1206, 55-82, Springers.
Jurgita Kapočiūtė-Dzikienė, Toms Bergmanis un Mārcis Pinnis. 2025. Lokalizēšanas AI: atvērto valodu modeļu novērtēšana Baltijas valstu valodām. Apvienotās 25. Ziemeļvalstu konferences par datorlingvistiku un 11. Baltijas konferences par cilvēka valodas tehnoloģijām (NoDaLiDa/Baltic-HLT 2025) sēdes, 287-295.
Mūsu pētnieku komanda
Mārcis Pinnis
Toms Bergmanis
Dr., M. inf., pētnieks
Martins Kronis
Ingus Jānis Pretkalniņš
Jurgita Kapočiūtė-Dzikienė
Dr. SC. COMP., skaitļošanas lingvistikas speciālists.
Raivis Skadiņš
Andrejs Vasiļjevs
Inguna Skadiņa
Matīss Rikters
Daiga Deksne
Inese Vīra
Rinalds Vīksna
Dāvis Nicmanis