Daudzvalodu MI pētniecība un izstrāde
Tilde ir nozīmīgākais valodu tehnoloģiju pētniecības centrs Baltijas reģionā ar vairāk nekā 30 gadu pieredzi Eiropas pētniecības projektos un daudzos vietēja mēroga projektos Igaunijā, Latvijā un Lietuvā. Mūsu štata pētnieku komanda sadarbojas ar vadošajiem Eiropas pētniecības centriem, lai virzītos uz aizvien jauniem sasniegumiem tādās valodu tehnoloģiju jomās kā mašīntulkošana, dialoga MI un dialoga sistēmas, runas atpazīšana un sintēze, kā arī fundamentālie valodas modeļi.
Padziļinātas pētniecības kompetences jomas
Mēs ieviešam jauninājumus nozarei pielāgotā, adaptīvā un terminiem atbilstošā neironu mašīntulkošanā, izstrādājot metodes uzticamai darbībai, sistemātisku kļūdu mazināšanai un lielajiem valodas modeļiem.
Mēs koncentrējamies uz daudzvalodu dabiskās valodas izpratni, semantisko indeksēšanu, izgūšanas papildinātu ģenerēšanu, kuras pamatā ir LVM, un personalizāciju.
Mēs pētām kaskadētu un pilnīgu runas atpazīšanu un runas tulkošanu, vairāku runātāju un daudzvalodu runas sintēzi, runas atpazīšanu reāllaikā, automātisko subtitrēšanu un dublēšanu.
Mēs izstrādājam daudzvalodu nosaukto entitāšu atpazīšanu, anonimizāciju un pseidonimizāciju, terminu atpazīšanu un izvilkšanu, morfoloģisko analīzi, lemmatizāciju, vārdšķiru marķēšanu un citus rīkus.
Mēs uzturam lielāko terminu datu bāzi Eiropā — EuroTermBank, kā arī izstrādājam terminu pārvaldības un elektronisko vārdnīcu rīkus.
TildeOpen LLM tagad ir pieejams Hugging Face 🎉
Iepazīstieties ar TildeOpen – mūsu atvērtā pirmkoda, pamata LVM (lielais valodas modeli) Eiropas valodām.
Atbalsta:
Pašreizējie pētniecības projekti
Izmantojot valodu datu telpu (Language Data Space — LDS), attiecīgās ieinteresētās puses varēs dalīties ar saviem valodu datiem un citiem valodu resursiem, kā arī gūt no tiem peļņu vienotā platformā, pilnībā ņemot vērā ES vērtības un nodrošinot atbilstību ES noteikumiem.
Jaunākās publikācijas
Rinalds Vīksna un Inguna Skadiņa. 2025. Anonimizācija: rīks daudzvalodu dokumentu pseidonimizācijai. 15. Starptautiskās konferences par jaunākajiem sasniegumiem dabisko valodu apstrādē - dabisko valodu apstrāde ģeneratīvajā AI erae, 1327-1332.
Jurgita Kapočiūtė-Dzikienė, Daiga Deksne, Inguna Skadiņa, Raivis Skadiņš un Askars Salimbajevs. 2025. Vienvalodas un starpvalodu teksta klasifikācija. Datu zinātne lietojumprogrammās. Datorizlūkošanas pētījumi, vol. 1206, 55-82, Springers.
Jurgita Kapočiūtė-Dzikienė, Toms Bergmanis un Mārcis Pinnis. 2025. Lokalizēšanas AI: atvērto valodu modeļu novērtēšana Baltijas valstu valodām. Apvienotās 25. Ziemeļvalstu konferences par datorlingvistiku un 11. Baltijas konferences par cilvēka valodas tehnoloģijām (NoDaLiDa/Baltic-HLT 2025) sēdes, 287-295.
Mūsu pētnieku komanda
Inguna Skadiņa
Raivis Skadiņš
Andrejs Vasiļjevs
Jurgita Kapočiūtė-Dzikienė
Mārcis Pinnis
Matīss Rikters
Daiga Deksne
Toms Bergmanis
Dr., M. inf., pētnieks
Inese Vīra
Rinalds Vīksna
Dāvis Nicmanis
Martins Kronis
Ingus Jānis Pretkalniņš