Mitmekeelse tehisintellekti alane uurimis- ja arendustegevus
Põhjalikud teadustöö oskusvaldkonnad
Masintõlge
Uuendame domeenile kohandatud, kohanduvat ja terminiteadlikku neurovõrkudel põhinevat masintõlget, töötades välja meetodid vastupidavuseks, eelarvamuste leevendamiseks ja suurte keelemudelite jaoks.
Teisenduslik AI
Keskendume mitmekeelsele loomuliku keele mõistmisele, semantilisele indekseerimisele, LLM-i põhisele otsimisega täiustatud loomisele ja isikupärastamisele.
Kõnetehnoloogiad
Uurime astmelist ja terviklikku kõnetuvastust ning kõnetõlget, mitme kõnelejaga ja mitmekeelset kõnesünteesi, reaalajas kõnetuvastust, automaatset subtiitrimist ning dubleerimist.
Tekstianalüüs
Arendame mitmekeelset nimetusobjekti tuvastamist, anonüümseks muutmist ja pseudonüümimist, terminituvastust ja ekstraktimist, morfoloogilist analüüsi, lemmatiseerimist, kõneosa sildistamist ja muid tööriistu.
Teabehaldus
Säilitame Euroopa suurima termini EuroTermBank ning töötame välja terminihalduse ja elektroonilise sõnastiku vahendid.
TildeOpen LLM toetab nüüd meie masintõlget
Käimasolevad uurimisprojektid
Keskkonna Language Data Space (LDS) kaudu saavad asjaomased huvirühmad ühtse platvormi kaudu oma keeleandmeid ja muid keeleressursse ühiskasutusse anda ning nende pealt teenida, võttes täielikult arvesse EL-i väärtusi ja EL-i eeskirjade järgimist.
Uusimad väljaanded
Rinalds Vīksna ja Inguna Skadiņa. 2025. Anonüümseks muutmine: mitmekeelse dokumendi pseudonüümimise tööriist. 15. rahvusvahelise konverentsi menetlus, mis käsitleb hiljutisi edusamme loodusliku keele töötlemisel – loodusliku keele töötlemine generatiivses tehisintellekti eraes; 1327 –1332.
Jurgita Kapočiūtė-Dzikienė, Daiga Deksne, Inguna Skadiņa, Raivis Skadiņš ja Askars Salimbajevs. 2025. Ühekeelne ja keeleülene tekstiliigitus. Andmeteadus rakendustes. Arvutusliku luure uuringud, vol. 1206, 55-82, Springer.
Jurgita Kapočiūtė-Dzikienė, Toms Bergmanis ja Mārcis Põnnis. 2025. AI lokaliseerimine: Balti riikide keelte avatud kaaluga keelemudelite hindamine. 25. Põhjamaade arvutuslingvistika ühiskonverentsi ja 11. Balti inimkeeletehnoloogiate konverentsi (NoDaLiDa/Baltic-HLT 2025) menetlus; 287 –295.
Meie uurimisrühm
Mārcis Pinnis
Toms Bergmanis
Informaatika doktor, teadur
Martins Kronis
Ingus Jānis Pretkalniņš
Jurgita Kapočiūtė-Dzikienė
Dr SC. komp., arvutuslingvistika spetsialist.
Raivis Skadiņš
Andrejs Vasiļjevs
Inguna Skadiņa
Matīss Rikters
Daiga Deksne
Inese Vīra
Rinalds Vīksna
Dāvis Nicmanis