Mitmekeelse tehisintellekti alane uurimis- ja arendustegevus
Tilde on keskne keeletehnoloogia uurimiskeskus Balti regioonis, millel on üle 30 aasta kogemust Euroopa teadusprojektides ning arvukates kohalikes projektides Eestis, Lätis ja Leedus. Meie ettevõttesiseste teadlaste meeskond teeb koostööd juhtivate Euroopa uurimiskeskustega, et edendada tipptasemel keeletehnoloogiaid, nagu masintõlge, vestluse tehisintellekti- ja dialoogisüsteemid, kõnetuvastus ja -süntees ning baaskeelemudelid.
Põhjalikud teadustöö oskusvaldkonnad
Uuendame domeenile kohandatud, kohanduvat ja terminiteadlikku neurovõrkudel põhinevat masintõlget, töötades välja meetodid vastupidavuseks, eelarvamuste leevendamiseks ja suurte keelemudelite jaoks.
Keskendume mitmekeelsele loomuliku keele mõistmisele, semantilisele indekseerimisele, LLM-i põhisele otsimisega täiustatud loomisele ja isikupärastamisele.
Uurime astmelist ja terviklikku kõnetuvastust ning kõnetõlget, mitme kõnelejaga ja mitmekeelset kõnesünteesi, reaalajas kõnetuvastust, automaatset subtiitrimist ning dubleerimist.
Arendame mitmekeelset nimetusobjekti tuvastamist, anonüümseks muutmist ja pseudonüümimist, terminituvastust ja ekstraktimist, morfoloogilist analüüsi, lemmatiseerimist, kõneosa sildistamist ja muid tööriistu.
Me haldame Euroopa suurimat terminipanka EuroTermBank ning arendame terminihalduse ja elektroonilise sõnastiku tööriistu.
TildeOpen LLM on nüüd saadaval Hugging Face’is 🎉
Meet TildeOpen – meie uus avatud lähtekoodiga suur keelemudel Euroopa keelte jaoks.
Toetavad:
Käimasolevad uurimisprojektid
Keskkonna Language Data Space (LDS) kaudu saavad asjaomased huvirühmad ühtse platvormi kaudu oma keeleandmeid ja muid keeleressursse ühiskasutusse anda ning nende pealt teenida, võttes täielikult arvesse EL-i väärtusi ja EL-i eeskirjade järgimist.
Uusimad väljaanded
Rinalds Vīksna ja Inguna Skadiņa. 2025. Anonüümseks muutmine: mitmekeelse dokumendi pseudonüümimise tööriist. 15. rahvusvahelise konverentsi menetlus, mis käsitleb hiljutisi edusamme loodusliku keele töötlemisel – loodusliku keele töötlemine generatiivses tehisintellekti eraes; 1327 –1332.
Jurgita Kapočiūtė-Dzikienė, Daiga Deksne, Inguna Skadiņa, Raivis Skadiņš ja Askars Salimbajevs. 2025. Ühekeelne ja keeleülene tekstiliigitus. Andmeteadus rakendustes. Arvutusliku luure uuringud, vol. 1206, 55-82, Springer.
Jurgita Kapočiūtė-Dzikienė, Toms Bergmanis ja Mārcis Põnnis. 2025. AI lokaliseerimine: Balti riikide keelte avatud kaaluga keelemudelite hindamine. 25. Põhjamaade arvutuslingvistika ühiskonverentsi ja 11. Balti inimkeeletehnoloogiate konverentsi (NoDaLiDa/Baltic-HLT 2025) menetlus; 287 –295.
Meie uurimisrühm
Inguna Skadiņa
Raivis Skadiņš
Andrejs Vasiļjevs
Jurgita Kapočiūtė-Dzikienė
Mārcis Pinnis
Matīss Rikters
Daiga Deksne
Toms Bergmanis
Informaatika doktor, teadur
Inese Vīra
Rinalds Vīksna
Dāvis Nicmanis
Martins Kronis
Ingus Jānis Pretkalniņš