Mitmekeelse tehisintellekti alane uurimis- ja arendustegevus

Tilde on keskne keeletehnoloogia uurimiskeskus Balti regioonis, millel on üle 30 aasta kogemust Euroopa teadusprojektides ning arvukates kohalikes projektides Eestis, Lätis ja Leedus. Meie ettevõttesiseste teadlaste meeskond teeb koostööd juhtivate Euroopa uurimiskeskustega, et edendada tipptasemel keeletehnoloogiaid, nagu masintõlge, vestluse tehisintellekti- ja dialoogisüsteemid, kõnetuvastus ja -süntees ning baaskeelemudelid.

Põhjalikud teadustöö oskusvaldkonnad

Masintõlge

Uuendame domeenile kohandatud, kohanduvat ja terminiteadlikku neurovõrkudel põhinevat masintõlget, töötades välja meetodid vastupidavuseks, eelarvamuste leevendamiseks ja suurte keelemudelite jaoks.

Keskendume mitmekeelsele loomuliku keele mõistmisele, semantilisele indekseerimisele, LLM-i põhisele otsimisega täiustatud loomisele ja isikupärastamisele.

Teisenduslik AI

Uurime astmelist ja terviklikku kõnetuvastust ning kõnetõlget, mitme kõnelejaga ja mitmekeelset kõnesünteesi, reaalajas kõnetuvastust, automaatset subtiitrimist ning dubleerimist.

Kõnetehnoloogiad

Arendame mitmekeelset nimetusobjekti tuvastamist, anonüümseks muutmist ja pseudonüümimist, terminituvastust ja ekstraktimist, morfoloogilist analüüsi, lemmatiseerimist, kõneosa sildistamist ja muid tööriistu.

Tekstianalüüs

Me haldame Euroopa suurimat terminipanka EuroTermBank ning arendame terminihalduse ja elektroonilise sõnastiku tööriistu.

Teabehaldus

TildeOpen LLM on nüüd saadaval Hugging Face’is 🎉

Meet TildeOpen – meie uus avatud lähtekoodiga suur keelemudel Euroopa keelte jaoks.  

Toetavad:

AI-BOOST

Käimasolevad uurimisprojektid

LATDEV
Tehisintellekti keeletehnoloogiad ja nende rakendamise toetamine, et edendada Ukraina integreerumist Euroopa Liitu
Projekt käsitleb Ukraina siseriiklike õigusaktide tõlkimist ja nende vastavusse viimist ELi acquis 'ga. See nõuab täpsust, õiguslikku täpsust ja institutsioonidevahelist kooskõlastamist. Tilde kohandab oma turvalist ja AI-powered tõlkeplatvormi Ukraina õigus - ja haldustekstide jaoks. Platvorm pakub mastaabis kvaliteetseid tõlkeid, vähendab käsitsitööd ja tagab ELi õigusterminite järjepideva kasutamise. Selles on ühendatud masintõlge, tõlkemälu ja terminiportaal, mis on kõik kohandatud Ukraina avaliku sektoriga. Projekti viiakse ellu Läti riigieelarve ja Läti Välisministeeriumi ning Kesk-rahandus - ja Tellimisagentuuri (CFLA) toetusega.
European Language Data Space (Euroopa keele andmeruum)

Keskkonna Language Data Space (LDS) kaudu saavad asjaomased huvirühmad ühtse platvormi kaudu oma keeleandmeid ja muid keeleressursse ühiskasutusse anda ning nende pealt teenida, võttes täielikult arvesse EL-i väärtusi ja EL-i eeskirjade järgimist.

FORTISSIMO PLUS alamprojekt: kohalikult juurutatav ettevõtteotsing ja K & V lahendus
Praegused nüüdisaegsed avatud keeleliidesed ei toeta piisavalt enamikku Euroopa keeli, mis kujutab endast märkimisväärset väljakutset mitmekeelses keskkonnas tegutsevatele organisatsioonidele. Kuigi need mudelid näitavad mõistlikku jõudlust mitme suurema Euroopa keele puhul, puudub neil sageli piisav katvus ja täpsus paljude teiste keelte, sealhulgas Ida-Euroopa keelte jaoks. Selle projekti eesmärk on seda erinevust lahendada, töötades välja kohapeal juurutatava AI-based ettevõtteotsingu - ja küsimustele vastamise lahenduse alaesindatud Euroopa keelte jaoks, eriti Balto-slaavi perekonna keelte jaoks. Projektiga luuakse turvaline, skaleeritav ja kohandatav AI-süsteem, mis integreerub sujuvalt organisatsiooni infrastruktuuriga, tagades andmete tugeva privaatsuse ja vastavuse rangetele juhtimisnõuetele.

Uusimad väljaanded

267

Rinalds Vīksna ja Inguna Skadiņa. 2025. Anonüümseks muutmine: mitmekeelse dokumendi pseudonüümimise tööriist. 15. rahvusvahelise konverentsi menetlus, mis käsitleb hiljutisi edusamme loodusliku keele töötlemisel – loodusliku keele töötlemine generatiivses tehisintellekti eraes; 1327 –1332.

266

Jurgita Kapočiūtė-Dzikienė, Daiga Deksne, Inguna Skadiņa, Raivis Skadiņš ja Askars Salimbajevs. 2025. Ühekeelne ja keeleülene tekstiliigitus. Andmeteadus rakendustes. Arvutusliku luure uuringud, vol. 1206, 55-82, Springer.

265

Jurgita Kapočiūtė-Dzikienė, Toms Bergmanis ja Mārcis Põnnis. 2025. AI lokaliseerimine: Balti riikide keelte avatud kaaluga keelemudelite hindamine. 25. Põhjamaade arvutuslingvistika ühiskonverentsi ja 11. Balti inimkeeletehnoloogiate konverentsi (NoDaLiDa/Baltic-HLT 2025) menetlus; 287 –295.

Meie uurimisrühm

English skadina

Inguna Skadiņa

Arvutiteaduse doktor, teadusdirektor
Raivis-skadinid

Raivis Skadiņš

Dr SC komp., teadus - ja arendustegevuse direktor
Andrejs-Vassiljevs

Andrejs Vasiļjevs

Arvutiteaduse doktor, kaasasutaja, juhatuse liige
jurgita | _ kapotsiute

Jurgita Kapočiūtė-Dzikienė

Arvutiteaduse doktor, kaasasutaja, juhatuse liige
Marcis-Pinnis

Mārcis Pinnis

Arvutiteaduse doktor, tehisintellekti ametniku ülem
Matiss-rikters

Matīss Rikters

Arvutiteaduse doktor, teadur
Daiga dexne

Daiga Deksne

Filoloogia doktor, arvutiteaduse magister, psühholoogia magister, tarkvaraarhitekt
Toms_bergmanis

Toms Bergmanis

Informaatika doktor, teadur

Inese-Vira

Inese Vīra

MA, müügivihje kasutajakogemuse kujundaja
Rinalds-viksna

Rinalds Vīksna

Arvutiteaduse magister, teadur
Davis_nicmanis

Dāvis Nicmanis

M. Sc. comp., teadur/arendaja
Martins_kronis

Martins Kronis

M. Sc. comp., teadur/arendaja
Ingus_pretkalniinid

Ingus Jānis Pretkalniņš

B. Sc. Matemaatika, teadur/arendaja
Roberts_rozis

Roberts Rozis

BSC. Comp.