Daugiakalbio DI tyrimai ir kūrimas

„Tilde“ yra pagrindinis kalbos technologijų mokslinių tyrimų centras Baltijos regione, jau daugiau nei 30 metų dirbantis Europos mokslinių tyrimų projektuose ir daugybėje vietinių projektų Estijoje, Latvijoje ir Lietuvoje. Mūsų etatinė tyrėjų grupė bendradarbiauja su pagrindiniais Europos mokslinių tyrimų centrais, siekdama tobulinti naujausias kalbos technologijas, pvz., mašininio vertimo, pokalbių DI ir dialogo sistemų, šnekos atpažinimo ir sintezės bei pagrindinių kalbos modelių srityse.

Nuodugnių tyrimų sritys

Mašininis vertimas

Kuriame domenui pritaikyto, adaptyvaus ir terminus atpažįstančio mašininio vertimo inovacijas, plėtojame patikimumo, paklaidų koregavimo ir didžiųjų kalbos modelių metodus.

Koncentruojamės į daugiakalbės natūraliosios kalbos supratimą, semantinį indeksavimą, LLM grįstą ir išorine informacija papildytą generavimą bei personalizavimą.

Pokalbių DI

Tiriame pakopinį ir tiesioginį kalbos atpažinimą ir šnekos vertimą, kelių kalbėtojų ir daugiakalbę kalbos sintezę, šnekos atpažinimą realiuoju laiku, automatinį subtitravimą ir dubliavimą.

Kalbos technologijos

Kuriame daugiakalbių įvardytų subjektų atpažinimo, anonimizavimo ir pseudonimizavimo, terminų atpažinimo ir rinkimo, morfologinės analizės, lematizacijos, kalbos dalies žymėjimo ir kitus įrankius.

Teksto analizė

Prižiūrime didžiausią terminų banką visoje Europoje – „EuroTermBank“ ir kuriame terminų tvarkymo bei elektroninių žodynų įrankius.

Žinių valdymas

Šiuo metu vykdomi tyrimai

Žemės stebėjimo kelių misijų federacijos lygmuo

Europos kosmoso pramonė integruoja palydovus ir antžeminius jutiklius į susiejimo sistemą, kad Žemės stebėjimo priemonės būtų prieinamos įmonėms ir viešosioms paslaugoms. DOMINO-E projektu siekiama užtikrinti Žemės stebėjimo iš kosmoso prieinamumą ir spartą.

Europos kalbos duomenų erdvė

Naudodamos Kalbos duomenų erdvę (LDS), atitinkamos suinteresuotosios šalys galės dalytis savo kalbos duomenimis ir kitais kalbos ištekliais, taip pat monetizuoti savo kalbos duomenis ir kalbos išteklius vienoje platformoje, atsižvelgdamos į ES vertybes ir ES taisyklių atitiktį.

FORTISSIMO PLUS subprojektas: vietoje diegiama įmonės ieška ir klausimų ir atsakymų sprendimas
Dabartinės pažangiausios atviros LLMs nepakankamai remia daugumą Europos kalbų, todėl daugiakalbėje aplinkoje veikiančios organizacijos susiduria su dideliais sunkumais. Nors šie modeliai yra pakankamai veiksmingi kelioms pagrindinėms Europos kalboms, jie dažnai nepakankamai aprėpia daugelį kitų kalbų, įskaitant Rytų Europos kalbas, ir yra nepakankamai tikslūs. Šio projekto tikslas – spręsti šį neatitikimą kuriant vietoje diegiamą AI pagrįstą įmonių paieškos ir atsakymų į klausimus sprendimą nepakankamai atstovaujamoms Europos kalboms, ypač Balto-slavų šeimos kalboms. Projektu bus sukurta saugi, išplečiama ir pritaikoma PG sistema, kuri sklandžiai integruojama į organizacijos infrastruktūrą, užtikrinant patikimą duomenų privatumą ir griežtų valdymo reikalavimų laikymąsi.

Naujausi leidiniai

0
0
0

Mūsų tyrimų komanda

Inguna Skadiņa

Informatikos dr., vyriausioji mokslo pareigūnė

Raivis Skadiņš

Informatikos dr., tyrimų ir plėtros vadovas

Andrejs Vasiļjevs

Informatikos dr., bendraįkūrėjis, valdybos narys

Jurgita Kapočiūtė-Dzikienė

Informatikos dr., vyresnioji tyrėja

Mārcis Pinnis

Informatikos dr., vyriausiasis DI pareigūnas

Matīss Rikters

Informatikos dr., tyrėjas

Askaras Salimbajevas

Informatikos dr., tyrėjas

Daiga Deksne

Filologijos dr., informatikos magistrė, psichologijos magistrė, programinės įrangos architektė

Toms_bergmanis
Tomas Bergmanis

Dr. M.Inf., tyrėjas

Inese Vīra

MA, vyriausioji vartotojų patirties dizainerė

Rinalds Vīksna

Informatikos magistras, tyrėjas

Davis_nicmanis
Dāvis Nicmanis

M. Sc. comp., tyrėjas/kūrėjas

Martinas_kronis
Martinsas Kronis

M. Sc. comp., tyrėjas/kūrėjas

Ingus_pretkalnins
Ingus Jānis Pretkalniņš

B. Sc. Matematika, tyrinėtojas/kūrėjas

Roberts_rozis
Robertsas Rozis

BSC. Komp.