Daugiakalbio DI tyrimai ir kūrimas
„Tilde“ yra pagrindinis kalbos technologijų mokslinių tyrimų centras Baltijos regione, jau daugiau nei 30 metų dirbantis Europos mokslinių tyrimų projektuose ir daugybėje vietinių projektų Estijoje, Latvijoje ir Lietuvoje. Mūsų etatinė tyrėjų grupė bendradarbiauja su pagrindiniais Europos mokslinių tyrimų centrais, siekdama tobulinti naujausias kalbos technologijas, pvz., mašininio vertimo, pokalbių DI ir dialogo sistemų, šnekos atpažinimo ir sintezės bei pagrindinių kalbos modelių srityse.
Nuodugnių tyrimų sritys
Kuriame domenui pritaikyto, adaptyvaus ir terminus atpažįstančio mašininio vertimo inovacijas, plėtojame patikimumo, paklaidų koregavimo ir didžiųjų kalbos modelių metodus.
Koncentruojamės į daugiakalbės natūraliosios kalbos supratimą, semantinį indeksavimą, LLM grįstą ir išorine informacija papildytą generavimą bei personalizavimą.
Tiriame pakopinį ir tiesioginį kalbos atpažinimą ir šnekos vertimą, kelių kalbėtojų ir daugiakalbę kalbos sintezę, šnekos atpažinimą realiuoju laiku, automatinį subtitravimą ir dubliavimą.
Kuriame daugiakalbių įvardytų subjektų atpažinimo, anonimizavimo ir pseudonimizavimo, terminų atpažinimo ir rinkimo, morfologinės analizės, lematizacijos, kalbos dalies žymėjimo ir kitus įrankius.
Prižiūrime didžiausią terminų banką visoje Europoje – „EuroTermBank“ ir kuriame terminų tvarkymo bei elektroninių žodynų įrankius.
TildeOpen LLM dabar prieinamas Hugging Face 🎉
Susipažinkite su TildeOpen – mūsų naujuoju atviru pagrindu sukurtu didelių kalbų modeliu, skirtu Europos kalboms.
Palaiko:
Šiuo metu vykdomi tyrimai
Naudodamos Kalbos duomenų erdvę (LDS), atitinkamos suinteresuotosios šalys galės dalytis savo kalbos duomenimis ir kitais kalbos ištekliais, taip pat monetizuoti savo kalbos duomenis ir kalbos išteklius vienoje platformoje, atsižvelgdamos į ES vertybes ir ES taisyklių atitiktį.
Naujausi leidiniai
Rinaldsas Vīksna ir Inguna Skadiņa. 2025. Anonimiškumas: daugiakalbio dokumento pseudonimo įrankis. 15-osios tarptautinės konferencijos dėl pastarojo meto pažangos natūralios kalbos apdorojimo srityje - natūralios kalbos apdorojimo generatyviniame AI trynime, 1327-1332.
Jurgita Kapočiūtė-Dzikienė, Daiga Deksne, Inguna Skadiņa, Raivis Skadiņš ir Askaras Salimbajevas. 2025. Vienakalbė ir daugiakalbė teksto klasifikacija. Taikomųjų programų duomenų mokslas. Kompiuterinės žvalgybos tyrimai, tūris 1206, 55-82, Springer.
Jurgita Kapočiūtė-Dzikienė, Tomas Bergmanis ir Mārcis Pinnis. 2025. AI lokalizavimas: Baltijos valstybių kalbų atvirojo svorio kalbų modelių vertinimas. Bendros 25-osios Šiaurės šalių kompiuterinės lingvistikos konferencijos ir 11-osios Baltijos šalių konferencijos dėl žmogaus kalbos technologijų (NoDaLiDa/Baltic-HLT 2025) posėdžiai, 287-295.
Mūsų tyrimų komanda
Inguna Skadiņa
Raivis Skadiņš
Andrejs Vasiļjevs
Jurgita Kapočiūtė-Dzikienė
Mārcis Pinnis
Matīss Rikters
Daiga Deksne
Tomas Bergmanis
Dr. M.Inf., tyrėjas
Inese Vīra
Rinalds Vīksna
Dāvis Nicmanis
Martinsas Kronis
Ingus Jānis Pretkalniņš