Eesti keele Instituut ning Eesti Haridus - ja Teadusministeerium on algatanud seni suurima keeletehnoloogia arendusprojekti, mille tulemusena alustasid Tilde ja Tartu Ülikooli arvutiteaduse Instituut tööd usaldusväärse avatud lähtekoodiga masintõlkeplatvormi kallal kolmele keelepaarile: Eesti-inglise-Eesti, Eesti-vene-Eesti ja Eesti-saksa-Eesti.
Projekti käigus töötatakse välja kvaliteetne masintõlkeplatvorm üldistele veebi - ja uudistekstidele, kriisiinfole, õigus - ja militaartekstidele, mida saavad kasutada avalikud institutsioonid, tõlkebürood, vabakutseliste tõlkijad, samuti IT ja tehisintellekti valdkonna ettevõtete arendajad.
Tartu Ülikooli loodusliku keeletöötluse professori Mark Fišel sõnul on projekti eesmärk teha enamat kui lihtsalt olemasolevaid masintõlkemootoreid edasi arendada. Projektipartnerid testivad uusi tipptasemel lähenemisviise, et edendada masintõlke olukorda Eestis ja muuta see praktiliselt kasulikuks väga erinevatele lõppkasutajatele.
“Proovime erinevaid lähenemisi domeenispetsiifilisele masintõlkele, testime uhiuusi meetodeid nagu modulaartrafo tüüpi närvivõrgud, integreerime närvimasintõlke sõnastike ja leksikonidega ning töötame välja lahendused nii teksti - kui ka kõnetõlkeks, ”
selgitas Fišel. Samuti rõhutas ta, et uute mudelite koolitamine ei ole võimalik ilma Tartu Ülikooli kõrgjõudlusega arvutuskeskuseta, mis toetab kogu projekti vältel nii ülikooli kui ka Tilde keeletehnolooge.
Tilde Eesti tegevdirektor Pekka Myllylä ütleb, et Eesti masintõlke kvaliteet on teinud läbimurde ja seda saab kasutada päriseluliste tõlkeülesannete täitmiseks
“Masintõlkel on Eesti digiarengus oluline roll keelebarjääride kõrvaldamise ja mitmekeelse infovahetuse hõlbustamise kaudu, ,”
ütles Myllylä. Parimaid tulemusi on tema sõnul võimalik saavutada, õpetades tõlkemootorile järjepidevalt konkreetse tekstidomeeni terminoloogiat ja stiili.
“Hankijat esindades on mul hea meel, et võitnud konsortsium koosneb kahest masintõlke valdkonna juhtivast keskusest Eestis – Tartu Ülikoolist ja Tildest, ,”
ütles Eesti keele Instituudi direktor Arvi tavast, avaldades lootust, et see annab kindlust mitte ainult tänavusele projektile, vaid ka Eesti masintõlke jätkuvale arendamisele tulevikus.
Projekti rahastatakse Eesti riigihanke „Avaliku sektori masintõlketehnoloogia arendamine” kaudu. Kogueelarve on 600 000 euro t ja projekt lõpeb 2021. aasta detsembris. Vastutav rahastamisasutus on Eesti keele Instituut ning projekti on algatanud ja toetanud Haridus - ja Teadusministeerium.
Lisateave:
Pekka Myllylä, Tilde Eesti tegevdirektor