Eesti keele Instituut ning Eesti Haridus - ja Teadusministeerium on algatanud senise suurima keeletehnoloogia arendusprojekti, mille tulemusena alustasid Tilde ja Tartu Ülikooli arvutiteaduse Instituut tööd usaldusväärse avatud lähtekoodiga masintõlkeplatvormi kallal kolmele keelepaarile: Eesti-inglise-Eesti, Eesti-vene-Eesti ja Eesti-saksa-Eesti.
Projekti käigus töötatakse välja kvaliteetne masintõlkeplatvorm veebi - ja uudistekstidele, kriisiinfole, õigus - ja militaartekstidele, mida saavad kasutada nii avalikud institutsioonid, tõlkebürood, vabakutseliste tõlkijad kui KA it ja tehisintellekti valdkonna ettevõtete arendajad.
Tartu Ülikooli loomuliku keeletöötluse professori Mark Fišel sõnul on projekti eesmärk teha enamat kui lihtsalt olemasolevaid masintõlkemootoreid edasi arendada. Projektipartnerid katsetavad uusi tipptasemel lähenemisviise, et edendada masintõlke olukorda Eestis ja muuta see praktiliselt kasulikuks väga erinevatele lõppkasutajatele.
„Proovime erinevaid lähenemisi domeenispetsiifilisele masintõlkele, testime uhiuusi meetodeid nagu modulaartrafo tüüpi närvivõrgud, integreerime närvimasintõlke sõnastike ja leksikonidega ning töötame välja lahendused nii teksti - kui ka kõnetõlkeks, ”
selgitas Fišel. Samuti rõhutas ta, et uute mudelite koolitamine ei ole võimalik ilma Tartu Ülikooli kõrgjõudlusega arvutuskeskuseta, mis toetab nii Ülikooli kui ka Tilde keeletehnolooge kogu projekti vältel.
Tilde Eesti tegevdirektor Pekka Myllylä ütleb, et Eesti masintõlke kvaliteet on teinud läbimurde ja seda saab kasutada päriseluliste tõlkeülesannete täitmiseks
„Masintõlkel on Eesti digiarengus oluline roll keelebarjääride kõrvaldamise ja mitmekeelse infovahetuse hõlbustamise kaudu, ,”
ütles Myllylä. Parimaid tulemusi on tema sõnul võimalik saavutada, õpetades tõlkemootorile järjepidevalt konkreetse tekstidomeeni terminoloogiat ja stiili.
„Tellijat esindades on mul hea meel, et võitnud konsortsium koosneb kahest masintõlke valdkonna juhtivast keskusest Eestis – Tartu Ülikoolist ja Tildest, ,”
ütles Eesti keele Instituudi direktor Arvi tavast, avaldades lootust, et see annab kindlust mitte ainult tänavusele projektile, vaid ka Eesti masintõlke jätkuvale arendamisele tulevikus.
Projekti rahastatakse Eesti riigihanke „Avaliku sektori masintõlketehnoloogia arendamine” kaudu. Kogueelarve on 600 000 euro t ja projekt lõpeb 2021. aasta detsembris. Vastutav rahastamisasutus on Eesti keele Instituut ning projekti on algatanud ja toetanud haridus - ja teadusministeerium.
Lisateave:
Pekka Myllylä, Tilde Eesti tegevdirektor