Keeletehnoloogia arendaja: oleme leedulased, seega tehnoloogia peab meiega rääkima Leedu keeles
Tiim Tilde 7. juuli 2021Teadlased usuvad, et keel, mis elektroonilises meedias ei levi, muutub peagi iganenuks. Keeletehnoloogiafirma Tilde IT alustas esimesena Leedus tarkvara lokaliseerimist ning arendas täiustatud kõnetuvastus - ja sünteesitehnoloogiat. Selle juht Renata Špukienė rõhutab, et oleme leedulased, seega peab ka tehnoloogia meiega rääkima Leedu keeles.
– Muude projektide hulgas arendab Tilde IT Leedu keele äratundmist ja sünteesi. Mis tehnoloogial see on ja mis põhimõttel see põhineb?
– Tilde IT on töötanud juba pikka aega keeletehnoloogiaga ning me hakkasime seda keeletuvastus - ja sünteesitehnoloogiat arendama juba 2019. aastal. Osalesime Leedu ettevõtluse tugiameti korraldatud projektides, mis rahastavad intellektuaalseid projekte ja selle tulemusena arendasime seda tehnoloogiat. Projekt ise kestis 24 kuud ning tehti erinevaid uuringuid ja katseid, sest tegemist oli toona täiesti uue tehnoloogiaga.
„Selle täpsus on üle 80%, mis ühtib kõigi teiste suuremate keelte tunnustamise täpsuse ja kvaliteediga, nii et Leedu keel peab sammu teiste maailmakeelte tunnustamise ja sünteesitehnoloogiatega.”
Renata Špukienė,
Tehnoloogia lähtub sügavate neuronivõrkude printsiibist; see tunneb ära loomuliku kõnekeele ja on kirjutatud teksti, mis eeldab hulga kõneteksti näidiste kogumist. Kogutakse igas vanuses meeste ja naiste hääli, siis töödeldakse neid kõnekorpusi, valmistatakse ette närvivõrgu mudeliks ja seal toimivad võrgustikud ise sarnaselt inimajuga, et hääli ära tunda, kokku panna ja tekstiks muuta.
Kasutajad saavad nüüd selle teenusega ühenduse luua ja seda kasutada. Nad saavad üles laadida helifaili ja saada kirjaliku teksti ning nad saavad dikteerida ja tekst transkribeeritakse ekraanil. Samal ajal saab kasutaja häälsünteesi ajal pakkuda, et kirjutatav tekst kõlaks mees - või naishäälel.
– Millised on seosed teie tehnoloogia ja Vilniuse Ülikooli poolt ellu viidud projekti „LIEPA” (Leedu kõnepõhised teenused) vahel?
– Projektid „LIEPA” ja „LIEPA-2” loovad oma tunnustuse ja meie oma. Toona, aastatel 2016-17, kui tehnoloogiat arendati, oli erinevus selles, et arendasime tehnoloogiat, mis tundis ära ja eristas inimkeelt igas keskkonnas. Ükskõik, kas sa olid lärmakas keskkonnas või mängis taustal muusika, möödus auto või rääkis keegi sinu kõrval, tehnoloogia oli loodud eristama sinu kõnet kõrvaldades enda ümber olevad helid.
„LIEPA” tegeles tollal laboratoorse helikvaliteediga, siis mindi ka lärmaka keskkonna peale üle ja nüüd töötab nende tehnoloogia edukalt. Tookord olime aga esimesed, kelle tehnoloogia suutis vestluse ära tunda ja selle reaalajas tekstiks muuta. „LIEPA” lõi oma projekti raames kõnekorpuse ja kogus 100 tundi kõnet, kasutasime seda korpust oma kõnetuvastuse technology—of kursuse jaoks, meil oli ka oma, aga kasutasime ka nende oma, sest mida rohkem ressursse ja mitmekesisemad nad on, seda parema tulemuse saame.
– Milliste väljakutsetega sellise tehnoloogia arendamisel silmitsi seisate?
– Kõigepealt ressursid. Selline asi nõuab tohutul hulgal kõnekorpust, helisalvestisi, mis peavad koosnema eri vanuses häältest, soodest, murretest, sest tehnoloogia peab suutma sama hästi ära tunda leedukeelset venelast või samogiitlast rääkivat ühist leedulast.
Järgmine väljakutse on müra. Tehnoloogia peab ära tundma heli mitte ainult steriilsetes ja vaiksetes keskkondades, vaid ka lärmakates keskkondades, seega peame seda õpetama müra likvideerimiseks. Näiteks kui keegi räägib koosoleku ajal ja pliiats klõpsab taustal, ei huvita tehnoloogiat, kas selle kõneleja või pliiatsi clicking—it on heli ja tehnoloogia jäädvustab selle kõik. Ta peab tunnistama, et pliiatsi klõpsamine ei ole heli, mis moodustab sõna, fraasi või silbi, ja ta kõrvaldab selle üldisest heliribast.
Teine väljakutse on väike turg, sest me oleme väike rahvas, väike keel ja piiratud arv tarbijaid. Me tahaksime selle tehnoloogiaga minna globaalseks, aga maailm ei vaja Leedu keele much—only nii palju, kui on Leedu keele kõnelejaid.
– Tilde IT pakub praegu Leedu keele tunnustamist ainult lauaarvutisüsteemidele. Kas plaanite sellist teenust rakendada ka nutiseadmetele/mobiilseadmetele?
– Meie eesmärk ei olnud luua mobiilseadmetele rakendust, me näeme oma teenuseid veidi laiemas kontekstis. Meie eesmärk on kohandada neid teiste elektrooniliste teenustega, integreerida need kliendisüsteemidesse, mis suudavad nendega töötada, näiteks chatbot. Praegusel kujul peate tippima oma küsimuse automaatabimehele, samal ajal kui töötame selle nimel, et juturobotid saaksid suhelda pigem häälega kui tekstiga, mis tähendab, et nad kuulevad, mida neile öeldakse, tunnevad kõne ära ja annavad seejärel suulise vastuse ehk teisisõnu sünteesivad selle.
Tõsi, oleme välja töötanud rakenduse „Tildės Balsas”, kuid see toimib pigem näidisvahendina. Sellega seame eesmärgiks näidata, milleks meie kõnetuvastustehnoloogia võimeline on ja kuidas see töötab. Rakendus võimaldab dikteerida tekste ja kasutada erinevaid commands—for näiteid, saate dikteerida tekstsõnumeid, märkmeid, kirjalikke kirju, korraldada oma ajakava ning määrata aadresse Google Mapsile või Waze' ile; kui sõidate autoga ja peakomplekt on sisse lülitatud, saate oma hääle abil kontakte otsida ja paluda hääles tekste lugeda. Rakendus töötab hästi, võid seda proovida ja võib-olla saab sellest osa sinu tavapärasest rutiinist, näiteks tööülesannete või toidukaupade nimekirja koostamine teel tööle.
– Kui tihti kasutavad inimesed Leedu keeletuvastusteenust internetis?
– Võib-olla kasutab mobiilirakendust vähem inimesi, kuid kõnetuvastusteenust ennast kasutavad laialdaselt nii ettevõtted kui ka üksikisikud.
„Ma soovitaksin seda ajakirjanikele, kes saavad intervjuu helisalvestise üles laadida ja teksti saada. Tehnoloogiat kasutavad ka meediamonitooringufirmad, mis annavad klientidele teatud analüüsi sellest, mida on uudistes ühe või teise ettevõtte kohta räägitud, vahendab ajakirjandus. Seda kasutavad ka subtiitreid tootvad ettevõtted. Kõnetuvastuse teine kasutusvaldkond on koosolekute salvestamine – näiteks kui on koosolek ja pole aega teha nn koosolekuprotokolle, saate lindistuse tekstiks muuta, selle transkribeerida ja teha protocol—it säästab palju käsitsitööd.”
Renata Špukienė,
– Kas Leedu keel pakub keeletuntuse osas mingeid eeliseid või on see pigem keel, mis tekitab lisaväljakutseid?
– Eeliseid ega puudusi ei ole, iga keel on ainulaadne. Kogutakse kõnekorpus, õpetatakse mootoreid, mis on standard, nagu teiste keelte puhul.
Miks me oleme saavutanud keeletunnustusel nii kõrge kvaliteeditaseme? Kuna kõik keeletuvastustehnoloogiad põhinevad samadel principle—the rohkematel ressurssidel, on teie keeletuvastus seda täpsem.
Renata Špukienė,
– Kas Leedu keele arendamine küberruumis on tulevikus nõudlus, arvestades noorema põlvkonna kalduvust inglise keelt sagedamini kasutada?
– Ma ütleksin, et Leedu keel on tulevikus nõutu, kuni me räägime Leedu keelt. Ärgates mõtleme esmalt Leedu keeles, unistame ka Leedu keeles, seega on loomulik, et Leedu keel eksisteerib tehnoloogias. Meie eesmärk on, et Leedu keel, selle kõnetuvastus ilmuks igas seadmes.
– Kas Leedu keel võiks kõnetuvastustehnoloogia puhul pälvida selliste hiiglaste nagu Apple või Microsoft tähelepanu?
– Lihtsalt ja lühidalt öeldes ilmub Leedu keel Apple' is, Google' is ja teistes tootjates, kui nad installivad Leedu keele toe funktsiooni. Kõnetuvastustehnoloogial on tulevikus tohutu potentsiaal ja kõik suured tegijad saavad sellest aru.
Need keskenduvad suurtele turgudele, peamistes keeltes (inglise, vene, saksa, prantsuse, Itaalia jne) kõnelevad Siri, Amazon Alexa või Google'i assistent. Amazon Alexa räägib praegu 8 keelt ja toetab veel 10 murret. Murre sarnaneb sellega, kuidas meil on põhja (aukštaičių), lääne (žemaičių) ja lõuna (dzūkų) murded. Neil on ka Austraalia inglise, Briti inglise, Ameerika inglise keelt, mida nimetatakse murreteks, sest kasutusel, hääldamisel on peened erinevused. Google'i assistendil on praegu 12 keelt ja 13 murret, Siril aga 21 keelt ja lugematul hulgal murdeid.
„Niisiis, küsimus ei ole selles, kas meil on oma keel, vaid selles, millal. Kõik see taandub inim - ja finantsressurssidele.”
Renata Špukienė,
Väiksemates keeltes tehnoloogiate arendamiseks peavad olema kättesaadavad ressursid, mis oskavad rääkida või vähemalt keelt mõista. Uute keelte lisamine toetub alati resources—how hulgale ressurssidele, mida saate koguda tehnoloogia arendamiseks, ja sellele, kui palju uurimistööd saate teha. Loomulikult saavad suurtootjad alati otsida lahendusi, mis turul juba olemas on. Meie puhul võiksid nad meiega koostööd teha, aga võib-olla juhtub see kunagi. Me oleme valmis.