Skip to main content

Tehisintellekt teisendab tekstiks Leedu heli ja videosalvestise

Täiemahulisi kvaliteetteenuseid osutav Kantar TNS Lithuania on Leedu turul üks peamisi turu-uuringutega tegelevaid ettevõtteid, millel on 125 töötajat.

JAGAGE

Klient

Täiemahulisi kvaliteetteenuseid osutav Kantar TNS Lithuania on Leedu turul üks peamisi turu-uuringutega tegelevaid ettevõtteid, millel on 125 töötajat.

Lugu

Nüüdsest aitavad Leedu heli- ja videosalvestisi jälgida ning neis olevaid sõnu tuvastada robotid. Tehisintellekti tehnoloogia kiirendab märkimisväärselt nii tele- ja raadiosalvestiste seiret kui ka ajakirjanike, kohtuistungite ja koosolekute stenografistide ning kõnekeskuste personali tööd. Tilde ja turu-uurungute firma Kantar TNS on koos välja töötanud uuendusliku lahenduse.

Automaatne kõnetuvastustehnoloogia põhineb süvanärvivõrkude mudelil, mis õpetab tehisintellekti tuvastama sõnu ja nendest moodustatud struktuure. Tehisintellekti treenimiseks kasutati üle 250 tunni helisalvestisi, 58 miljonit leedukeelset lauset ning rohkem kui 600 000 sõna. Erilist tähelepanu osutati ärisuhtlusega seotud märksõnadele.

„Varem oli televisiooni- ja raadiosaadete ning suhtlusvõrkudes ja Internetis olevate videote seireks vaja inimest. Me vaatasime iga päev läbi sadade tundide jagu salvestisi. Kuid kuna videosisu maht suureneb pidevalt ning publik jaotub mitme eri kanali vahel, peab üha kiirenevas tempos kasvama ka meie eetriseire suude. See optimaalsete kuludega tehnoloogia aitab kiiresti analüüsida mittetekstilist teavet ja saada põhjalik pilt aset leidvast kommunikatsioonist,“ sõnas Deividas Butkus, Kantar TNSi kommunikatsiooniseire ja -analüüsiosakonna juht.

Kaheksa korda kiirem töö

Tehnoloogia välja töötanud Tilde IT-osakonna juht Renata Špukienė sõnul valmistas suurimaid probleeme keele eripära, kuna erinevalt inglise keelest laiendavad leedu keeles võimalike tähenduste hulka käänded. Arendatud tehnoloogia suudab heli kiiresti tekstiks teisendada ning kasutada seejuures kirjevahemärke; uudistesaadete sisu tuvastamise täpsus on umbes 90%.

„Seni võttis ühetunnise saate kuulamine ja tekstiks teisendamine ehk transkribeerimine inimesel umbes neli tundi. Nüüd teisendab tehisintellektisüsteem sama pikkusega salvestise tekstiks umbes poole tunniga. Lisaks saab töö toimuda paralleelselt mitmes kanalis, mis suurendab töödeldava sisu hulka veelgi. Järgmine etapp sarnaneb juba tekstitöötlusega: märksõnade otsimine, arhiivimine, subtitreerimine,“ selgitas R. Špukienė. 

D. Butkuse sõnul lihtsustab see tehnoloogia arvestatavalt ka arhiivitud heli- ja telesisu kasutamist.

„Kõik tekstiks teisendamata helisalvestised unustatakse varem või hiljem. Otsingumootorid on nende puhul võimelised leidma ainult reportaaži kirjelduse või pealkirja. Seetõttu oli varem ülimalt keeruline isegi õige märksõna (näiteks käibemaksusoodustus) abil leida näiteks viie aasta vanust videot. Tänu sellele uuendusele on see nüüd lihtsam. Samuti saab personal nüüd pühendada rohkem aega analüüsimisele ja konsultatsioonidele, selle asemel et täita tüütuid tehnilisi ülesandeid,“ ütles Kantar TNSi kommunikatsiooniseire ja -analüüsiosakonna juht. Samuti on selle tehnoloogia abil hõlpsam leida salvestises üles õige koht ning kuvatud on ka ajatemplitega ajaskaala, millelt saab kontrollida, millistes jaotistes otsitav märksõna sisaldub.

Kantar TNS kaalub kõnetuvastuse kasutuselevõttu lisaks kommunikatsioonianalüüsile ka meediareklaami seireks ja kvalitatiivseteks uuringuteks.

Ajakirjanike, kohtute ja kõnekeskuste personali töö muutub lihtsamaks

Tilde IT-osakonna direktor R. Špukienė on veendunud, et selline süsteem ei kiirenda mitmekordselt üksnes meediaseiret. Tehnoloogia kasutusvõimalused on palju arvukamad: uudistesaadete kiirsubtitreerimine, intervjuude või üritusejärgsete tekstide kiirem ettevalmistamine, koosolekute või istungite hõlpsam stenografeerimine – need on ainult mõned võimalikud kasutusalad.

Tema sõnul on tegemist Leedu esimese närvivõrkudel põhineva tehisintellektitehnoloogiaga, mis on pideva leedukeelse kõne tuvastamiseks kohandatud ja kasutusele võetud. Lätis juba kasutatakse Tilde arendatud läti keele kõnetuvastussüsteemi prototüüpi.

Nii Kantar TNSi kui ka Tilde IT-osakonna spetsialistid prognoosivad, et heli ja video kujul esitatud teabe hulga jätkuva kasvu tõttu võib kõnetuvastustehnoloogiat peagi vajada iga ettevõte ja asutus. Kuigi ekspertide sõnul nõuab heli- ja videosisuga töötamine endiselt inimsekkumist, kiirendab tehisintellekt vajalike ülesannete täitmist ja suurendab tööviljakust.