Skip to main content

Audio un video ierakstus lietuviešu valodā tekstā pārveido mākslīgais intelekts

Kantar TNS Lietuva ir viena no labākajām izpētes kompānijām Lietuvā. Tās 125 darbinieku plašā komanda piedāvā pilna servisa tirgus, sociālo un mediju izpēti.

DALIES

Klients

Kantar TNS Lietuva ir viena no labākajām izpētes kompānijām Lietuvā. Tās 125 darbinieku plašā komanda piedāvā pilna servisa tirgus, sociālo un mediju izpēti.

Stāsts

Turpmāk robots palīdzēs monitorēt un identificēt audio un video ierakstus lietuviešu valodā. Mākslīgā intelekta tehnoloģijas ne tikai vairākkārt paātrinās televīzijas un radio ierakstu monitoringu, bet arī efektivizēs stenografētāju darbu tiesas sēdēs un sanāksmēs un atvieglos arī žurnālistu un zvanu centru darbinieku ikdienu.

Automātiskā runas atpazīšanas tehnoloģija balstās dziļo neironu tīklu modelī, kas māca mākslīgo intelektu atpazīt vārdus un noteiktu to struktūru. Mācīšanai izmantotas vairāk nekā 250 stundu audio ierakstu, 58 miljoni lietuviešu teikumu un vairāk nekā 600 tūkstošu vārdu. Īpaša uzmanība tiek pievērsta ar uzņēmējdarbību saistītajiem atslēgvārdiem.

"Agrāk, lai uzraudzītu TV un radio raidījumus vai videoklipus sociālajos tīklos un internetā, bija nepieciešams ievērojams cilvēku darbs. Mēs katru dienu fiziski vērojām desmitiem stundu ierakstu, taču monitoringa ātrumam vajadzētu pieaugt eksponenciāli saturam. Jau šobrīd video satura apjoms ir ievērojami pieaudzis un auditorija tiek sadalīta dažādos kanālos, tādēļ šī izmaksas optimizējošā tehnoloģija palīdzēs ātri analizēt pieaugošo informācijas plūsmu un redzēt visaptverošu saziņas ainu," saka Kantar TNS Komunikāciju uzraudzības un analīzes departamenta vadītājs Deans Butkus.

Darbs tiks paātrināts astoņas reizes

Uzņēmuma Tilde IT direktore Renata Špukiene norāda, ka lielākais izaicinājums bija valodas unikalitāte ― atšķirībā no angļu valodas, lietuviešu vārdu dažādie locījumi un variācijas ievērojami paplašina to potenciālās nozīmes. Izstrādātā tehnoloģija spēj ātri pārveidot skaņu tekstā, izmantojot pieturzīmes, un atpazīšanas precizitāte ziņu raidījumos sasniedz aptuveni 90 procentus.

"Līdz šim cilvēkam bija nepieciešamas apmēram četras stundas, lai klausītos un pārveidotu tekstu, t. i., pārrakstītu stundu garu ierakstu. Tagad mākslīgā intelekta sistēma šo stundas ierakstu var pārvērst tekstā pusstundas laikā. Turklāt darbība notiek vairākos kanālos paralēli, tādējādi vēl vairāk palielinot apstrādāto materiālu apjomu. Un tad tālākais darbs jau norit tikai ar tekstu: tiek veikta ērta meklēšana pēc atslēgvārdiem, arhivēšana un subtitrēšana," skaidro Renata.

Pēc D. Butkus domām, šī tehnoloģija ievērojami vienkāršo arhīva audio un TV materiālu izmantošanu.

Agrāk audio ieraksti netika pārveidoti uz tekstu. Galu galā meklētājprogrammas atrada tikai to, kas bija iekļauts virsrakstā vai pārskata aprakstā. Tāpēc bija īpaši grūti atrast, teiksim, piecus gadus senu video ar atslēgvārdu, piemēram, “PVN atvieglojums”. Ar šo jaunievedumu tas būs viegli. Un darbiniekiem būs vairāk laika, ko veltīt analīzei un konsultēšanai, nevis garlaicīgs tehniskais darbs," saka Kantar TNS Komunikācijas uzraudzības un analīzes departamenta vadītājs. “Turklāt šī tehnoloģija palīdzēs uzreiz atrast pareizās vietas ierakstā un pat nodrošinās laika grafikus ar laika nosaukumiem, norādot, kuras sadaļas satur vajadzīgos atslēgvārdus.”

Papildus komunikācijas analīzes pielāgošanai Kantar TNS izskata iespēju izmantot runas atpazīšanu mediju reklāmas pārraudzībai un kvalitatīviem pētījumiem.

Žurnālistu, tiesu darbinieku un zvanu centru darbs būs vieglāks

Renata, Tilde IT direktore, ir pārliecināta, ka šādas sistēmas paātrinās ne tikai mediju monitoringu, jo tehnoloģijas izmantošanas iespējas ir daudz plašākas: ātra ziņu raidījumu subtitrēšana, interviju ātrāka sagatavošana žurnālistiem, tekstu pēcapstrāde, vieglāka sapulču vai tiesas sēžu stenogrāfija ― šie ir tikai daži veidi, kā šo tehnoloģiju var izmantot.

Šāda mākslīgā intelekta tehnoloģija, kas balstīta neironu tīklos un ir īpaši pielāgota lietuviešu valodas runas atpazīšanai, ir pirmā Lietuvā. Arī Latvijā praktiskos risinājumos tiek izmantots Tildes izstrādātais latviešu valodas atpazīšanas prototips

Kantar TNS un Tilde IT speciālisti prognozē, ka, arvien pieaugot audio un video informācijai, neviens uzņēmums vai organizācija, kas strādā ar datiem, nespēs darboties bez runas atpazīšanas tehnoloģijas. Tomēr, pēc ekspertu domām, kaut arī šādi risinājumi uzlabos darba efektivitāti, joprojām būs nepieciešama cilvēku līdzdalība.