Tilde on koostöös CGI Eestiga välja töötanud kombe Salme automaatne kõnetuvastus (ASR) lahendus Eesti kohtuistungitele. Salme teisendab inimese hääle tekstiks, pakkudes reaalajas ja võrguühenduseta automaatset transkriptsiooni kohtuistungiteks kõikidel tasanditel.
Kasutaja: Eesti kohtud (Justiitsministeeriumi tehniline klient: Registrite ja Infosüsteemide Keskus – RIK).
Tööstus: Õiguslik ja kohtulik
Väljakutse
Traditsiooniliselt tuginevad kohtuistungid stenograafide ja kohtusekretäride käsitsi transkribeerimisele, mis on töömahukas ja aeganõudev protsess. Kuigi kõnetuvastustehnoloogia on eksisteerinud juba aastakümneid, on vaid hiljutised arengud ja masinõppe algoritmide kasutuselevõtt võimaldanud luua usaldusväärseid, automatiseeritud transkriptsioone. Selline edasiminek vähendab oluliselt kohtudokumentide koostamiseks kuluvat aega ja vaeva.
Seda tunnistades algatas RIK Salme arendamise – nende kohandatud kõnetuvastuslahendus.
Arendus
Salme loomiseks tegi Tilde koostööd CGI Eestiga – globaalse IT-innovatsiooniga ettevõttega, millel on tugev kohalik kohalolek Eestis. CGI on spetsialiseerunud tarkvara arendamisele ja süsteemi integreerimisele, Tilde on aga kogenud kohandatud AI-driven keeletehnoloogiliste lahenduste väljatöötamist.
Lahenduse osana töötas Tilde välja automaatne kõnetuvastuse (ASR) süsteem kohtuistungite transkribeerimiseks nii vallasrežiimis kui ka reaalajas. CGI vastutas Windows Presentation Foundation (WPF) kasutajaliidese ja helisalvestussüsteemi integreerimise eest Tilde ASR-süsteemiga. Lisaks kontrollis CGI Salme integreerimist kontrollikoja infosüsteemiga X-road ® – avatud lähtekoodiga tarkvara ja ökosüsteemi lahendus, mis hõlbustab organisatsioonidevahelist ühtset ja turvalist andmevahetust. See võimaldas sujuvat ja automatiseeritud teavet ja andmevahetust.
Salme arendati välja kliendi pakutava spetsiifilise sisuga kõnetuvastusmudeli koolitamisega – enam kui 800 tundi transkribeeritud heli ja muu 800 miljonit sõna väärt tekstilisi andmeid.
Alates selle käivitamisest on lahendust rakendatud kõigis Eesti riiklikes ja piirkondlikes kohtutes.
Lahendus
Efektiivse ja täpse transkriptsiooni tagamiseks sisaldab ASR-lahendus Eesti kohtutele Salme mitu täpsemat funktsiooni:
- Integratsioon ametliku kohtu infosüsteemi tõrgeteta toimimiseks
- Reaalajas transkriptsioon minimaalse viivitusega
- Ühenduseta režiim varasemate kohtuistungite transkribeerimise eest suurema täpsusega
- Kõlari ID kohtuistungite ajal eelnevalt määratud mikrofonide kaudu
- Kõlari automaatne tuvastamine kui kõlari hääleproovid on eelnevalt saadaval
- Kontekstipõhine transkriptsiooni struktureerimine
- Järelredigeerimine võimalused, sh ajatempliga märkmete lisamine ja transkriptsioonide reguleerimine
- Sisseehitatud Õigekirjakontroll täpsuse suurendamiseks
- Vastavus ranged konfidentsiaalsusstandardid ja turvaline ärakirja talletamine
ASR-i kvaliteeditegurid
Salme efektiivsusest ja transkriptsioonide kvaliteedist sõltub helisalvestise kvaliteet ja ASR-mudeli treenimine.
ASR-mudeli kohandamine nõuab ulatuslikke andmeid, asjakohaseid tarkvaraarendusvahendeid ja põhjalikku koolitust, et Salme saaks toota kvaliteetseid transkripte õige terminoloogia, fraasi ja žargooniga.
Kõnetuvastusmudelit koolitati laialdaselt, et tagada väga täpsed transkriptsioonid sõnavigade määradega (WER) vahemikus 8-15%. Seda täpsusastet on aga võimalik saavutada kvaliteetsele tehnoloogiale ligipääsu ja kordamööda kõnelevate osalejatega. Tulemused võivad olla vähem optimaalsed vähem kontrollitud kuulamistel, kus kõik mikrofonid on sisse lülitatud ja samaaegne kõne. Lisaks sõltub heli kvaliteet seadmete võimest lahendada mitmesuguseid akustilisi probleeme, näiteks taustamüra.
Tulemused
Salme rakendamine on oluliselt parandanud Eesti kohtuliku arutamise transkriptsiooni efektiivsust ja täpsust.
RIK nendib: „Kui kohtuistung toimub kvaliteetsete heliseadmetega ja hiljem on vaja sõna-sõnalt üleskirjutust, Salme on väärtuslik vahend, mis aitab säästa aega. Kõigis kohtusaalides ei ole tehnoloogia sama kvaliteediga, mis mõjutab otseselt transkriptsiooni tulemusi. Kvaliteetsete heliseadmetega valmistatakse koheselt ette sessiooni transkriptsioon, mis nõuab vajadusel ainult transkriptsioonijärgseid kontrolle ja parandusi. Kohtute tagasiside on olnud positiivne, sest nad pääsevad vajadusel juurde istungiandmetele, annavad infot vahetult pärast kohtuistungit ning hoiduvad failide käsitsi kohtu infosüsteemi üleslaadimisest.”
Järeldus
CGI Eesti ja Tilde koostöö kaudu Eesti kohtud saavad nüüd kvaliteetseid transkriptsioone sekunditega. See on selge näide sellest, kuidas täiustatud kõnetuvastustehnoloogia võimendamine võib suurendada tõhusust ja täpsust seal, kus varem oli normiks käsitsitöö.
Ettevõtetel, üksikisikutel ja avalikul sektoril on viimane aeg oma ressursse targalt jaotada ja üleminek automatiseerimisele võimaluse korral tagada aja ja ressursside tõhus kasutamine.
Teave CGI kohta
1976. aastal asutatud CGI kuulub maailma suurimate sõltumatute IT - ja ärikonsultatsiooniteenuste ettevõtete hulka. Tänu 90 000 konsultandile ja professionaalile üle kogu maailma pakub CGI täielikku võimaluste portfelli alates strateegilisest IT - ja ärikonsultatsioonist kuni süsteemide integreerimise, hallatud IT - ja äriprotsessiteenuste ning intellektuaalomandi lahendusteni. CGI teeb klientidega koostööd kohaliku suhtemudeli kaudu, mida täiendab ülemaailmne edastusvõrk, mis aitab klientidel oma organisatsioone digitaalselt muuta ja tulemusi kiirendada. CGI 2023. aasta maksutulu on 14,30$ miljardit USA dollarit ning CGI aktsiad on noteeritud TSX-is (GIB. A) ja NYSE-s (GIB). Lisateavet leiate aadressilt https://www.cgi.com/ee/et.