Igaunijas tiesas pāriet uz automatizētu transkripciju ar risinājumu Salme
Tildes komanda 2024. gada 6. augustsPartnerībā ar CGI Estonia Tilde izstrādājusi Salme - paražu automātiska runas pazīšana (ASR) risinājums Igaunijas tiesas sēdēm. Salme pārvērš cilvēka balsi tekstā, nodrošinot reālā laika un bezsaistes automatizētu transkripciju visu līmeņu tiesas sēdēm.
Lietotājs: Igaunijas tiesas (Tieslietu ministrijas tehniskais klients: reģistru un informācijas sistēmu centrs – RIK).
Rūpniecība: Juridiskie un tiesu
Izaicinājums
Tradicionāli tiesas sēdes balstās uz stenogrāfu un tiesas sekretāru manuālu transkripciju, kas ir darbietilpīgs un laikietilpīgs process. Lai gan runas atpazīšanas tehnoloģija pastāv jau gadu desmitiem, tikai pēdējā laika notikumi un mašīnmācīšanās algoritmu ieviešana ir ļāvusi ģenerēt uzticamus, automatizētus transkriptus. Šī virzība būtiski samazina tiesas dokumentu sagatavošanai nepieciešamo laiku un pūles.
Atzīstot to, RIKS iniciēja Salmes attīstību – viņu pielāgots runas pazīšanas risinājums.
Attīstība
Lai izveidotu Salme, Tilde atdalījās ar CGI Estonia – globālu IT inovāciju uzņēmumu ar spēcīgu vietējo klātbūtni Igaunijā. CGI specializējas programmatūras izstrādē un sistēmas integrēšanā, savukārt Tilde ir pieredzējusi pielāgotu AI virzītu valodas tehnoloģiju risinājumu izstrādē.
Risinājuma ietvaros Tilde izstrādāja automatizēta runas atpazīšanas (ASR) sistēma par tiesas sēžu transkribēšanu gan bezsaistē, gan reāllaikā. CGI atbildēja par Windows prezentāciju fonda (WPF) lietotāja interfeisu un audio ierakstu sistēmas integrāciju ar Tilde ASR sistēmu. Turklāt CGI pārraudzīja Salme integrāciju Tiesu informācijas sistēmā, X-Road ® – atvērtā koda programmatūra un ekosistēmas risinājums, kas veicina vienotu un drošu datu apmaiņu starp organizācijām. Tas nodrošināja netraucētu un automatizētu informācijas un datu apmaiņu.
Salme tika izstrādāts, trenējot runas atpazīšanas modeli ar konkrētu klienta sniegtu saturu – vairāk nekā 800 stundas no pārrakstīta audio un vairāk 800 miljoni vārdu teksta datu vērtība.
Kopš tā uzsākšanas risinājums ir īstenots visās Igaunijas valsts un reģionālajās tiesās.
Risinājums
Lai nodrošinātu efektīvu un precīzu transkripciju, ASR risinājums Igaunijas tiesām Salme ietver vairākas papildu funkcijas:
- Integrācija oficiālajā tiesu informācijas sistēmā vienmērīgai darbībai
- Transkripcija reāllaikā ar minimālu aizkavēšanos
- Bezsaistes režīms par aizvadīto tiesas sēžu pārrakstīšanu ar augstāku precizitāti
- Skaļruņa identifikācija caur iepriekš piešķirtiem mikrofoniem tiesas sēdēs
- Automātiskā skaļruņa identifikācija ja skaļruņu balss paraugi ir pieejami iepriekš
- Uz kontekstu balstīts transkriptu strukturēšana
- Pēcapstrāde iespējas, tostarp laikspiedola piezīmju pievienošana un stenogrammu pielāgošana
- Iebūvēts pareizrakstības pārbaude uzlabotai precizitātei
- Atbilstība stingri konfidencialitātes standarti un droša transkriptu krātuve
ASR kvalitātes faktori
Salme atšifrējumu efektivitāte un kvalitāte ir atkarīga no audioieraksta kvalitāte un tas, kā tiek trenēts ASR modelis.
ASR modeļa pielāgošanai nepieciešami plaši dati, atbilstoši programmatūras izstrādes rīki un pamatīga apmācība, lai Salme varētu radīt kvalitatīvus transkriptus ar pareizu terminoloģiju, frāzēm un žargonu.
Runas atpazīšanas modelis tika plaši apmācīts, lai nodrošinātu ļoti precīzus transkriptus ar vārdu kļūdu īpatsvaru (WER) no 8 līdz 15%. Taču šādu precizitātes līmeni var panākt, piekļūstot kvalitatīvai tehnoloģijai un dalībniekiem runājot pēc kārtas. Rezultāti var būt mazāk optimāli mazāk kontrolētās sēdēs ar ieslēgtiem mikrofoniem un vienlaicīgu runu. Turklāt audio kvalitāte ir atkarīga no iekārtas spējas risināt dažādas akustiskas problēmas, piemēram, fona troksni.
Rezultāti
Salme ieviešana būtiski uzlabojusi Igaunijas tiesas sēdes transkripcijas efektivitāti un precizitāti.
RIKS norāda: “Ja tiesas sēde tiek rīkota ar kvalitatīvu audioaparatūru un pēc tam ir nepieciešams vārds vārdā noraksts, Salme ir vērtīgs rīks, kas palīdz ietaupīt laiku. Tehnoloģija visās tiesas zālēs nav vienādas kvalitātes, kas tieši ietekmē transkripcijas rezultātus. Ar kvalitatīvu audioaparatūru sesijas transkripcija tiek sagatavota nekavējoties, nepieciešamības gadījumā pieprasot tikai pēctranskripcijas pārbaudes un labojumus. Atsauksmes no tiesām ir bijušas pozitīvas, jo tās var piekļūt sesijas datiem pēc vajadzības, sniegt informāciju tūlīt pēc tiesas sēdes un izvairīties no failu manuālas augšupielādes tiesu informācijas sistēmā.”
Secinājums
Sadarbojoties CGI Estonia un Tilde, Igaunijas tiesas tagad var dabūt kvalitatīvus atšifrējumus dažu sekunžu laikā. Tas ir skaidrs gadījums, kā progresīvas runas atpazīšanas tehnoloģijas izmantošana var palielināt efektivitāti un precizitāti gadījumos, kad parasti iepriekš bija roku darbs.
Ir pēdējais laiks uzņēmumiem, privātpersonām un valsts sektoram gudri piešķirt savus resursus un pāreja uz automatizāciju ja vien iespējams, nodrošinot laika un resursu efektīvu izmantošanu.
Par VNK
Dibināta 1976. gadā, CGI ir viena no lielākajām neatkarīgajām IT un biznesa konsultāciju pakalpojumu firmām pasaulē. Ar 90 000 konsultantiem un profesionāļiem visā pasaulē CGI piedāvā pilnīgu iespēju portfeli, sākot ar stratēģiskām IT un uzņēmējdarbības konsultācijām un beidzot ar sistēmu integrāciju, pārvaldītiem IT un uzņēmējdarbības procesu pakalpojumiem un intelektuālā īpašuma risinājumiem. CGI sadarbojas ar klientiem, izmantojot vietējo attiecību modeli, ko papildina globālais piegādes tīkls, kas palīdz klientiem digitāli pārveidot savas organizācijas un paātrināt rezultātus. CGI Fiscal 2023 uzrādītie ieņēmumi ir 14,30$ miljardi CA, un CGI akcijas tiek kotētas TSX (GIB. A) un NYSE (GIB). Papildinformācija vietnē https://www.cgi.com/ee/et.