Estijos teismai pradeda naudoti automatinį transkribavimą su Salme
„Tilde“ komanda 2024 m. rugpjūčio 6 d.Bendradarbiaudama su CGI Estija, Tilde sukūrė paprotį Salme automatinis kalbėjimo atpažinimas (ASR) sprendimas Estijos teismo posėdžiams. Salmė paverčia žmogaus balsą tekstu, pateikdama tikralaikę ir autonominę automatinę transkripciją visų lygių teismo posėdžiams.
Vartotojas: Estijos teismai (Teisingumo ministerijos techninis klientas: registrų ir informacinių sistemų centras – RIK).
Pramonės šaka: Teisiniai ir teisminiai
Iššūkis
Paprastai teismo posėdžiai vyksta naudojant stenografų ir teismo sekretorių rankinį transkripciją, o tai reikalauja daug darbo ir laiko. Nors kalbos atpažinimo technologija egzistuoja dešimtmečius, tik naujausi pokyčiai ir mašininio mokymosi algoritmų įdiegimas leido sukurti patikimus, automatinius nuorašus. Ši pažanga gerokai sumažina laiką ir pastangas, kurių reikia teismo dokumentams parengti.
Pripažindamas tai, RIKAS pradėjo Salme – jų pagal užsakymą sukurtas kalbėjimo atpažinimo sprendimas.
Plėtra
Siekdama sukurti „Salme“, „Tilde“ bendradarbiavo su „CGI Estonia“ – pasauline IT inovacijų bendrove, aktyviai veikiančia Estijoje. CGI specializuojasi programinės įrangos kūrimo ir sistemų integravimo srityje, o „Tilde“ turi patirties kuriant pasirinktinius AI pagrįstus kalbos technologijų sprendimus.
Kaip sprendimo dalį, Tilde sukūrė automatinė kalbėjimo atpažinimo (ASR) sistema teismo posėdžiams perrašyti ir neprisijungus, ir realiuoju laiku. CGI buvo atsakinga už Windows pristatymo platformos (WPF) vartotojo sąsają ir garso įrašymo sistemos integravimą su Tildės ASR sistema. Be to, CGI prižiūrėjo Salme integraciją į Teisingumo Teismo informacinę sistemą X-Road ® – atvirojo kodo programinė įranga ir ekosistemos sprendimas, palengvinantis vieningą ir saugų keitimąsi duomenimis tarp organizacijų. Tai leido sklandžiai ir automatizuotai keistis informacija ir duomenimis.
Salme buvo sukurtas apmokant kalbos atpažinimo modelį, turintį konkretų kliento pateiktą turinį – daugiau nei 800 valandų perrašytą garsą ir pan. 800 milijonų žodžių tekstinių duomenų vertė.
Nuo jo pradžios sprendimas įgyvendintas visuose Estijos nacionaliniuose ir regioniniuose teismuose.
Sprendimas
Siekiant užtikrinti veiksmingą ir tikslų transkripciją, ASR sprendimas Estijos teismams, Salme, apima kelios papildomos funkcijos:
- Integravimas į oficialią Teismo informacinę sistemą sklandžiam veikimui užtikrinti
- Transkribavimas realiuoju laiku su minimaliu uždelsimu
- Beryšis režimas už tikslesnį ankstesnių teismo posėdžių transkripciją
- Garsiakalbio identifikavimas per iš anksto paskirtus mikrofonus teismo posėdžių metu
- Automatinis garsiakalbio identifikavimas jei garsiakalbio balso pavyzdžiai galimi iš anksto
- Kontekstu pagrįstas transkripcijos struktūrizavimas
- Po redagavimo galimybės, įskaitant laiko žymų pridėjimą ir transkriptų koregavimą
- Įtaisytasis rašybos tikrinimas siekiant didesnio tikslumo
- Atitiktis griežti konfidencialumo standartai ir saugus nuorašų saugojimas
ASR kokybės veiksniai
„Salme“ nuorašų veiksmingumas ir kokybė priklauso nuo garso įrašo kokybė ir ASR modelio mokymas.
ASR modeliui pritaikyti reikia išsamių duomenų, tinkamų programinės įrangos kūrimo priemonių ir išsamių mokymų, kad Salme galėtų kurti aukštos kokybės transkriptus su teisinga terminija, fraze ir žargonu.
Kalbėjimo atpažinimo modelis buvo plačiai išmokytas užtikrinti labai tikslius tekstus su žodžių klaidų dažniais (WER) nuo 8 iki 15%. Tačiau šį tikslumo lygį galima pasiekti naudojant aukštos kokybės technologijas ir paeiliui kalbančius dalyvius. Rezultatai gali būti ne tokie optimalūs mažiau kontroliuojamuose klausymuose, kai visi mikrofonai įjungti ir vienu metu kalba. Be to, garso kokybė priklauso nuo įrangos gebėjimo spręsti įvairias akustines problemas, pvz., fono triukšmą.
Rezultatai
Įgyvendinus „Salme“ labai pagerėjo Estijos teismo bylų perrašymo veiksmingumas ir tikslumas.
RIK teigia: „Jei teismo posėdis rengiamas naudojant aukštos kokybės garso įrangą ir po to reikalingas žodinis stenogramas, Salme yra vertingas įrankis, padedantis taupyti laiką. Technologija visose teismo salėse nėra vienodos kokybės, o tai turi tiesioginės įtakos transkripcijos rezultatams. Naudojant aukštos kokybės garso įrangą, seanso transkripcija parengiama nedelsiant, o prireikus reikia tik potranskripcinių patikrinimų ir pataisymų. Teismų atsiliepimai buvo teigiami, nes jie prireikus gali prieiti prie sesijų duomenų, pateikti informaciją iš karto po posėdžio ir vengti rankiniu būdu įkelti rinkmenas į teismų informacinę sistemą. „
Išvada
Bendradarbiaudamos su CGI Estija ir Tilde, Estijos teismai dabar gali gauti aukštos kokybės nuorašus per kelias sekundes. Tai aiškus pavyzdys, kaip pažangių kalbėjimo atpažinimo technologijų panaudojimas gali padidinti veiksmingumą ir tikslumą ten, kur anksčiau buvo įprasta dirbti fizinį darbą.
Pats laikas įmonėms, asmenims ir viešajam sektoriui išmintingai paskirstyti savo išteklius ir perėjimas prie automatizavimo kai įmanoma, užtikrinti efektyvų laiko ir išteklių panaudojimą.
Apie CGI
CGI, įsteigta 1976 m., yra viena didžiausių nepriklausomų IT ir verslo konsultacijų paslaugų firmų pasaulyje. Turėdama 90000 konsultantų ir profesionalų visame pasaulyje, CGI teikia visą galimybių paketą – nuo strateginių IT ir verslo konsultacijų iki sistemų integravimo, valdomų IT ir verslo procesų paslaugų ir intelektinės nuosavybės sprendimų. CGI bendradarbiauja su klientais naudodama vietinį santykių modelį, kurį papildo pasaulinis pristatymo tinklas, padedantis klientams skaitmeniniu būdu transformuoti savo organizacijas ir paspartinti rezultatus. CGI 2023 m. fiskalinės pajamos, apie kurias pranešta, yra 14,30 mlrd. CA$ , o CGI akcijos įtrauktos į TSX (GIB. A) ir NYSE (GIB) sąrašus. Sužinokite daugiau apsilankę https://www.cgi.com/ee/et.