Mēs visi esam pieraduši pie valodu tehnoloģijām, kas palīdz mums ikdienas aktivitātēs, bet kā ir ar tiem laikiem, kad tās neizdodas? Šajā bloga rakstā mūsu galvenais AI virsnieks Mārcis Pinnis skaidro, kā mēs attīstām valodas tehnoloģijas, kāpēc tās reizēm cīnās, un iemeslus, kāpēc tā notiek.
Bet vispirms … kas ir valodu tehnoloģijas?
Valodas tehnoloģija ir jebkurš risinājums, kas analizē, producē, modificē vai reaģē uz cilvēka tekstiem un runu. Ja tev ir viedtālrunis vai dators, tad izmanto valodas tehnoloģijas. Visos mūsu modernajos sīkrīkos ir valodu tehnoloģijas, kas palīdz mums ātrāk piekļūt informācijai vai būt produktīvākiem. Piemēram, viedtālruņiem ir valodas tehnoloģiju iespējas, lai atpazīstiet savu runu, veikt dokumentu vai meklēšanu tīmeklī, veikt optisko rakstzīmju atpazīšanu (jeb citiem vārdiem – atpazīt tekstu digitālā attēlā) u.c.
Kā attīstīt valodu tehnoloģijas?
Pirmkārt, mums ir iegūstiet piekļuvi valodas datiem, ko varam izmantot modeļu apmācībai. Bez datiem mēs, iespējams, neko nevaram attīstīt. Vienkārši sakot, valodas dati var būt jebkurš dokuments, kas satur tekstu, vai jebkurš audio vai video fails, kas satur runu.
Kad mums būs savi valodas dati, nākamais solis ir modeļu trenēšana, izmantojot it. Mūsdienās lielākā daļa valodas tehnoloģiju tiek attīstītas, izmantojot mašīnmācīšanos un mākslīgos neironu tīklus. Piemēram, mūsu mašīntulkošanas sistēmas tiek apmācīti, izmantojot uz transformatoriem balstītus kodētāja-dekodētāja modeļus no nulles. Mūsu nosauktie entītiju atpazīšanas, noskaņojuma analīzes un nolūka noteikšanas modeļi tiek apmācīti ar precizējošiem Foundation modeļiem specifiskiem pakārtotiem uzdevumiem.
Un visbeidzot, mēs izvietojam modeļus lietošanai. Atkarībā no klientu prasībām modeļus var izvietot lokālajā infrastruktūrā vai mākonī un padarīt pieejamus, izmantojot API, trešās puses rīku spraudņus vai pielāgotus lietotāja interfeisus. Piemēram, mūsu mašīntulkošanas sistēmas ir pieejamas mūsu klientiem dažādos datorizētos tulkošanas rīkos, izmantojot spraudņus, translate.tilde.com platforma, kas ļauj lietotājiem tulkot teksta fragmentus, dokumentus un tīmekļa lapas, un nodrošina vienkāršu tiešsaistes datorizētu tulkošanas rīku, ko var viegli izmantot personas, kas nav iesaistītas tulkošanas nozarē; tai var piekļūt arī, izmantojot API.
Valoda nav konstanta
Problēma, kas rodas ar šo procesu, ir tā, ka kad modelis ir apmācīts, tas jau sāk novecot, jo nebūs redzējis nekādus aktuālos un nākotnes datus. Visi, kas lietojuši ChatGPT, droši vien ir saskārušies ar atrunu, ka tas par datiem zina tikai līdz 2021. gadam (vai jaunākajos modeļos līdz 2023. gada aprīlim). Modelis nav atjaunināts pašreizējā valodas lietojumā.