Pagrindinis - Ar AI era „praryja“ kalbas su keletu kalbėtojų?
Ar AI era „praryja“ kalbas su keletu kalbėtojų?
Tuo metu, kai pasaulinė AI plėtra daugiausia orientuota į dideles kalbas, Baltijos kalbų technologijų bendrovė „Tilde“ sutelkia dėmesį į priešingą pusę – užtikrina, kad kalbos su nedideliu kalbančiųjų skaičiumi taip pat būtų matomos, aukštos kokybės ir konkurencingos skaitmeniniame amžiuje.
Tilde yra įsitikinusi, kad Europos kalbų gyvybingumas ai AI eroje neturi priklausyti visų pirma nuo anglų kalbos technologijų ar JAV ir Kinijos įmonių. „daugiausia dėmesio skiriame estų, latvių, lietuvių ir kitoms Europoje vartojamoms kalboms. Jei mūsų tikslas buvo pasiūlyti geresnę vertimo kokybę nei „Google Translate“ anksčiau, šiandien galime pasiekti geresnių ChatGPT ir kitų didelių kalbų modelių „, – sako įmonės generalinis direktorius Estijoje Kalle Kuusik.
Tildeopen LLM yra pamatinis modelis, specialiai sukurtas Europos kalboms
Žinoma, didelių kalbų modelių kūrimas taip pat nebuvo ignoruojamas. Taigi „Tilde“ sukūrė savo pamatinį modelį „TildeOpen LLM“, kuriuo grindžiamos konkrečios taikomosios programos, pvz., automatinis vertimas ir teksto apibendrinimas, gerinant 34 Europos kalbų vertimo kokybę įvairiausiomis remiamomis kalbomis.
Kalbant apie dažniausiai naudojamus JAV modelius, apie 90% mokymo duomenų yra anglų kalba, o tai reiškia, kad šiuo pagrindu parengti sprendimai yra labai šališki anglų kalbos atžvilgiu. Pavyzdžiui, estų kalba tai gali pasireikšti ir užsienio sakinio struktūroje, ir modelyje sukurtuose žodžiuose. Tildeopen buvo sukurtas remiantis principu, kad visoms 34 kalboms atstovaujama vienodai.
„Tilde“ stiprybė taip pat priklauso nuo jos mokslinės kompetencijos – įmonėje dirba daugiau nei dešimt kalbos technologijų ekspertų, turinčių daktaro laipsnį. „Mes esame vienintelė kompanija Baltijos šalyse, nuo pat pradžių sukūrusi naują didelės kalbos modelį“, — sako Kuusikas.
Modelio sukūrimui pritarė Europos Komisija, kuri leido naudoti LUMI superkompiuterį Suomijoje ir beveik du milijonus GPU valandų. Modelis buvo sukurtas po to, kai Europos Komisija laimėjo didelę AI Grand challenge konkurenciją.
Automatinis vertimas, kuris iš tikrųjų veikia
„Paprastai pakanka paprastų modelių, pavyzdžiui, ChatGPT, tačiau profesionalioje aplinkoje jų kokybė dažnai būna nepakankama. Mūsų stiprybė glūdi pritaikytuose modeliuose, kuriuose atsižvelgiama į įmonės terminologiją, specifiką ir stilių. Įmonės gali sukurti savo terminų žodyną arba mokyti modelį pagal ankstesnius vertimus. Visa tai labai sunku pasiekti pasaulinio masto sprendimais „, – priduria Kuusik.
Svarbu ne tik kalbinis tikslumas, bet ir techninė sprendimo kokybė. Naudodami „Tilde“ sprendimą galite būti tikri, kad vertimas išlaikys pradinį „Word“ ir PDF dokumentų formatavimą, šriftus ir maketą. Tai informacija, kuri dažnai prarandama arba sumaišoma naudojant bendruosius modelius.
Ta pati logika taikoma ir internete. „Automatinis svetainių vertimas Estijoje vis dar nėra toks paplitęs, tačiau leidžia išsaugoti turinį viena kalba ir automatiškai pasiūlyti lankytojui versiją gimtąja kalba“, — aiškina Kuusik. Tai daro tiesioginį poveikį verslui, nes žmonės labiau pasitiki turiniu savo gimtąja kalba, o tai didina pirkimo tikimybę.
„Net kibernetiniai nusikaltėliai ir sukčiautojai supranta, kad bendraujant su žmonėmis jų gimtąja kalba sukčiavimas tampa sėkmingesnis. Jų atveju, žinoma, šių žingsnių negalima toleruoti. „
Paslaugų teikėjo patikimumas ir duomenų kontrolė
Sparčiai besikeičiančiame pasaulyje duomenų saugumas taip pat tampa vis svarbesnis. „JAV ar Kinijos paslaugų teikėjų atveju bendrovės iš tikrųjų nekontroliuoja savo duomenų, bet mes esame čia, vietos bendrovėje, kuri prisiima aiškią atsakomybę už informacijos valdymą“, – sako Kuusik.
Žinojimas, kad informacija nepalieka Europos, ypač svarbus viešajam sektoriui ir organizacijoms, dirbančioms su slapta informacija. „Sprendimas buvo parengtas pagal Europos Sąjungos dirbtinio intelekto aktą ir yra platesnio tikslo išlaikyti kritinių technologijų kontrolę Europoje dalis“, – priduria Kuusik.
Vartotojas taip pat gali įdiegti automatinio vertimo platformą savo IT infrastruktūroje, kurioje visi duomenys visiškai kontroliuojami. Šią galimybę siūlo nedaug paslaugų teikėjų. Nors iki šiol vyraujantis požiūris buvo perkelti visas paslaugas į debesiją, daugeliui klientų vienintelis priimtinas sprendimas yra jų IT infrastruktūra.
Europinis sprendimas
„Mūsų tikslas – pasiūlyti sprendimus, kurie tikrai veiktų profesionalioje aplinkoje ir duotų patikimų rezultatų. Kaip minėjau, tai labai svarbu, ypač kalboms, kuriose yra nedaug kalbėtojų „, – pabrėžia Kuusik.
Tai suteiks Europos įmonėms ir institucijoms realią alternatyvą visuotiniams PG sprendimams: saugūs, pritaikomi ir jautrūs vietos kalbų niuansams.
„Tilde“ jau daugiau kaip dešimt metų nuodugniai dirba kalbos technologijų srityje. Šiandien įmonė daugiausia dėmesio skiria mašininiam vertimui, kalbos technologijoms (transkripcijai ir kalbos sintezei), dirbtinio intelekto padėjėjams ir pokalbių robotams.
Straipsnis iš pradžių buvo paskelbtas aripaev.ee
Įdomu, kaip jūsų organizacijoje įdiegti PG?
Susisiekite su mumis šiandien ir sužinokite, kaip mūsų sprendimai gali pagerinti jūsų darbo eigą


