Yann LeCun, vienas iš dirbtinio intelekto (DI) pradininkų ir „Meta“ vyriausiasis DI mokslininkas, kalbėdamas apie žmogaus lygio DI, teigė, kad „tokio lygio DI nėra už kampo. Tai užtruks ilgai ir pareikalaus naujų mokslinių proveržių, apie kuriuos dar nežinome“. Visgi proveržių netrūksta – jie tiesiog vyksta tyliai. Viešojoje erdvėje daugiausia dėmesio sulaukia įspūdingi DI rezultatai, tačiau retai kalbama apie tai, kokie moksliniai atradimai slypi už jų. Tad kas naujo DI moksle šiandien ir ar artėjame prie žmogaus lygio DI sukūrimo?
Dirbtinis intelektas mokosi samprotauti
Vienas iš naujausių proveržių – vadinamasis „minčių grandinės“ (angl. chain of thought) mechanizmas. Jo esmė – ne iš karto „šauti“ atsakymą, kaip anksčiau darydavo DI, bet spręsti užduotį nuosekliai. Kaip tai atrodo praktiškai?
Įsivaizduokite: žmogus sveria X kilogramų ir nori sužinoti, kokią vaisto dozę turėtų vartoti. Anotacijoje nurodyta, kad vienam kūno svorio kilogramui tenka Y miligramų vaisto, o apskaičiuotą paros dozę reikia padalinti į tris lygias dalis ir suvartoti ryte, per pietus bei vakare. Ką darytų žmogus? Pirmiausia suskaičiuotų bendrą paros dozę, tada padalintų iš trijų. Dabar tą patį daro ir DI – jis ne pateikia iš anksto išmoktą atsakymą, bet sprendžia užduotį žingsnis po žingsnio. Tai jau – samprotavimas.
Šis principas vystomas toliau – atsirado vadinamasis „minčių medis“ (angl. tree of thought), kai nuo vienos minties gali išsiskleisti kelios alternatyvos, o DI vertina, kuri iš jų logiškai veda tikslo link. Kitaip tariant, DI išmoksta ne tik pateikti atsakymą, bet ir samprotauti – panašiai, kaip mokykloje per matematikos pamokas, kai svarbu buvo ne tik gauti rezultatą, bet ir pademonstruoti teisingą sprendimo eigą.

Kuriamas kalbai neutralus DI – viltis mažosioms kalboms
Mažosios kalbos šiandien dar negali visapusiškai išnaudoti DI potencialo, tačiau šia kryptimi dirbama aktyviai – siekiama, kad modeliai taptų kalbai neutralūs.
Buvo atliktas tyrimas, kurio metu naudotas didysis kalbos modelis, treniruotas vien su anglų kalba. Pateikus jam daniškų tekstų, modelis sugebėjo sėkmingai adaptuotis. Analizuojant pačią modelio struktūrą paaiškėjo, kad daugiausiai pakito tie parametrai, kurie buvo susiję su įvesties ir išvesties – t. y. kalbos apdorojimu. Tai reiškia, kad pačios žinios modelyje nėra nei angliškos, nei daniškos – jos kalbai neutralios. Tai primena žmogaus gebėjimą mąstyti nepriklausomai nuo kalbos: nors informaciją įgyju anglų kalba, vėliau galiu ją interpretuoti ir perteikti lietuviškai. Šiandien mokslas dar nėra iki galo perpratęs, kaip sukurti universalų nuo kalbos nepriklausomą modelį, tačiau akivaizdu, kad prie to artėjame.
Ką tai reiškia mums – mažos kalbos atstovams? Jei ši idėja bus toliau plėtojama, nebereikės kaupti milžiniškų tekstynų, treniruoti modelių ir nuolat vytis didžiųjų kalbų. DI modeliai jau turės daug kalbai neutralių žinių. Beliks juos papildyti specializuotu lietuvišku turiniu – tokiu, kurio kitomis kalbomis paprasčiausiai nėra, ir turėsime DI, kuris su lietuvių kalba veiks lygiai taip pat efektyviai kaip ir su anglų.
Nuo paskirstyto mąstymo link bendradarbiaujančių sistemų
Dar viena reikšminga DI pažangos kryptis – modelių architektūra. Vietoje vieno milžiniško, viską išmanančio modelio vis dažniau taikomas „ekspertų mišinio“ (angl. mixture of experts) principas, kurį išplėtojo „DeepSeek“. Šiandien jis naudojamas ir naujausiose pažangių kalbos modelių, tokių kaip „Grok“ ar „Llama“, versijose. Idėja paprasta, bet efektyvi: modelio viduje veikia atskiri „ekspertai“ , kurių kiekvienas specializuojasi savo srityje. Kai vartotojas užduoda klausimą, algoritmas parenka tinkamiausius ekspertus ir aktyvuoja juos konkrečiai užduočiai. Tai leidžia ne tik taupyti skaičiavimo resursus – toks veikimo principas turi akivaizdžių panašumų su tuo, kaip veikia žmogaus protas. Mūsų smegenyse skirtingos sritys atsakingos už skirtingas funkcijas: viena interpretuoja kalbą, kita apdoroja matematinį, trečia – emocinį ar kūrybinį turinį. DI raida tik dar kartą primena, kad intelektas – tai ne viena viską valdanti jėga, o daugybė skirtingų gebėjimų, kurie įgyja prasmę tik veikdami drauge.
Panaši decentralizavimo logika pasitelkiama ir kitoje DI vystymo kryptyje – agentinėse sistemose. Čia kuriamas ne vienas visažinis modelis, o tinklas, sudarytas iš specializuotų agentų, gebančių savarankiškai veikti, analizuoti, planuoti, siekti tikslo, vertinti savo sprendimus ir, kai reikia, bendradarbiauti. Įsivaizduokime žmonių-ekspertų komandą: kiekvienas išmano savo sritį, dirba individualiai arba derina veiksmus su kitais, kad pasiektų bendrą tikslą. Tokį principą perima ir agentinis DI – paskirstytas, autonomiškas intelektas, gebantis ne tik veikti, bet ir spręsti už mus. O mes, žmonės, ar jau esame tam pasiruošę?

Ne sprintas, o veidrodis: ką iš tiesų reiškia žmogaus lygio DI?
Klausimas „kada DI aplenks žmogų?“ keliamas jau nuo 1950 m., kai Alan Tiuring pirmą kartą viešai svarstė, ar mašinos gali mąstyti. Nuo tada technologijų pažanga dažnai vaizduojama kaip lenktynės: kada ateis ta diena, kai DI pralenks žmogų? Tačiau realybė sudėtingesnė. Tai ne sprintas, o nuolatinis bandymas pasivyti mūsų pačių lūkesčius, kurie keičiasi greičiau nei technologijos. Vakar mums pakako, kad DI atsakytų į el. laišką. Šiandien tikimės, kad jis suplanuos projektą, atliks užduotis, įvertins savo sprendimus. Rytoj galbūt norėsime, kad jis suprastų ne tik mūsų kalbą, bet ir emocijas. O vieną dieną – kad skaitytų mūsų mintis, intuityviai pajustų net tai, ko patys dar nesame iki galo suvokę.
Todėl žmogaus lygio DI, apie kurį kalba Yann LeCun, galbūt ir nėra „už kampo“, tačiau proveržiai, „apie kuriuos dar nežinome“, vyksta. O kiekvienas jų – ne tik žingsnis technologinės pažangos link. Tai dar vienas priminimas, kad artėjame į neapibrėžtą ateitį, kurioje pats žmogus dar tik ieško atsakymų: ko iš tiesų mes norime iš technologijų ir iš savęs pačių?
Komentarą parengė kalbos technologijų bendrovės „Tilde“ kalbos technologijų vyresnioji tyrėja ir VDU prof. Jurgita Kapočiūtė-Dzikienė.