TildeLM: MI transformācija daudzvalodu Eiropai
Mēs izstrādājam TildeLM — atvērtā koda fundamentālo LVM (lielo valodas modeli) ar vairāk nekā 30 miljardiem parametru, kas aptver visas Eiropas valodas, galveno uzmanību pievēršot Baltijas un Austrumeiropas valodām. Ar Eiropas Komisijas atbalstu TildeLM revolucionizēs MI ekosistēmu, nodrošinot labumu mūsu reģionam, ko sniedz progresīvas tehnoloģijas.
IZAICINĀJUMS
Iestājamies par valodu vienlīdzību
RISINĀJUMS
Veidojam atvērtu modeli Eiropai
TildeLM tiek izstrādāts, lai pārstāvētu dažādas Eiropas valodas, tostarp bulgāru, latviešu, ukraiņu un citas. Šis modelis nav tikai kārtējais tehnoloģiskais sasniegums — tas nozīmē apņemšanos izveidot resursu, kas ir pilnībā atvērts un kalpo par pamatu visdažādākajiem MI lietojuma veidiem, lai sniegtu labumu vairāk nekā 155 miljoniem eiropiešu.
LIETOŠANAS IESPĒJAS UN JOMAS
Virzām nozīmīgas inovācijas nozarēs
Nacionālie valodu modeļi
Pētniecība un izstrāde
Pētnieki var izmantot TildeLM, lai pētītu valodas, uzlabotu tulkošanas sistēmas un veidotu vēl nebijušas valodu tehnoloģiju lietojuma iespējas.
Tehnoloģiskās inovācijas
Risinājumi dažādām nozarēm
DATOŠANAS RESURSI
Izcilība, ko nodrošina Eiropā modernākais superdators
TildeLM izstrādi paātrina superdators LUMI, un iespēja to izmantot tika iegūta konkursā Large AI Grand Challenge.Mūsu rīcībā ir 2 miljoni grafiskā procesora darba stundu, un LUMI milzīgā datošanas jauda ir ārkārtīgi svarīga efektīvai šī ambiciozā projekta īstenošanai.
MŪSU SOLĪJUMS
Apņemamies nodrošināt atvērtu sadarbību
Mēs ievērojam atvērtās zinātnes principus un nodrošinām ētisku datu apstrādi, lai TildeLM būtu brīvi pieejams. Mēs ticam, ka sadarbība un kopīgas zināšanas ir īstais ceļš pretī inovācijām, un mēs aicinām pētniekus, izstrādātājus un datu pakalpojumu sniedzējus pievienoties mums šajā uzdevumā.
Atvērta piekļuve
Integritāte un drošība
Sniedziet savu ieguldījumu daudzvalodu nākotnē
Lai izveidotu stabilu daudzvalodu modeli ar vairāk nekā 30 miljardiem parametru, mums ir nepieciešami valodu dati no visas Eiropas. Mēs aicinām iesaistīties autorus, izdevējus, valstu bibliotēkas un ikvienu citu, kas var sniegt vērtīgu saturu, ievērojot elastīgus noteikumus atbilstoši iesniedzēja vajadzībām. Šajā platformā mēs dalāmies ar informāciju par projekta virzību un aicinām jūs kļūt par daļu no šīs revulucionārās iniciatīvas.
Jūsu iesaistīšanās ir ļoti svarīga, lai digitālajā laikmetā varētu skanēt ikviena valoda.
Bieži uzdotie jautājumi
Kas ir TildeLM?
Kāpēc lielajos valodas modeļos ir svarīga valodu vienlīdzība?
Uz kādām valodām koncentrējas TildeLM projekts?
Projekta mērķa valodas ir Austrumeiropas un Baltijas valstu valodas, piemēram, bulgāru, horvātu, čehu, igauņu, somu, latviešu, lietuviešu, maķedoniešu, melnkalniešu, poļu, serbu, slovāku, slovēņu un ukraiņu. Modelis līdzvērtīgās proporcijās atbalstīs arī lielākas valodas, piemēram, angļu, franču, vācu un krievu, lai nodrošinātu tulkošanu un ar to saistītos daudzvalodu uzdevumus.