„TildeLM“: DI transformacija daugiakalbei Europai
Mes kuriame „TildeLM“, atvirą pamatinį LLM (didelės kalbos modelį), kuriame yra daugiau kaip 30 mlrd. parametrų, apimančių visas Europos kalbas, daugiausia dėmesio skiriant Baltijos ir Rytų Europos kalboms. Europos Komisijos remiamas „TildeLM“ ketina iš esmės pakeisti AI kraštovaizdį ir užtikrinti, kad mūsų regionui būtų naudingos pažangiausios technologijos.
UŽDUOTIS
Pasisakome už kalbų lygybę
SPRENDIMAS
Atviro Europos modelio kūrimas
„TildeLM“ kuriamas siekiant suteikti palaikymą tokioms Europos kalboms, kaip bulgarų, latvių, ukrainiečių ir kt. Šis modelis – ne vien technologinis pasiekimas. Tai yra ir įsipareigojimas sukurti visiškai atvirą išteklių, kuris suteiks pamatą įvairioms DI panaudojimo sritims ir pravers daugiau kaip 155 milijonų europiečių.
PANAUDOJIMO IR PRITAIKYMO ATVEJAI
Galingos ir prasmingos inovacijos įvairiuose sektoriuose
Nacionalinių kalbų modeliai
Tyrimai ir plėtra
Tyrėjai gali išnaudoti „TildeLM“ kalbų tyrimams, vertimo sistemų tobulinimui ir naujų kalbos technologijų panaudojimo būdams kurti.
Technologinė inovacija
Sprendimai konkrečioms veiklos sritims
SKAIČIAVIMO IŠTEKLIAI
Pažangiausio Europos superkompiuterio teikiama pažanga
„TildeLM“ kūrimo procesą spartina LUMI superkompiuteris, kurio išteklius įmonė laimėjo konkurse „Large AI Grand Challenge“.Galime naudotis 2 milijonais milžiniškos kompiuterinės galios LUMI GPU valandų, kurios yra nepamainomos našiam šios ambicingo projekto įgyvendinimui.
MŪSŲ PAŽADAS
Įsipareigojimas neriboti bendradarbiavimo
Ištikimai laikomės atvirojo mokslo ir etiško duomenų panaudojimo principų, todėl „TildeLM“ bus visiškai nemokama. Tikime, kad inovacijos pagrindas yra bendradarbiavimas ir dalijimasis žiniomis, todėl kviečiame tyrėjus, kūrėjus ir duomenų teikėjus jungtis prie mūsų misijos.
Atvira prieiga
Vientisumas ir sauga
Indėlis į daugiakalbę ateitį
Kad sugebėtume sukurti solidų daugiakalbį kalbos modelį su daugiau kaip 30 mlrd. parametrų, mums reikės kalbos duomenų iš visos Europos. Kviečiame prisidėti autorius, leidėjus, valstybines bibliotekas ir visus, kas gali suteikti vertingo turinio lanksčiomis sąlygomis, kurios atitiktų jūsų poreikius. Šioje platformoje dalysimės naujienomis apie savo pažangą ir kviesime jus tapti šios veržlios iniciatyvos dalimi. Jūsų indėlis yra nepamainomas, siekiant užtikrinti, kad šiame skaitmeniniame amžiuje būtų išgirsta kiekviena kalba.
Jūsų dalyvavimas yra būtinas norint užtikrinti, kad skaitmeniniame amžiuje kiekviena kalba turėtų balsą.
Dažnai užduodami klausimai
Kas yra „TildeLM“?
Kuo svarbi LLM kalbų lygybė?
Kurioms kalboms bus skirytas projektas „TildeLM“?
Projektas orientuojamas į tokias Rytų Europos ir Baltijos šalių kalbas, kaip bulgarų, kroatų, čekų, estų, suomių, latvių, lietuvių, makedonų, juodkalniečių, lenkų, serbų, slovakų, slovėnų ir ukrainiečių. Modelis taip pat proporcingai palaikys didesniąsias kalbas, pvz., anglų, prancūzų, vokiečių ir rusų, kad palaikytų vertimą ir susijusias daugiakalbes užduotis.