TildeLM-i

Toetab:

Raam 3467229

Suur tehisintellekti mudel Euroopa keelte jaoks 

Me ehitame avatud asutatavat LLM-i (suur keelemudel) alaesindatud Euroopa keelte jaoks – baasi, mida saate kohandada vastavalt oma konkreetsetele vajadustele. Kohandatav, turvaline ja ülesehitatud Euroopa keeleandmetega. 

Juuni 2024

Tilde võidab
Suur AI suurväljakutse 🙌

September 2024

Juurdepääs LUMI superarvutile on saadud
Märts 2025

Näidiskoolitus
algab
 

Oktoober 2025

Mudel läheb otse-eetrisse
kallistusnägude 🎉

Teie keel väärib paremat AI-d

Enamik tehisintellekti mudeleid on loodud maailma peamiste keelte jaoks – ja üle 90% LLM-i koolitusandmetest on inglise keeles. See tähendab, et Balti, slaavi ja teised Euroopa keeled jäetakse maha, mis toob kaasa väiksema täpsuse, nõrgema kultuurilise mõistmise ja piiratud juurdepääsu kvaliteetsetele tehisintellekti vahenditele.

Me teeme selle teoks.

Seepärast töötame välja TildeLM-i – avatud lähtekoodiga suurt keelemudelit, mille parameetrid on üle 30 miljardi ja mis on loodud kõigi Euroopa keelte toetamiseks. Pärast väljalaskmist saate seda oma vajadustele vastavalt viimistleda ja turvaliselt – lokaalselt või pilves – juurutada, et luua usaldusväärne AI, mis tegelikult räägib teie keelt.
miljardit parameetrit
fokusseeritud keelt
GPU tundi LUMI-s

Miks TildeLM?

AI vundament, mida saab usaldada

Tildelm on midagi enamat kui tehnoloogiline saavutus. See on avatud lähtekoodiga sihtasutus kohandatud AI-le, millest saavad kasu üle 155 miljoni eurooplase.

Kohandatud AI-lahendused ettevõtetele ja organisatsioonidele 💼 

Kohandage TildeLM oma valdkonna, andmete ja töövoogudega – alates virtuaalassistentidest, et tagada tõlge, kõnetehnoloogia ja muu.

Riigikeele mudeli väljatöötamine valitsustele 🏛 ️

Töötada välja kaasavad keelemudelid, mis teenivad avalikke vajadusi, edendavad digitaalset suveräänsust ja toetavad kõiki ELi ametlikke keeli.

Toidab LUMI, toetab Euroopa 

TildeLM-i arengut toetab Euroopa Komisjon ja selle mootoriks on LUMI - Euroopa kiireim superarvuti. Võites Large AI Grand Challenge, meile on antud 2 miljonit GPU tundi LUMI peal selle ambitsioonika projekti teostamiseks.

Mitmekeelsesse tulevikku panustamine 

Tugeva mitmekeelse LLM-i loomiseks üle 30B parameetritega otsime keeleandmeid kogu Euroopast. Ootame autorite, kirjastajate, riigiraamatukogude ja teiste partnerite kaastööd paindlike tingimustega, mis teie jaoks sobivad. 

Andmepakkujad, mis on juba projekti panustanud

Meie lubadus

Avatud koostööle pühendumine 
Valitsusasutused saavad kasutada ära TildeLM-i kohandatud keelemudelite loomiseks, mis parandavad avalike teenuste kättesaadavust kõigile kodanikele.
Avatud juurdepääs
TildeLM on saadaval nii kaubanduslikuks kui ka mittekaubanduslikuks kasutuseks lubava litsentsi alusel, mis on avaldatud Hugging Face’i ja ELRC-SHARE’i alusel.
Terviklikkus ja turvalisus 

Garanteerime, et TildeLM on ohutu ja sellel puudub ohtlik või ebatäpne sisu, mis tagab selle usaldusväärsuse erinevate avalike kasutusjuhtumite korral.  

Teadmiste jagamine

Oleme pühendunud koostööle ja ülevaadete jagamisele, kutsudes partnereid töötama meiega TildeLM-i edasiarendamisel, et pakkuda kasu kõigile.

Püsige silmuses

Jätke meilisõnum alles, et saada teada, kui TildeLM kallistab nägu. 

Korduma kippuvad küsimused

Mis on TildeLM?
TildeLM-i projekti eesmärk on luua mitmekeelne peamine suur keelemudel, mis keskendub alaesindatud Baltimaade ja Ida-Euroopa keeltele, et pakkuda digitaalset väärtust ja parandada nende kogukondade juurdepääsu täpsematele tehisintellekti tehnoloogiatele.
Miks on keelte väärtus LLM-ides oluline?
Sellel tasakaalutusel on tõhususe ja tasu tagajärjed. Näiteks on väiksemate ressurssidega keeltes inglise keelega võrreldes vaja pikemaid jadasid sama teabehulga kodeerimiseks, mis teeb mudelid vähem tõhusaks ja nende käitamise kallimaks. Lisaks saavad nende mudelite inglise keele kesksus lisada soovimatuid kultuurilisi eelarvamusi. TildeLM treenitakse kõigi toetatud keelte jaoks väärtuse tagamiseks.
Mis keeltele TildeLM-i projekt keskendub?

Projekt keskendub Ida-Euroopa ja Baltimaade keeltele, nagu bulgaara, horvaatia, tšehhi, eesti, soome, läti, leedu, makedoonia, montenegro, poola, serbia, slovaki, sloveeni ja ukraina. Mudel toetab ka suuremaid keeli, nagu inglise, prantsuse, saksa ja vene keelt tasakaalustatud proportsioonides, et toetada tõlget ning sellega seotud mitmekeelseid ülesandeid. 

Mida tähendab „alusmudel”?
Alusmudel on suur, üldotstarbeline AI mudel, mida koolitatakse laias andmevalikus. See on baasiks spetsialiseeritud tööriistade ehitamisel, nagu sisemised virtuaalsed assistendid, juturobotid või tööstusspetsiifilised tehisintellekti rakendused. Pärast väljaõpet saab seda konkreetsete andmetega viimistleda, et sihipäraseid ülesandeid täpsemini ja usaldusväärsemalt täita.
Mis on LUMI superarvuti?
LUMI (suur ühtlustatud modernne infrastruktuur) superarvuti on viies kõige kiirem superarvuti maailmas ja kõige kiirem Euroopas. See kuulub EuroHPC ühisesse ettevõtmisesse, mis on Euroopa Liitu ja Euroopa riike hõlmav koostöö Euroopas maailmatasemel suure tõhususega arvuti (HPC) ökosüsteemi loomiseks. LUMI superarvuti asub Kajaanis, Soomes. 
Mis on Large AI Grand Challenge?
Euroopa Komisjoni rahastatava Large AI Grand Challenge’i eesmärk on laiendada Euroopa tehisintellekti piire, omastades suure tasemega tehisintellekti mudeleid. Võistluses osalejad olid uuenduslikud idufirmad ja VKE-d, millel on tehniline võimekus tehisintellekti mudelite arendamiseks, et võimendada Euroopa konkurentsivõimet generatiivses tehisintellektis. Euroopa komisjon on avaldanud Large AI Grand Challenge’i võitjad. Neli Euroopa uuenduslikku tehisintellekti ettevõtet, sealhulgas Tilde, jagavad ühe miljoni euro ja kaheksa miljoni arvutustunni väärtuses auhinda Euroopa tehisintellekti arenduse juhtimise arendamises. 
Mis on Tilde?
Tilde on juhtiv Euroopa keeletehnoloogia innovaator ja teenusepakkuja, mille eesmärk on digitaalsel ajastul keelte mitmekesisuse edendamine. Tildes on üle 150 töötaja kolmes kontoris, mis asuvad Riias, Vilniuses ja Tallinnas. Tilde uurimismeeskond koosneb üheksast doktorikraadiga isikust ja teadurist ning on avaldanud üle 260 teadusliku väljaande. Aastate jooksul on Tilde avaldanud suure T&A partnerluse võrgustiku koos EL-i juhtivate uuringukeskuste ja ülikoolidega ning toimib Baltimaade piirkonna keeletehnoloogia uuringukeskusena. Tilde kõige hiljutisemad uuringu- ja arengutegevused keskenduvad põhilistele suurtele keelemudelitele (LLM-idele), LLM-ide peenhäälestamisele allavoolu rakenduste jaoks ja juhistele vastavalt häälestatud LLM-ide integreerimisele loomuliku keele töötlemise rakendustest (nt masitõlge, virtuaalsed assistendid, otsimisega täiendatud genereerimissüsteemid, suulise keele töötlemine, kokkuvõtmine jms).