Toetavad:

Tildeopen LLM: Euroopa suveräänne mitmekeelne AI

Avatud lähtekoodiga, asutatav keelemudel (LLM) Euroopa keeltele – turvaline, kohandatav ja valmis valitsustele, institutsioonidele ja ettevõtetele. 

Juuni 2024

Tilde võidab
konkursi Large AI Grand Challenge 🙌

September 2024

Juurdepääs LUMI superarvutile on saadud
Märts 2025

Mudeli treenimine
algab
 

September 2025

Mudel alustab tööd
platvormil Hugging Face 🎉

Teie keel väärib paremat tehisaru

Enamik tehisarumudeleid on loodud maailmas enimkõneldud keelte jaoks ja üle 90% LLM-i koolitusandmetest on inglise keeles. See tähendab, et balti, slaavi ja teised Euroopa keeled jäetakse välja, mis toob kaasa väiksema täpsuse, nõrgema kultuurilise mõistmise ja piiratud juurdepääsu kvaliteetsetele tehisaruvahenditele.

Me tegime selle teoks

See on miks me "ve arendaed Tildeopen LLM avatud lähtekoodiga suur keelemudel, mille parameetrid on üle 30 miljardi ja mis on loodud kõigi Euroopa keelte toetamiseks. You purk viimistlege seda vastavalt oma vajadustele ja juurutage see turvaliselt lokaalselt või pilves luua usaldusväärne AI, mis tegelikult räägib sinu keel. 

miljardit parameetrit
fookuskeelt
GPU tundi LUMI-s

Miks TildeOpen?

Tehisarul põhinev alus, mida saab usaldada

Tildeopen on midagi enamat kui tehnoloogiline saavutus. See on avatud lähtekoodiga sihtasutus kohandatud AI-le, millest saavad kasu üle 155 miljoni eurooplase.

Kohandatud tehisaruahendused ettevõtetele ja organisatsioonidele 💼 

Kohandage TildeOpen oma valdkonna, andmete ja töövoogudega – alates virtuaalassistentidest, et tagada tõlge, kõnetehnoloogia ja palju muud.

Riigikeelse mudeli väljatöötamine valitsustele 🏛 ️

Saate ehitada kaasavaid keelemudelid, mis teenivad üldsuse vajadusi, edendavad digitaalset suveräänsust ja toetavad kõiki EL-i ametlikke keeli.

Töötab Euroopa toetatud superarvutite jõul 

TildeOpen arengut toetab Euroopa Komisjon ja seda toetab EuroHPC ühisettevõtte tipptasemel superarvutitega LUMI ja Jupiter. Võites konkursi Large AI Grand Challenge, on meile antud 2 miljonit GPU tundi LUMI-l selle ambitsioonika projekti teostamiseks. 

Panus mitmekeelsesse tulevikku

Selleks, et luua tugev ja mitmekeelne LLM üle 30 miljardi parameetritega, otsime keeleandmeid kogu Euroopast. Ootame autorite, kirjastajate, riigiraamatukogude ja teiste partnerite kaastööd paindlike tingimustega, mis just teile sobivad. 

Andmepakkujad, kes on juba projekti panustanud

Meie lubadus

Pühendumus avatud koostööle 🤝

Valitsused saavad kasutada TildeOpen, et luua kohandatud keelemudelid, mis parandavad avalike teenuste kättesaadavust kõigi kodanike jaoks.

Avatud juurdepääs 🔓

Tildeopen on saadaval nii kaubanduslikuks kui ka mittekaubanduslikuks kasutamiseks kõikehõlmava litsentsi alusel, mis avaldatakse kallistusnäos ja ELRC-SHARE.

Terviklikkus ja turvalisus 🛡 ️
Töötame pidevalt kahjuliku või ebatäpse sisu minimeerimise nimel TildeOpen, seega võib see olla usaldusväärne ressurss mitmesugustele avaliku kasutuse juhtumitele.
Teadmiste jagamine 📚

Oleme pühendunud koostööle ja ülevaadete jagamisele, kutsudes koostööpartnereid üles tegema meiega koostööd TildeOpen edendamisel kõigi hüvanguks.

Loo AI, mis räägib sinu keelt 

Tildeopen annab sulle vundamendi turvalise ja suveräänse AI loomiseks. Uurige mudelit kohe
või räägi meile, kuidas seda oma vajadustele kohandada.

Korduma kippuvad küsimused

Mis on TildeOpen LLM?

Projekti TildeOpen LLM eesmärk on luua mitmekeelne asutatav suur keelemudel, mis keskendub alaesindatud Balti ja Ida-Euroopa keeltele, et edendada digitaalset võrdsust ja parandada nende kogukondade juurdepääsu täiustatud tehisintellekti tehnoloogiatele.

Miks on keelte väärtus LLM-ides oluline?

Sellel tasakaalustamatusel on tõhusus ja kulutagajärjed. Näiteks on vaja pikemaid järjestusi, et kodeerida väiksema sissetulekuga keeltes sama palju teavet kui inglise keeles, muutes mudelid vähem tõhusamaks ja kallimaks. Lisaks võib nende mudelite ingliskeelne kesksus tuua kaasa soovimatuid kultuurilisi kõrvalekaldeid. Tildeopen koolitatakse kõigi toetatud keelte võrdsuse tagamiseks.

Millistele keeltele TildeOpen projekt keskendub?

Projekt keskendub ida-euroopa ja balti keeltele, nagu bulgaara, horvaatia, tšehhi, eesti, soome, läti, leedu, makedoonia, montenegro, poola, serbia, slovaki, sloveeni ja ukraina. Mudel toetab ka suuremaid keeli, nagu inglise, prantsuse, saksa ja vene keelt tasakaalustatud proportsioonides, et toetada tõlget ning sellega seotud mitmekeelseid ülesandeid. 

Mida tähendab „alusmudel”?
Alusmudel on suur, üldotstarbeline tehisarumudel, mida koolitatakse laias andmevalikuga. See on aluseks spetsialiseeritud tööriistade ehitamisel, nagu sisemised virtuaalsed assistendid, juturobotid või valdkonnaspetsiifilised tehisarurakendused. Pärast väljaõpet saab seda konkreetsete andmetega viimistleda, et sihipäraseid ülesandeid täpsemini ja usaldusväärsemalt täita.
Mis on LUMI superarvuti?
LUMI (Large Unified Modern Infrastructure) superarvuti on viies kõige kiirem superarvuti maailmas ja kõige kiirem Euroopas. See kuulub EuroHPC ühisettevõttesse, mis on Euroopa Liitu ja Euroopa riike hõlmav koostöö Euroopas maailmatasemel kõrgjõudlusega andmetöötluse (HPC) ökosüsteemi loomiseks. LUMI superarvuti asub Kajaanis, Soomes. 
Mis on Large AI Grand Challenge?
Euroopa Komisjoni rahastatava Large AI Grand Challenge'i eesmärk on laiendada Euroopa tehisaru piire, kasutades ära suuremahuliste tehisarumudelite potentsiaali. Väljakutses osalesid innovaatilised idufirmad ja VKEd, kellel on tehniline suutlikkus arendada tehisarumudeleid, mis suurendavad Euroopa konkurentsivõimet generatiivse tehisaru valdkonnas. Euroopa Komisjon on kuulutanud välja Large AI Grand Challenge võitjad. Neli innovaatilist Euroopa tehisarupõhist ettevõtet, sealhulgas Tilde, jagavad omavahel 1 miljoni euro suuruse auhinna ja 8 miljonit arvutitundi, et edendada Euroopa juhtpositsiooni tehisaru arendamisel. 
Mis on Tilde?
Tilde on juhtiv Euroopa keeletehnoloogia innovaator ja teenusepakkuja, mille eesmärk on digitaalsel ajastul keelte mitmekesisuse edendamine. Tildes on üle 150 töötaja kolmes kontoris, mis asuvad Riias, Vilniuses ja Tallinnas. Tilde uurimismeeskond koosneb üheksast doktorikraadiga isikust ja teadurist ning on avaldanud üle 260 teadusliku väljaande. Aastate jooksul on Tilde avaldanud suure T&A partnerluse võrgustiku koos EL-i juhtivate uuringukeskuste ja ülikoolidega ning toimib Baltimaade piirkonna keeletehnoloogia uuringukeskusena. Tilde viimased teadus- ja arendustegevused keskenduvad põhilistele suurte keelemudelite (LLM) väljatöötamisele, LLM-ide täpsustamisele järelrakenduste jaoks ning juhendite järgi häälestatud LLM-ide integreerimisele loomuliku keele töötlemise rakendustesse (nt masintõlge, virtuaalsed assistendid, otsingu abil täiustatud genereerimissüsteemid, kõnekeele töötlemine, kokkuvõtete koostamine jne).