Toetavad:

AI-BOOST
AI_BOOST logo

Tildeopen LLM: Euroopa suveräänne mitmekeelne AI

Avatud lähtekoodiga, asutatav keelemudel (LLM) Euroopa keeltele – turvaline, kohandatav ja valmis valitsustele, institutsioonidele ja ettevõtetele. 

Juuni 2024

Tilde võidab
konkursi Large AI Grand Challenge 🙌

September 2024

Juurdepääs LUMI superarvutile on saadud
Märts 2025

Mudeli treenimine
algab
 

September 2025

Mudel alustab tööd
platvormil Hugging Face 🎉

Teie keel väärib paremat tehisaru

Enamik tehisarumudeleid on loodud maailmas enimkõneldud keelte jaoks ja üle 90% LLM-i koolitusandmetest on inglise keeles. See tähendab, et balti, slaavi ja teised Euroopa keeled jäetakse välja, mis toob kaasa väiksema täpsuse, nõrgema kultuurilise mõistmise ja piiratud juurdepääsu kvaliteetsetele tehisaruvahenditele.
täistipp
täpi_all

Me tegime selle teoks

Seetõttu oleme välja töötanud TildeOpen LLM – avatud lähtekoodiga suure keelemudeli, mille parameetrid on üle 30 miljardi ja mis on loodud kõigi Euroopa keelte toetamiseks. Saate seda oma vajaduste järgi viimistleda ja turvaliselt – kohalikul või pilves – juurutada, et luua usaldusväärne AI, mis tegelikult räägib teie keelt. 
Miljardiparameetrid
25 +
Fookuskeeled
28 +
GPU tundi LUMI-s
2 M

Miks TildeOpen?

veebi_llm

Tehisarul põhinev alus, mida saab usaldada

Tildeopen on midagi enamat kui tehnoloogiline saavutus. See on avatud lähtekoodiga sihtasutus kohandatud AI-le, millest saavad kasu üle 155 miljoni eurooplase.

Kohandatud tehisaruahendused ettevõtetele ja organisatsioonidele 💼 

Kohandage TildeOpen oma valdkonna, andmete ja töövoogudega – alates virtuaalassistentidest, et tagada tõlge, kõnetehnoloogia ja palju muud.

Riigikeelse mudeli väljatöötamine valitsustele 🏛 ️

Saate ehitada kaasavaid keelemudelid, mis teenivad üldsuse vajadusi, edendavad digitaalset suveräänsust ja toetavad kõiki EL-i ametlikke keeli.

Töökindel jõudlus fookuskeeltes

Tildeopen näitab järjekindlalt avalike võrdlusaluste tugevat keelelist täpsust ja arusaamist.

(MultiBLiMP)

Tildeopen järgib tugevalt MultiBLiMP võrdlusalust, mis mõõdab mudeli võimet eristada grammatilisi ja mittegrammatilisi lauseid. Väiksemad veamäärad peegeldavad tugevamat grammatika modelleerimist ja usaldusväärsemat teksti genereerimist. Saate vaadata kõiki võrdlustulemusi.
Tildeopen tagab morfoloogiarikaste Euroopa keelte suurema efektiivsuse tänu spetsiaalselt neile loodud tokeniserile ja arhitektuurile. Võrreldes LLaMA-3 on see Läti keeles 41% efektiivsem, Leedu keeles 37%, Eesti% ja Poola keeles 31 inFinnish ning 28%, ületades samal ajal ka GPT ja Mistral mudeleid. See tähendab teksti loomise kiiremat jõudlust kohalikes juurutustes ja seega väiksemaid jooksvaid kulusid sama andmehulga puhul. Saate vaadata kõiki võrdlustulemusi.
Tildeopen-30B saavutab tipptasemel tulemuse Belebele lugemismõistmise võrdlusalusega, mille keskmine täpsus on 84,7%. Mudel edestab teisi kohalikult juurutatavaid mudeleid nagu Gemma-27B, ALIA-40B ja EuroLLM-22B. Saate vaadata kõiki võrdlustulemusi.

Töötab Euroopa toetatud superarvutite jõul 

TildeOpen arengut toetab Euroopa Komisjon ja seda toetab EuroHPC ühisettevõtte tipptasemel superarvutitega LUMI ja Jupiter. Võites konkursi Large AI Grand Challenge, on meile antud 2 miljonit GPU tundi LUMI-l selle ambitsioonika projekti teostamiseks.

veebi_llm

Panus mitmekeelsesse tulevikku

Selleks, et luua tugev ja mitmekeelne LLM üle 30 miljardi parameetritega, otsime keeleandmeid kogu Euroopast. Ootame autorite, kirjastajate, riigiraamatukogude ja teiste partnerite kaastööd paindlike tingimustega, mis just teile sobivad. 
veebi_llm

Andmepakkujad, kes on juba projekti panustanud

Meie lubadus

Pühendumus avatud koostööle 🤝

Valitsused saavad kasutada TildeOpen, et luua kohandatud keelemudelid, mis parandavad avalike teenuste kättesaadavust kõigi kodanike jaoks.

Avatud juurdepääs 🔓

Tildeopen on saadaval nii kaubanduslikuks kui ka mittekaubanduslikuks kasutamiseks kõikehõlmava litsentsi alusel, mis avaldatakse kallistusnäos ja ELRC-SHARE.

Terviklikkus ja turvalisus 🛡 ️
Töötame pidevalt kahjuliku või ebatäpse sisu minimeerimise nimel TildeOpen, seega võib see olla usaldusväärne ressurss mitmesugustele avaliku kasutuse juhtumitele.
Teadmiste jagamine 📚

Oleme pühendunud koostööle ja ülevaadete jagamisele, kutsudes koostööpartnereid üles tegema meiega koostööd TildeOpen edendamisel kõigi hüvanguks.

Loo AI, mis räägib sinu keelt 

Tildeopen annab sulle vundamendi turvalise ja suveräänse AI loomiseks. Uurige mudelit kohe
või räägi meile, kuidas seda oma vajadustele kohandada.

Korduma kippuvad küsimused

Kohandatud masintõlge, mida sageli nimetatakse MT-ks, on spetsiaalne tõlkemeetod, mille puhul masintõlkemootoreid treenitakse ja kohandatakse vastavalt konkreetse ettevõtte või valdkonna erivajadustele, terminoloogiale ning keelenüanssidele.
Erinevalt üldistest masintõlketeenustest võimaldab kohandatud MT kasutajatel kohandada tõlkemootoreid vastavalt nende ainulaadsetele nõuetele, tagades täpsuse, järjepidevuse ja ühtsuse valitud terminoloogia ning kõnemaneeriga.
Projekt keskendub ida-euroopa ja balti keeltele, nagu bulgaara, horvaatia, tšehhi, eesti, soome, läti, leedu, makedoonia, montenegro, poola, serbia, slovaki, sloveeni ja ukraina. Mudel toetab ka suuremaid keeli, nagu inglise, prantsuse, saksa ja vene keelt tasakaalustatud proportsioonides, et toetada tõlget ning sellega seotud mitmekeelseid ülesandeid.
Nagu MT mootor ise, on hind kohandatud ja sõltub valitud omadustest. Võta ühendust meie müügimeeskonnaga, et arutada oma vajadusi, võimalusi ja hinnakirja.
Euroopa Komisjoni rahastatava suure AI Grand Challenge eesmärk on laiendada Euroopa AI piire, kasutades ära suuremahuliste AI mudelite potentsiaali. Konkursil osalesid innovaatilised idufirmad ja VKEd, kellel oli tehniline suutlikkus töötada välja tehisintellekti mudeleid, mis suurendavad Euroopa konkurentsivõimet tehisintellekti tekitavas tootmises. Euroopa Komisjon on välja kuulutanud suure AI Grand Challenge võitjad. Neli innovaatilist tehisintellekti tootvat ettevõtet Euroopast, sealhulgas Tilde, jagavad auhinda 1 miljon eurot ja 8 miljonit arvutustundi, et edendada Euroopa juhtpositsiooni tehisintellekti arendamisel.
Ei, kasutajad ei pea ise kohandatud masintõlkemootorit koolitama. Meie eksperdid kohandavad mootorit vastavalt kliendi vajadustele, terminoloogiale ja keelenüanssidele.