Tildeopen LLM: Euroopa suveräänne mitmekeelne AI
Avatud lähtekoodiga, asutatav keelemudel (LLM) Euroopa keeltele – turvaline, kohandatav ja valmis valitsustele, institutsioonidele ja ettevõtetele.
Juuni 2024
Tilde võitis suure AI suure väljakutse
September 2024
Juurdepääs LUMILE
superarvuti on saadud
Märts 2025
Mudeli treenimine
algab
September 2025
Modell läheb otse kallistusnäole
Veebruar 2026
Tildeopen läks TildeMT-s
Tilde MT
Teie keel väärib paremat tehisaru
Enamik tehisarumudeleid on loodud maailmas enimkõneldud keelte jaoks ja üle 90% LLM-i koolitusandmetest on inglise keeles. See tähendab, et balti, slaavi ja teised Euroopa keeled jäetakse välja, mis toob kaasa väiksema täpsuse, nõrgema kultuurilise mõistmise ja piiratud juurdepääsu kvaliteetsetele tehisaruvahenditele.
Seetõttu oleme välja töötanud TildeOpen LLM – avatud lähtekoodiga suure keelemudeli, mille parameetrid on üle 30 miljardi ja mis on loodud kõigi Euroopa keelte toetamiseks. Saate seda oma vajaduste järgi viimistleda ja turvaliselt – kohalikul või pilves – juurutada, et luua usaldusväärne AI, mis tegelikult räägib teie keelt.
Miks TildeOpen?
- Oma andmetega kohandatav
- Turvaline ja täielikult teie kontrolli all
- Juurutatav asutusesiseselt või pilves
- Integreerub olemasolevate süsteemide ja töövoogudega
- Loodud aluseks täiustatud tehisarulahendustele
Tehisarul põhinev alus, mida saab usaldada
Tildeopen on midagi enamat kui tehnoloogiline saavutus. See on avatud lähtekoodiga sihtasutus kohandatud AI-le, millest saavad kasu üle 155 miljoni eurooplase.
Kohandatud AI-lahendused ettevõtetele ja organisatsioonidele
Kohandage TildeOpen oma valdkonna, andmete ja töövoogudega – alates virtuaalassistentidest, et tagada tõlge, kõnetehnoloogia ja palju muud.
Riigikeele mudeli väljatöötamine valitsustele
Saate ehitada kaasavaid keelemudelid, mis teenivad üldsuse vajadusi, edendavad digitaalset suveräänsust ja toetavad kõiki EL-i ametlikke keeli.
Töökindel jõudlus fookuskeeltes
Tildeopen näitab järjekindlalt avalike võrdlusaluste tugevat keelelist täpsust ja arusaamist
Tildeopen toimib tugevalt Multiblimp võrdlusalus, mis mõõdab mudeli võimet eristada grammatilisi ja ebagrammatilisi lauseid. Väiksemad veamäärad peegeldavad tugevamat grammatika modelleerimist ja usaldusväärsemat teksti genereerimist. Saate vaadata kõiki võrdlustulemusi.
Tildeopen tagab morfoloogiarikaste Euroopa keelte suurema efektiivsuse tänu spetsiaalselt neile loodud tokeniserile ja arhitektuurile. Võrreldes LLaMA-3 on see Läti keeles 41% efektiivsem, Leedu keeles 37%, Eesti% ja Poola keeles 31 inFinnish ning 28%, ületades samal ajal ka GPT ja Mistral mudeleid. See tähendab teksti loomise kiiremat jõudlust kohalikes juurutustes ja seega väiksemaid jooksvaid kulusid sama andmehulga puhul. Kuva täielikud võrdlustulemused.
Tildeopen-30B saavutab tipptasemel tulemuse Belebele lugemismõistmise võrdlusalusega, mille keskmine täpsus on 84,7%. Mudel edestab teisi kohalikult juurutatavaid mudeleid nagu Gemma-27B, ALIA-40B ja EuroLLM-22B. Kuva täielikud võrdlustulemused.
Töötab Euroopa toetatud superarvutite jõul
TildeOpen arengut toetab Euroopa Komisjon ja seda toetab EuroHPC ühisettevõtte tipptasemel superarvutitega LUMI ja Jupiter. Võites konkursi Large AI Grand Challenge, on meile antud 2 miljonit GPU tundi LUMI-l selle ambitsioonika projekti teostamiseks.
Panus mitmekeelsesse tulevikku
Kallistusnäoga alustamine
Suunduge kallistusnäole, et uurida TildeOpen-30b hoidlat ja tutvuda täieliku tehnilise dokumentatsiooniga.
Meie lubadus
Avatud koostööle pühendumine
Valitsused saavad kasutada TildeOpen, et luua kohandatud keelemudelid, mis parandavad avalike teenuste kättesaadavust kõigi kodanike jaoks.
Terviklikkus ja turvalisus
Töötame pidevalt kahjuliku või ebatäpse sisu minimeerimise nimel TildeOpen, seega võib see olla usaldusväärne ressurss mitmesugustele avaliku kasutuse juhtumitele.
Avatud juurdepääs
Tildeopen on saadaval nii kaubanduslikuks kui ka mittekaubanduslikuks kasutamiseks kõikehõlmava litsentsi alusel, mis avaldatakse kallistusnäos ja ELRC-SHARE.
Teadmiste jagamine
Oleme pühendunud koostööle ja ülevaadete jagamisele, kutsudes koostööpartnereid üles tegema meiega koostööd TildeOpen edendamisel kõigi hüvanguks.
Korduma kippuvad küsimused
Mis on TildeOpen LLM?
Miks on keelte väärtus LLM-ides oluline?
Millistele keeltele TildeOpen projekt keskendub?
Mis on LUMI superarvuti?
Mis on Large AI Grand Challenge?
Mis on Tilde?
Tilde on juhtiv Euroopa keeletehnoloogia uuendaja ja teenuseosutaja, kelle ülesanne on edendada keelelist mitmekesisust digiajastul. Tildel on üle 150 töötaja kolmes kontoris, mis asuvad Riias, Vilniuses ja Tallinnas. Tilde uurimisrühm koosneb üheksast doktorantuurist ja nende uurimispartneritest ning on loonud üle 260 teaduspublikatsiooni. Aastate jooksul on Tilde töötanud välja ulatusliku teadus - ja arendustegevuse partnerlusvõrgustiku ELi juhtivate uurimiskeskuste ja ülikoolidega ning toimib Balti regiooni keeletehnoloogia uurimiskeskusena.
Tilde viimased teadus - ja arendustegevused on keskendunud asutatavatele suurtele keelemudelitele (LLM), LLM-ide peenhäälestamisele järgnevate rakenduste jaoks ning juhendatud LLM-ide integreerimisele loomuliku keele töötlemise rakendustesse (nt masintõlge, virtuaalsed assistendid, väljavõte-liitpõlvkonna süsteemid, kõnekeele töötlemine, summeerimine jne).