Atbalsta:

MĀKSLĪGĀ INTELEKTA PASTIPRINĀŠANA
AI_BOOST logotips

TildeOpen LLM: suverēns Eiropas daudzvalodu MI

Atvērtā pirmkoda, pamata LVM (lielais valodas modelis) Eiropas valodām – drošs, pielāgojams un gatavs darbam valdībās, iestādēs un uzņēmumos. 

2024. gada jūnijs

Tilde uzvar
Large AI Grand Challenge 🙌

2024. gada septembris

Iegūta piekļuve LUMI superdatoram
2025. gada marts

Sākas
modeļa apmācība
 

2025. gada septembris

Modelis tiek publicēts
platformā Hugging Face 🎉

Mūsu valoda ir pelnījusi labāku MI

Lielākā daļa MI modeļu ir veidoti pasaules lielākajām valodām — un vairāk nekā 90% LVM mācību datu ir angļu valodā. Tas nozīmē, ka baltu, slāvu un citas Eiropas valodas atpaliek, kas noved pie zemākas precizitātes, vājākas kultūras izpratnes un ierobežotas piekļuves kvalitatīviem MI rīkiem.
bultiņa _ augšā
bultiņa _ apakšā

Mēs to esam panākuši

Tāpēc mēs izstrādājām TildeOpen LLM — atvērtā pirmkoda lielo valodas pamatmodeli ar vairāk nekā 30 miljardiem parametru, kas izveidots visu Eiropas valodu atbalstam. Pielāgojiet modeli savām vajadzībām un droši izvietojiet — lokāli vai mākonī —, lai veidotu uzticamu MI, kas tiešām runā jūsu valodā. 
Miljardi parametru
25 +
Fokusa valodas
28 +
LUMI GPU stundas
2 M

Kāpēc TildeOpen?

web_llm

MI pamats, kam var uzticēties

TildeOpen ir vairāk nekā tehnoloģisks sasniegums. Tas ir atvērtā pirmkoda pamats pielāgotam mākslīgajam intelektam, kurš var sniegt labumu vairāk nekā 155 miljoniem eiropiešu.

Pielāgoti MI risinājumi uzņēmumiem un organizācijām 💼 

Pielāgojiet TildeOpen savai nozarei, datiem un darbplūsmām — no virtuālajiem palīgiem līdz drošai tulkošanai, runas tehnoloģijām un daudz kam citam.

Valsts valodas modeļa izstrāde valdībām 🏛 ️

Veidojiet iekļaujošus valodas modeļus, kas kalpo sabiedrības vajadzībām, veicina digitālo suverenitāti un atbalsta visas oficiālās ES valodas.

Uzticama veiktspēja visās fokusa valodās

Tildeopen konsekventi demonstrē spēcīgu lingvistisko precizitāti un izpratni publiskajos etalonos.

(MultiBLiMP)

Tildeopen spēcīgi darbojas ar MultiBLiMP etalonu, kas mēra modeļa spēju atšķirt gramatiskos un negramatiskos teikumus. Zemāks kļūdu īpatsvars atspoguļo stingrāku gramatikas modelēšanu un uzticamāku teksta ģenerēšanu. Skatiet pilnus etalonu rezultātus.
Tildeopen nodrošina augstāku efektivitāti ar morfoloģiju bagātās Eiropas valodās, pateicoties marķierim un arhitektūrai, kas īpaši izstrādāta šīm valodām. Salīdzinot ar Llama-3, tas ir 41% efektīvāks latviešu valodā, 37% - lietuviešu valodā, 31% - somu valodā un 28% - igauņu un poļu valodā, vienlaikus pārspējot arī GPT un Mistral modeļus. Tas nozīmē ātrāku teksta ģenerēšanas veiktspēju lokālajos izvietojumos un līdz ar to zemākas darbības izmaksas par tādu pašu datu apjomu. Skatiet pilnus etalonu rezultātus.
Tildeopen-30B sasniedz vismodernāko rezultātu Belebele lasīšanas izpratnes etalonā ar vidējo precizitāti 84,7%. Modelis pārspēj citus lokāli izvietojamus modeļus, piemēram, Gemma-27B, ALIA-40B un EuroLLM-22B. Skatiet pilnus etalonu rezultātus.

Darbību nodrošina superdatori, ko atbalsta Eiropa 

TildeOpen attīstību atbalsta Eiropas Komisija, un to nodrošina Kopuzņēmuma EuroHPC augstākā līmeņa superdatori — LUMI un Jupiters. Uzvarot Large AI Grand Challenge, mums ir piešķirti 2 miljoni GPU stundu darbam ar LUMI, lai realizētu šo vērienīgo projektu.

web_llm

Sniedziet savu ieguldījumu daudzvalodu nākotnē

Lai izveidotu spēcīgu daudzvalodu LVM ar vairāk nekā 30 miljardiem parametru, mēs meklējam valodu datus no visas Eiropas. Mēs atzinīgi vērtējam autoru, izdevēju, valsts bibliotēku un citu partneru ieguldījumu, piedāvājot elastīgus nosacījumus. 
web_llm

Datu pakalpojumu sniedzēji, kas jau ir iesaistījušies šajā projektā

Mūsu solījums

Esam atvērti sadarbībai 🤝

Valdības var izmantot TildeOpen, lai izveidotu pielāgotus valodas modeļus, kas uzlabo piekļuvi sabiedriskajiem pakalpojumiem visiem iedzīvotājiem.

Atvērta piekļuve 🔓

TildeOpen būs pieejams gan komerciālai, gan nekomerciālai lietošanai saskaņā ar liberālu licenci, kas tiks publicēta platformā Hugging Face un ELRC-SHARE.

Integritāte un drošība 🛡 ️
Mēs nepārtraukti strādājam pie kaitīga vai neprecīza satura samazināšanas programmā TildeOpen, lai tas varētu būt uzticams resurss dažādiem publiskās lietošanas gadījumiem.
Zināšanu apmaiņa 📚

Mēs esam apņēmušies sadarboties un dalīties ar ieskatiem, aicinot partnerus sadarboties ar mums TildeOpen attīstībā visu labā.

Veidojiet MI, kas runā jūsu valodā 

TildeOpen sniedz pamatu droša un suverēna MI radīšanai. Izpētiet modeli tūlīt
vai runājiet ar mums par modeļa pielāgošanu jūsu vajadzībām.

Bieži uzdotie jautājumi

Pielāgota mašīntulkošana, ko bieži dēvē par MT, ir specializēta tulkošanas pieeja, kurā mašīntulkošanas programmas tiek apmācītas un pielāgotas konkrētā uzņēmuma vai nozares specifiskajām vajadzībām, terminoloģijai un valodas niansēm.
Atšķirībā no vispārīgiem mašīntulkošanas pakalpojumiem pielāgota MT ļauj lietotājiem pielāgot tulkošanas programmas atbilstoši savām unikālajām vajadzībām, nodrošinot pareizumu, konsekvenci, kā arī izvēlētās terminoloģijas un valodas stila izmantošanu.
Projekta mērķa valodas ir Austrumeiropas un Baltijas valstu valodas, piemēram, bulgāru, horvātu, čehu, igauņu, somu, latviešu, lietuviešu, maķedoniešu, melnkalniešu, poļu, serbu, slovāku, slovēņu un ukraiņu. Modelis līdzvērtīgās proporcijās atbalstīs arī lielākas valodas, piemēram, angļu, franču, vācu un krievu, lai nodrošinātu tulkošanu un ar to saistītos daudzvalodu uzdevumus.
Tāpat kā pati MT programma, arī cena tiek pielāgota un ir atkarīga no izvēlētajām funkcijām. Sazinieties ar mūsu pārdošanas komandu, lai apspriestu jūsu vajadzības, iespējas un cenas.
Lielā AI lielā izaicinājuma, ko finansē Eiropas Komisija, mērķis ir paplašināt Eiropas AI robežas, izmantojot liela mēroga AI modeļu potenciālu. Konkursa dalībnieki bija inovatīvi jaunuzņēmumi un MVU ar tehnisko spēju izstrādāt mākslīgā intelekta modeļus, kas palielina Eiropas konkurētspēju ģeneratīvā mākslīgā intelekta jomā. Eiropas Komisija ir paziņojusi par lielā AI lielā izaicinājuma uzvarētājiem. Četri inovatīvi AI uzņēmumi no Eiropas, tostarp Tilde, saņems balvu 1 miljona eiro un 8 miljonu skaitļošanas stundu apmērā, lai veicinātu Eiropas vadošo lomu AI izstrādē.
Nē, lietotājiem pašiem nav jāapmāca pielāgotā mašīntulkošanas programma. Mūsu speciālisti pielāgos dzinēju atbilstoši klienta vajadzībām, terminoloģijai un valodas niansēm.