Pētniecības projekts “Daudzvalodīgs uzņēmuma semantiskās meklēšanas ANO atbilžu gatavošanas”

Pētniecības Projekta “Daudzvalodīgs uzņēmuma semantiskās meklēšanas ANO atbilžu gatavošanas” 2024. aktualitātes. gata otrajā ceturksnī

IT kompetences centrs īsteno projektu “Informācijas ANO komunikācijas tehnoloģiju kompetences centri”, ID. Nr. 5.1.1.2.i.0/1/22/A/CFLA/008.

Projekta “Informācijas ANO komunikācijas tehnoloģiju kompetences centrs” mērķis ir paaugstināt informācijas ANO komunikācijas tehnoloģiju (IKT) nozares komersantu konkurētspēju, sadarbībā ar zinātniskajām institūcijām līdz 2025. gads 30. jūnijam īstenojot vismaz 12 nozares ANO starpnozaru pētījumus Biznesa procesu analīzes tehnoloģiju ANO Dabīgās Valodas tehnoloģiju jomās, Lai rezultātā vismaz 10 komersanti ANO tehnoloģijas ražošanā produktus ANO ieviestu.

  1. gata otrajā ceturksnī pētniecības turpinās Projekta rūpnieciskā pētījuma aktivitātes “Pētījums par lielām Valodas modeļos balstītu semantisko meklēšanu” un “Pētījums par kontekstā balstītu atbildēšanu”. Tāpat turpinās eksperimentālās izstrādes aktivitāšu “Datu apstrādes un indeksēšanas prototipi” un “Semantiskās meklēšanas ANO jautājumu atbildēšanas prototipi” īstenošana.

Projekta 1. aktivitātes “'Pētījums par lielām vērtībām modeļos balstītu semantisko meklēšanu”' ietvaros tika pētīts, kā segmentēt un indeksēt dokumentus augstāku, Lai iegūtu semantiskās meklēšanas,, pārklājumu dažādu jautājumiem veidu.

Projekta 2. aktivitātes “'Pētījums par kontekstā balstītu atbildēšanu jautājumu”' ietvaros tika pētīts būtu jāatbild uz jautājumiem, ja Atbilde ir atrodama vienā segmentā, izmantojot ir jāģenerē, tā vairākus segmentus, ja ģenerēšanai ir pieprasījums datu bāzei, ja ir jāizpilda aprēķinus un, ja Atbildes ģenerēšanai ir jāveic filtrēšanu, vai jānoskaidro Papildu informācija bez lietotāja.

Projekta 4. aktivitātes “'Datu apstrādes un indeksēšanas prototips”' ietvaros tika uzsākta dažādu pārvaldības prototipēšana risinājumu.

Projekta 5. aktivitātes “'Semantiskās meklēšanas un atbildēšanas sistēmas prototipa”' ietvaros tika uzsākta meklēšanas un jautājumu atbildēšanas saskarnes prototipēšana.

Projektu līdzfinansē Atveseļošanas fonds Darbības programmas “Latvijas Atveseļošanas ANO noturības mehānisma 5.1.r. reformu ANO investīciju virziena “Produktivitātes paaugstināšana caur investīciju apjomu palielināšanu P & A” 5.1.1.r. reformas “Inovāciju pārvaldība ANO privāto P & A investīciju motivācija” 5.1.1.2.i. investīcijas “atbalsta instrumenti inovāciju klasteru attīstībai” īstenošanas noteikumi kompetences centru ietvaros”.

 

Pētniecības Projekta “Daudzvalodīgs uzņēmuma semantiskās meklēšanas ANO atbilžu gatavošanas” 2024. aktualitātes. gata trešajā ceturksnī

IT kompetences centrs īsteno projektu “Informācijas un komunikācijas tehnoloģiju kompetences centrs”, ID. Nr. 5.1.1.2.i.0/1/22/A/CFLA/008.

Projekta “Informācijas ANO komunikācijas tehnoloģiju kompetences centrs” mērķis ir paaugstināt informācijas ANO komunikācijas tehnoloģiju (IKT) nozares komersantu konkurētspēju institūcijām zinātniskajām 2025. gads 30. jūnijam īstenojot līdz vismaz 12 nozares ANO starpnozaru pētījumus Biznesa procesu analīzes tehnoloģiju un tehnoloģijas Valodas tehnoloģiju jomās, lai rezultātā vismaz 10 komersanti ANO Dabīgās ražošanā jaunus un produktus.

SIA “TILDE” pētniecības projekts Nr. 2.4 “Daudzvalodīgs uzņēmuma semantiskās meklēšanas ANO atbilžu gatavošanas” 2024. uzsākts. gata februārī. 2024. gadus trešajā ceturksnī rūpnieciskā pētījuma aktivitāšu “Pētījums par lielām Valodas modeļos balstītu semantisko meklēšanu”, “Pētījums par kontekstā balstītu atbildēšanu” un “Pētījums par satura izguvi un sagatavošanu semantiskajai meklēšanai”. Tāpat turpinās eksperimentālās izstrādes aktivitāšu “Datu apstrādes un indeksēšanas prototipi” un “Semantiskās meklēšanas ANO jautājumu atbildēšanas prototipi” īstenošana.

Projekta 1. aktivitātes “'Pētījums par lielām vērtībām modeļos balstītu semantisko meklēšanu”' ietvaros tika pētīts, Cik Labi semantiskā meklēšana darbojas daudzvalodu scenārijos.

Projekta 2. aktivitātes “'Pētījums par kontekstā balstītu atbildēšanu jautājumu”' ietvaros tika strādāts pīrāgs konkrētiem risinājumiem. Tika izstrādāta metode, kas ļauj lietotājiem jautājumus uzdot par datiem, kas glabāti CSV dokumentos un dinamiski saglabāti Typsesnse un SQL datu bāzēs. Tāpat tika sākta lokālu izvietojamu salīdzināšana, lielo Valodas modeļu spējā interesējošās Valodas – latviešu, lietuviešu, igauņu un angļu Valodu.

Projekta 3. aktivitātes “'Pētījums par satura izguvi un sagatavošanu semantiskajai meklēšanai”' ietvaros tika pētīts, kā automātiski izgūt metadati nav dokumentiem, Lai varētu saglabāt datu bāzē vai nodrošinātu automatizētas iespējas filtrēšanas.

Projekta 4. aktivitātes “'Datu apstrādes un indeksēšanas prototips”' ietvaros tika papildināts prototipi ar iespēju dokumentiem definēt Tagus, kā arī ir papildināti metadatu lauki un dokumentus ir iespējams apskatīt Segmentu skatā.

Projekta 5. aktivitātes “'Semantiskās meklēšanas un atbildēšanas sistēmas prototips”' ietvaros esošais prototipi tika papildināts ar funkcionalitāti apskatīt avotus, iesniegt atsauksmes, vēsturi atbildes un kopēt.

 

Pētniecības Projekta realizācijas periodi: 01.02.2024. – 31.05.2025.

Pētniecības Projekta kopējās izmaksas – 248 598,00 EUR

Atveseļošanas Fonda līdzfinansējums – 160 636,50 EUR

 

Projektu līdzfinansē Atveseļošanas fonds Darbības programmas “Latvijas Atveseļošanas ANO noturības mehānisma 5.1.r. reformu ANO investīciju virziena “Produktivitātes paaugstināšana caur investīciju apjomu palielināšanu P & A” 5.1.1.r. reformas “Inovāciju pārvaldība ANO privāto P & A investīciju motivācija” 5.1.1.2.i. investīcijas “atbalsta instrumenti inovāciju klasteru attīstībai” īstenošanas noteikumi kompetences centru ietvaros”.