Projektu konkurss: Letonika latviskas un eiropeiskas sabiedrības attīstībai” 2025.-2028. gadam
Projekta nosaukums: Digitālie resursi un mākslīgā intelekta tehnoloģijas latviešu valodas ilgtspējai
- Projekta numurs
- VPP-IZM-Letonika-2025/1-0004
- Projekta īstenotājs
- Latvijas Universitātes Matemātikas un informātikas institūts (LU MII)
- Projekta vadītājs
- Ilze Auziņa, e-pasts: ilze.auzina@lumii.lv
- Projekta partneri
- Latvijas Universitāte (LU)
- Rīgas Tehniskā universitāte (RTU)
- Projekta finansējums
- 1 320 600,00 EUR
- Projekta īstenošanas periods
- 22.12.2025. – 21.12.2028.
Zinātnes nozare(s)
- Valodniecība un literatūrzinātne (Primārā nozare)
- Datorzinātne un informātika
Projekta kopsavilkums
Projekta mērķis ir nodrošināt latviešu valodas ilgtspēju digitālajā vidē, attīstot fundamentālus latviešu valodas resursus, pilnveidojot digitālās pētniecības infrastruktūru un izstrādājot inovatīvus, iekļaujošus mākslīgā intelekta risinājumus. Šajā projektā apvienojušās Latvijas vadošās valodniecības, datorlingvistikas un digitālo humanitāro zinātņu institūcijas, kuru mērķis ir radīt nozīmīgus digitālos valodas resursus latviešu un latgaliešu valodai. DigiLATE tiks izveidotas un analizētas runas atpazīšanas un sintēzes sistēmas, latviešu valodas lietojumiem tiks novērtēti lielie valodas modeļi, tiks izveidoti jauni runas, teksta un zīmju valodas korpusi, kā arī tiks pilnveidotas galvenās latviešu valodas resursu platformas Tēzaurs.lv un Korpuss.lv. Lai turpinātu mūsdienīgu valodas datu attīstību, paredzēti arī lingvistiski pētījumi par spontānās runas sintaktisko uz prosodisko marķēšanu, kā arī pētījumi, kas nodrošina latgaliešu dabiskās valodas apstrādes tehnoloģiju izstrādi latgaliešu valodai. DigiLATE inovācijas valodniecībā, MI tehnoloģijās un sabiedriskajās zinātnēs nostiprinās Latvijas pozīcijas digitālajās humanitārajās zinātnēs, studentu iesaiste veicinās mācību programmu pilnveidi, kā arī nodrošinās iekļaujošus mākslīgā intelekta risinājumus cilvēkiem ar īpašām vajadzībām. Projekta rezultāti kā atvērtie dati būs pieejami atbilstoši FAIR principiem un tiks integrēti tādās Eiropas pētniecības infrastruktūrās kā CLARIN un DARIAH.