Fundamentālo un lietišķo pētījumu projekti (FLPP) logo

Latviešu valodas morfēmu un vārddarināšanas modeļu datubāze

Sākums: 01/2022  Noslēgums: 12/2024

Projekta numurs

lzp-2022/1-0013

Finansējums

300 000 EUR

Projekta vadītājs

Andra Kalnača    andra.kalnaca@lu.lv

Projektu īsteno

Latvijas Universitāte

Zinātnes nozare

Valodniecība un literatūrzinātne

Kopsavilkums

Projekta mērķis ir izveidot digitālu pamatresursu (datubāzi) ar vispusīgiem strukturētiem datiem par mūsdienu latviešu valodas vārddarināšanas sistēmas likumībām. Datubāze, tās veidošanā izmantojot kvalitatīvas un kvantitatīvas  metodes, būs 1) apjomīgs teorētisks un praktisks pētījums mūsdienu latviešu valodas vārddarināšanas jomā, 2) pamats turpmākiem zinātniskiem pētījumiem vārddarināšanas jomā, kurā šobrīd trūkst digitālu lingvistisko resursu, kā arī noderīgs instruments automatizētas valodas apstrādes risinājumu izstrādātājiem, latviešu valodas skolotājiem un valodas apguvējiem. Projekts dos arī būtisku ieguldījumu latviešu valodas pētniecībā kopumā, jo bez vispusīga vārddarināšanas sistēmas modeļa nav iespējama pilnvērtīga izpratne par pārējām valodas apakšsistēmām (gramatiku, leksiku, pragmatiku, semantiku).

Datubāzei paredzētas divas sadaļas: 1) anotēts latviešu valodas vārddarināšanas morfēmu (sakņu, afiksu un klasiskās cilmes vārddaļu) saraksts, 2) alfabētiski pēc saknēm sakārtotas radniecīgu vārdu grupas, kur katram sekundāram un/vai saliktam vārdam fiksēta tā morfēmiskā un vārddarināšanas struktūra. Datubāzes kodols (radniecīgu vārdu grupu saraksts) tiks veidots, balstoties uz Līdzsvarotajā mūsdienu latviešu valodas tekstu korpusā iekļautajiem vārdiem.

Paredzamie projekta rezultāti: internetā (repozitorijā) publicēta brīvpieejas datubāze; latviešu valodas vārddarināšanas modeļu un morfēmu vārdnīca; zinātniski raksti (SCOPUS/WOS), rakstu krājums (SCOPUS).

Projektu konkurss:

Fundamentālo un lietišķo pētījumu projektu 2022. gada atklātais konkurss