Latviešu valodas skaitļojamo leksisko resursu attīstīšana dabiskās valodas sapratnei un tekstradei
Sākums: 01/2022 Noslēgums: 12/2024
Projekta numurs
lzp-2022/1-0443
Finansējums
299 955 EUR
Projekta vadītājs
Ilze Lokmane ilze.lokmane@lu.lv
Projektu īsteno
Latvijas Universitātes Matemātikas un informātikas institūts
Zinātnes nozare
Valodniecība un literatūrzinātne; Datorzinātne un informātika
Kopsavilkums
Projekta mērķis ir attīstīt latviešu valodas skaitļojamos leksiskos resursus un valodas sapratnei un tekstradei nepieciešamos programmrīkus. Plānots paplašināt “Latviešu valodas leksisko tīklu” (Latvian WordNet) līdz plaša pārklājuma resursam, izveidot atvasinājumu un stabilu vārdu savienojumu semantikas sistēmu lielākajā atvērtajā latviešu valodas skaidrojošajā vārdnīcā Tezaurs.lv, kā arī izveidot skaitļojamu resursu daudzvalodu “Grammatical Framework” ietvarā. Izstrādāto skaitļojamo rersursu izmantošanas iespējas tiks demonstrētas ar lietojumpiemēru dabiskās valodas ģenerēšanā medicīnas nozarei. Valodnieciskā aspektā projekts iekļauj fundamentālu pētījumu par atvasinājumu semantiku un stabilu vārdu savienojumu struktūru un semantiku, savukārt datorlingvistiskā aspektā tiek attīstīta dabiskās valodas sapratne un ģenerēšana, izmantojot projekta gaitā izveidotos leksiskos resursus.
Projektu konkurss:
Fundamentālo un lietišķo pētījumu projektu 2022. gada atklātais konkurss