Darba rezultātā ir izstrādāts un aprobēts fundamentāls, latviešu valodai iepriekš neeksitējošs,bijis valodas resurss – mašīnlasāms sintaktiski marķēts korpuss 17 tūkstošu teikumu apmērā. Šis resurss ir publiski pieejams gan lejuplādei, gan tiešsaistes meklēšanai vairākos veidos – tasTeikumi ir marķētsi atbilstoši diviem dažādiem sintaktiskās marķēšanas modeļiem – darba ietvarosā radītajam frāžu struktūru un atkarību gramatikas hibrīdam un starptautiski aprobētajam Universālo atkarību (Universal Dependencies, UD) modelimD modelim. Izveidotais valodas resurss publiski pieejams gan lejuplādei, gan tiešsaistes meklēšanai abos iepriekš minētajos marķējuma veidos.
2.2. Saīsinājuma izveide;
3. Vārddarināšana;
5.2. Lieka pieturzīme;
6.4. Vārdu secība;
6.5. Izteicēja izveide;
7.1. Liekvārdība;
7.3. Neiederīgs vārds;
10.1. Sekundāra: saistāmība;
4.4. Cita vārdšķira;
|