Darba rezultātā ir izstrādāts un aprobēts fundamentāls, latviešu valodai iepriekš ne 2.2. Saīsinājuma izveide; 3. Vārddarināšana; 5.2. Lieka pieturzīme; 6.4. Vārdu secība; 6.5. Izteicēja izveide; 7.1. Liekvārdība; 7.3. Neiederīgs vārds; 10.1. Sekundāra: saistāmība; 4.4. Cita vārdšķira; |
Tās pamatuzdevums ir automātiska strukturētas, mašīnlasāmas un mašīnai interpretējamas informācijas izgūšana no dabiskās valodas, kā arī mašīnlasāmas informācijas (datu) atainošana ar dabiskās valodas līdzekļiem, tādējādi centrālie datorlingvistikas aspekti ir valodas analīze ( 7.3. Neiederīgs vārds; |
Valodas apstrādi gan valodniecībā, gan datorlingvistikā mēdz aplūkot kā vairāklīmeņu uzdevumu (sk. 1.a attēl 1. Tehniskais noformējums; |
Valodas apstrāde un analīze Daudzas mūsdien 6.5. Izteicēja izveide; 7.1. Liekvārdība; 10.1. Sekundāra: saistāmība; |
Piemēram, mūsdienās populāro virtuālo asistentu (Siri, Alexa 5.2. Lieka pieturzīme; 7.1. Liekvārdība; 10.1. Sekundāra: saistāmība; |
Viena no pieejām ir veikt analīzi soli pa solim: sākt ar zemākā līmeņa, t.i., morfoloģisko, analīzi, turpināt ar sintaktisko analīzi, kas balstās morfoloģiskajā analīzē, utt., līdz sasniegts vēlamais analīzes 6.2. Savrupinājumi; 7.2. Mazvārdība; 7.3. Neiederīgs vārds; |
Otra pieeja ir uzreiz risināt galaproblēmu, neveicot tiešu, pilnu zemāko līmeņu analīzi. 7.1. Liekvārdība; |
Piemēram, atslēgvārdu saraksti vai to jēdzientelpas vektori (angl. word embeddings) var būt pietiekams risinājums teksta klasifi 3. Vārddarināšana; 6.5. Izteicēja izveide; 7.2. Mazvārdība; |
3. Vārddarināšana; 7.3. Neiederīgs vārds; 10.1. Sekundāra: saistāmība; |
Tādējādi plaša pārklājuma zemāka līmeņa risinājumu izstrāde ir fundamentāls ieguldījums tālākā augstāka līmeņu problēmu risināšan 6.1. Saistāmība; |
Promocijas darbā veiktais pētījums un tā rezultāti orientēti uz teksta analīzi soli pa solim, t.i., pēc pirmās pieejas.
7.2. Mazvārdība; |
Nākamajā, sintakses, līmenī tiek apskatīti vārdu – teikuma elementu – 6.4. Vārdu secība; 7.1. Liekvārdība; |
Eksistēja arī pētījumi, kas veltīti specifiskām problēmām, piemēram, pareizrakstības pārbaudei (Deksne, Skadiņš, 2011) vai ierobežot 4.3. Īpašības vārds; |
Promocijas darbā sekmīgi attīstītās sintakses līmeņa tehnoloģijas, it īpaši 1. Tehniskais noformējums; 2.3. Sākumburti; 6.4. Vārdu secība; 7.1. Liekvārdība; 7.2. Mazvārdība; |
Sintaktiski marķētais korpuss, kas publiski pieejams divos 6.6. Dalījums teikumos; 7.3. Neiederīgs vārds; |
Latviešu valodai tiek aprobēts plaši izmantots starptautisks standarts 8. Tekstveide; |
Pētījuma mērķi un uzdevumi Pētījuma vispārīgais mērķis ir uzsākt jaunu 6.4. Vārdu secība; |
Latviešu valodas parsēšanas modulis ir apmācīts, izmantojot 3985 tekstvienības lielu korpusu, un dod 58,92% UAS, 51,47% LAS.
5.3. Pieturzīmes trūkums; |
Darba mērķa sasniegšanai izvirzīti 6.6. Dalījums teikumos; 7.3. Neiederīgs vārds; 10.3. Sekundāra: interpunkcija; |
Hipotēzes Darbā izvirzītas šādas hipotēzes: 1. Tehniskais noformējums; 2.3. Sākumburti; 6.1. Saistāmība; 6.5. Izteicēja izveide; 6.6. Dalījums teikumos; 7.2. Mazvārdība; |