Ta 7.3. Neiederīgs vārds; |
Par frāzes sastāvdaļu tiek uzskatīta: tekstvienība, kas hibrīdajā marķējumā ir marķēt 6.1. Saistāmība; |
Apkopojot sastāvdaļu atpazīšanas precizitāti dažādajiem frāzes veida konstrukciju atkarību attēlojumiem, tika novērot 7.3. Neiederīgs vārds; 10.1. Sekundāra: saistāmība; |
Analizējot sakārtojuma konstrukciju sastāvdaļu atpazīšanas rezultātus, bija novērojam 6.4. Vārdu secība; |
Gan sastāvdaļu atpazīšanas, gan vispārējās precizitātes testos redzam 5.3. Pieturzīmes trūkums; 6.3. Noliegums; 7.1. Liekvārdība; 7.2. Mazvārdība; 7.3. Neiederīgs vārds; |
Par vienlīdzīgo teikuma locekļu konstrukcijām nācās secināt, ka korpusa apjoms tobrīd bija pārāk mazs, lai pilnvērtīgi iemācītos atšķirt sakārtojuma konstrukciju kopējos atkarīgos un viena koordinētā elementa atkarīgos, jo LA visiem sakārtojuma konstrukciju atkarīgo atpazīšanas veidiem bija ļoti zems (15 1. Tehniskais noformējums; |
Par pieturzīmju konstrukciju atkarīgajiem 6.6. Dalījums teikumos; 7.2. Mazvārdība; 7.3. Neiederīgs vārds; 8. Tekstveide; |
Tas kopā ar sastāvdaļu atpazīšanas un vispārīgajiem rezultātiem s 7.3. Neiederīgs vārds; |
Parsētāju varianti, kuriem par labu liecina atsevišķo 7.3. Neiederīgs vārds; |
UD iniciatīva par savu mērķi izvirza marķējumu ar augstu lingvistisko precizitāti, marķējuma saskaņotību dažādām valodām (angl. cross-lingual consistence), piemērotību ātrai manuālai un automātiskai marķēšanai, pieejamību (saprotamību) potenciālajiem datu izmantotājiem ārpus lingvistu loka, kā arī noderīgumu tālākai izmantošanai valodas sapratnes (angl. natural language understanding) rīkos (Nivre et. al., 2016). Šī mērķa sasniegšanai UD iniciatīva izstrādā vadlīnijas atkarīb 7.1. Liekvārdība; 7.2. Mazvārdība; 10.1. Sekundāra: saistāmība; |
Reizi pusgadā tiek publicē 2. Pareizrakstība; 6.6. Dalījums teikumos; 7.1. Liekvārdība; 8. Tekstveide; 9. Citas kļūdas; 10.1. Sekundāra: saistāmība; |
Sintaktiski marķēts korpuss, kas izmantojams parsētāju apmācībai, ir būtisks šī darba mērķis, 8. Tekstveide; |
Tāpēc ti 1. Tehniskais noformējums; 4. Formveidošana; 6.5. Izteicēja izveide; 7.2. Mazvārdība; |
Pārejot no versijas 1.4 uz 2.0, UD vadlīnijās tiek veiktas būtiskas izmaiņas un precizējumi, un transformācija tiek atbilstoši atjaunināta.
5.3. Pieturzīmes trūkums; |
Par tādām kļūdām kā izlaisti komati, kam UD nespecificē norādīšanas veidu, tiek ievietoti kodificēti komentāri atbilstošās tekstvienības laukā MISC, kas paredzēts nespecificētas informācijas nodošanai 6.6. Dalījums teikumos; |
Tā rezultātā gan LVTB, gan UDLV-LVTB kā 6.4. Vārdu secība; 7.3. Neiederīgs vārds; |
Kolonnas FEATS aizpildījumu pamatā nosaka morfoloģiskajā tagā iekļautās pazīmes, taču atsevišķos gadījumos pazīmes piešķir, arī vadoties pēc lemmu uzskaitījuma, piemēram, vairumam īpašības vārdu pazīme Poss (possesive, piederība) netiek aizpildīta, taču to norāda vārdiem manējais, tavējais.
2.1. Vārdu pareizrakstība; 5.3. Pieturzīmes trūkums; |
UD arī piedāvā vairākas pazīmes un pazīmju vērtības, kas latviešu valodai nav saistošas, jo neparādās kā morfoloģiskas kategorijas, piemēram, Animacy vai Case=Erg 6.4. Vārdu secība; 6.6. Dalījums teikumos; 7.2. Mazvārdība; 7.3. Neiederīgs vārds; |
Tād 2.1. Vārdu pareizrakstība; 5. Interpunkcija; 6.5. Izteicēja izveide; 10.1. Sekundāra: saistāmība; |
Tāpēc transformāciju var veidot kā rekursīvu algoritmu, kas katru frāzes veida konstrukciju vai atkarību pārveido, izmantojot tās tuvākajā apkaimē pieejamo informāciju.
7.2. Mazvārdība; |