Apstrādājot katru virsotni, tās atkarīgajiem tiek piešķiras UD atkarību lomas, vadoties gan pēc atkarīgo LVTB lomām un morfoloģiskajām pazīmēm, gan pēc vecāk 3. Vārddarināšana; |
Tukšās virsotnes vārdu izlaidumu marķēšanai jeb redukcijas virsotnes tiek apstrādātas šādi 5.1. Nepiemērota pieturzīme; 5.2. Lieka pieturzīme; 5.3. Pieturzīmes trūkums; 6.6. Dalījums teikumos; |
Darba gaitā tiek izstrādāts detalizēts LVTB un UD izmantoto lomu savstarpējais kartējums (angl. mapping; šajā gadījumā – attēlojums “daudzi pret daudziem”), taču tiek arī secināts, ka atsevišķos gadījumos LVTB marķējums neļauj precīzi noteikt UD lomu. (Pretkalniņa et al., 2016) UD vadlīniju 2.0. versija apraksta neobligāti pievienoj 7.2. Mazvārdība; 9.1. Neuzmanības kļūda; |
Vadlīnijas piedāvā marķējumā iekļaut piecu veidu papildinformāciju, katrs no papildinformācijas elementiem ir neobligāts: tukšas (angl. null) virsotnes, kas reprezentē reducētus izteicējus (angl. elided predicates); 6.1. Saistāmība; 7.2. Mazvārdība; 7.3. Neiederīgs vārds; 9.1. Neuzmanības kļūda; |
Analizējot vadlīnijas un LVTB marķējumu, ti 5.2. Lieka pieturzīme; 6.3. Noliegums; 6.4. Vārdu secība; 6.5. Izteicēja izveide; 7.2. Mazvārdība; 8. Tekstveide; 10.1. Sekundāra: saistāmība; |
LVTB saliktajiem izteicējiem izmantotā frāzes veida konstrukcija xPred ļauj iegūt būtisku daļu 1. Tehniskais noformējums; |
Neskaidrās situācijās paplašināto atkarību 7.3. Neiederīgs vārds; |
Pēc uzlabojumiem pārveides algoritms darbojas 4.3. Īpašības vārds; 6.6. Dalījums teikumos; 7.1. Liekvārdība; 7.3. Neiederīgs vārds; |
Tiek noskaidrots, kura tekstvienība reprezentē doto virsotni pamata atkarību kokā un kura – paplašinātajā grafā: ja tā ir redukcijas virsotne, tad tiek izdarīta “redukcijas transformācija” – tiek izanalizēti atkarīgie un noteikts, kurš no tiem kļūs par vecāka aizvietotāju pamata atkarību kokā, kā arī tiek izveidota tukšā virsotne paplašinātajam atkarību grafam; ja tā ir frāzes veida konstrukcijas virsotne, tiek izdarīta “frāzes transformācija” – tiek izanalizētas sastāvdaļas, izveidotas UD 7.2. Mazvārdība; 7.3. Neiederīgs vārds; |
Apstrādājot atkarīgos, kam 1.2. punktā izveidotajā kartējumā ir norādīt 3. Vārddarināšana; 7.3. Neiederīgs vārds; 10.1. Sekundāra: saistāmība; |
Paralēli katru reizi, kad tiek veidota 7.1. Liekvārdība; 7.3. Neiederīgs vārds; |
Saikņu lomas tiek noteiktas 6.4. Vārdu secība; |
Morfoloģijas pēcapstrāde Pēc tam, kad ir iegūta UD sintaktiskā struktūra, ir iespējams precizēt morfoloģisko marķējumu – galvenokārt, mazināt nepareizi piešķirto PRON instanču skaitu, 6.4. Vārdu secība; |
Jāuzsver, ka par nopietnu vērtējumu neuzskatu t. s. 1. Tehniskais noformējums; 5.1. Nepiemērota pieturzīme; |
Cilvēkresursu ierobežojumu dēļ izvērtējums ir salīdzinoši neliels, 6.1. Saistāmība; 7.1. Liekvārdība; 7.2. Mazvārdība; |
Tiek pārbaudīti 60 teikumi (aptuveni 800 tekstvienību, teikumi izvēlēti, proporcionāli atspoguļojot korpusā pārstāvētos teksta žanrus) un atrastajām UD marķējuma kļūdām tiek noteikts, vai tās radušās kļūdaina oriģinālmarķējuma dēļ, transformācijas nepilnību dēļ vai arī tāpēc, ka LVTB n 6.5. Izteicēja izveide; 7.2. Mazvārdība; 9.1. Neuzmanības kļūda; 10.1. Sekundāra: saistāmība; |
Pamata atkarību kokos tiek identificētas 19 nepareizas saites 1. Tehniskais noformējums; |
No atrastajām problēmām tikai 1. Tehniskais noformējums; |
Pārējās 12 uzskatāmas par uzlabojamām transform 3. Vārddarināšana; |
Tajos pašos datos tiek novērtēta arī paplašināto atkarību grafu kvalitāte, taču, to darot, sakarā ar paplašināto atkarību neobligāto raksturu kā kļūdas netiek skaitītas paplašināto atkarību saišu grupas, kas vispār netiek marķētas, t.i., 3. 5.3. Pieturzīmes trūkums; 7.3. Neiederīgs vārds; |