Meklēšana

Par korpusu Meklēšana Kļūdu tipu statistika Kļūdu kombināciju statistika
Atrasts/-i 3548 vienumi
Apstrādājot katru virsotni, tās atkarīgajiem tiek piešķiras UD atkarību lomas, vadoties gan pēc atkarīgo LVTB lomām un morfoloģiskajām pazīmēm, gan pēc vecākvirsotnesa morfoloģiskajām pazīmēm.
3. Vārddarināšana;
Tukšās virsotnes vārdu izlaidumu marķēšanai jeb redukcijas virsotnes tiek apstrādātas šādi. R: redukcijas virsotnes bez atkarīgajām virsotnēm uz UD pārveidotas netiek. R; redukcijas virsotnēm ar atkarīgajām virsotnēm viens no atkarīgajiem atbilstoši to potenciālajām UD lomām tiek izvēlēts par reducētās vienības aizvietotāju, šo virsotni pakārto reducētās vienības vecākam, un tai pakārto pārējos reducētās vienības atkarīgos.
5.1. Nepiemērota pieturzīme; 5.2. Lieka pieturzīme; 5.3. Pieturzīmes trūkums; 6.6. Dalījums teikumos;
Darba gaitā tiek izstrādāts detalizēts LVTB un UD izmantoto lomu savstarpējais kartējums (angl. mapping; šajā gadījumā – attēlojums “daudzi pret daudziem”), taču tiek arī secināts, ka atsevišķos gadījumos LVTB marķējums neļauj precīzi noteikt UD lomu. (Pretkalniņa et al., 2016) UD vadlīniju 2.0. versija apraksta neobligāti pievienojuamu papildmarķējumu, kas tālāk atvieglotu UD datu izmantošanu dažādos programmiskos lietojumos – tā sauktās paplašinātās atkarības (angl. enhanced dependencies).
7.2. Mazvārdība; 9.1. Neuzmanības kļūda;
Vadlīnijas piedāvā marķējumā iekļaut piecu veidu papildinformāciju, katrs no papildinformācijas elementiem ir neobligāts: tukšas (angl. null) virsotnes, kas reprezentē reducētus izteicējus (angl. elided predicates); saikšķautnes, kas sasaista katru no vienlīdzīgajiem teikuma locekļiem ar to kopīgo vecāku un kopīgajiem atkarīgajiem (pamata atkarību kokā šāda tieša saikšķautne ir tikai pirmajam no vienlīdzīgo locekļu virknes); saikšķautnes, kas norāda kontrolētos un paaugstināceltos teikuma priekšmetus (angl. controlled/rised subjects), piemēram, teikumā viņš grib ēst teikuma priekšmetu viņš sasaista ne tikai ar grib (saikšķautne pamatkokā), bet arī ar ēst un teikumā pavelkot virvi, viņa atsēja mezglu teikuma priekšmetu viņa sasaista arī ar pavelkot; papildu saikšķautnes, kas sasaista palīgteikumu ievadošus attieksmes vietniekvārdus ar virsteikuma locekli, uz kuru vietniekvārds referē; lomā ietvertama papildinformācija: locījumu uns vai prievārdu informācijas var tikt pievienots nevalentajiemā nominālajiemā teikuma locekļiem, ievadošā apstākļa vārda norāde apstākļa vārdu ievadītiem palīgteikumiema lomai, piemēram, nmod:loc lietvārdam lokatīvā; palīgteikumu ievadošais apstākļa vārds var tikt pievienots palīgteikuma lomai, piemēram, advcl:kad apstākļa palīgteikumam, ko ievada apstākļa vārds kad.
6.1. Saistāmība; 7.2. Mazvārdība; 7.3. Neiederīgs vārds; 9.1. Neuzmanības kļūda;
Analizējot vadlīnijas un LVTB marķējumu, tieka secināts, ka bez papildu koreferenču marķēšanas 4. punktu izpildīt nav iespējams, jo LVTB marķējumā īpaši neav atzīmē tots, vai vietniekvārdi un apstākļa vārdi ievada palīgteikumu, vai nēe. Šī paša iemesla dēļ 5. punktua nosacījumus ir iespējams izpildīt tikai daļēji – tiek norādīta tikai informācija par locījumuiem un prievārdu informācijaiem (a), bet ne palīgteikumus ievadošie apstākļi (b).
5.2. Lieka pieturzīme; 6.3. Noliegums; 6.4. Vārdu secība; 6.5. Izteicēja izveide; 7.2. Mazvārdība; 8. Tekstveide; 10.1. Sekundāra: saistāmība;
LVTB saliktajiem izteicējiem izmantotā frāzes veida konstrukcija xPred ļauj iegūt būtisku daļu (3)3. punktam nepieciešamo saikņu, jo tā grupē kopā garākas izteicēju virknes, piemēram, [viņš] gribēja gulēt.
1. Tehniskais noformējums;
Neskaidrās situācijās paplašināto atkarību saikgrafa šķautnes netiek pievienotas, lai neradītu kļūdainu marķējumu.
7.3. Neiederīgs vārds;
Pēc uzlabojumiem pārveides algoritms darbojas šādtālāk minētajos soļos:. Priekšapstrāde: Augšupejošā veidā apstaigājot koku, tiek sastādīts kartējums (mapping) nošajā gadījumā – attēlojums “viens pret daudziem”), kurā virsotņu identifikatoriem norāda uz sarakstiem ar to, no kādiem vienlīdzīgajiem teikuma locekļiem vaiun vienlīdzīgajām teikuma daļām šī, no kā attiecīgās virsotnes sastāv.
4.3. Īpašības vārds; 6.6. Dalījums teikumos; 7.1. Liekvārdība; 7.3. Neiederīgs vārds;
Tiek noskaidrots, kura tekstvienība reprezentē doto virsotni pamata atkarību kokā un kura – paplašinātajā grafā: ja tā ir redukcijas virsotne, tad tiek izdarīta “redukcijas transformācija” – tiek izanalizēti atkarīgie un noteikts, kurš no tiem kļūs par vecāka aizvietotāju pamata atkarību kokā, kā arī tiek izveidota tukšā virsotne paplašinātajam atkarību grafam; ja tā ir frāzes veida konstrukcijas virsotne, tiek izdarīta “frāzes transformācija” – tiek izanalizētas sastāvdaļas, izveidotas UD saikgrafa šķautnes starp tām un noteikts, kura no sastāvdaļām kļūst par šo frāzi reprezentējošā UD koka fragmenta sakni – pamatkokā frāzi reprezentēs attiecīgajai sastāvdaļai atbilstošā (iepriekšējos soļos rekursīvi noteikta) tekstvienība un paplašinātajā grafā – tā pati tekstvienība vai tukšā virsotne, ja tā ir izrādījusies redukcijas virsotne; ja tā ir vienkārša tekstvienības virsotne, tad gan UD pamatkokā, gan paplašinātajā grafā to reprezentē atbilstošā tekstvienība.
7.2. Mazvārdība; 7.3. Neiederīgs vārds;
Apstrādājot atkarīgos, kam 1.2. punktā izveidotajā kartējumā ir norādītasi papildu vecākvirsotnesi, tiek novilktas arī paplašinātā atkarību grafa saikšķautnes uz tāiem.
3. Vārddarināšana; 7.3. Neiederīgs vārds; 10.1. Sekundāra: saistāmība;
Paralēli katru reizi, kad tiek veidota saikšķautne, tiek aplūkots 1.1. punktā veidotaisa kartējums un izveidotas visas nepieciešamās paplašinātā atkarību grafa saites starp topošās atkarības vecāka un bērna vienlīdzīgajiem elementiem.
7.1. Liekvārdība; 7.3. Neiederīgs vārds;
Saikņu lomas tiek noteiktas vadoties pēc kokapēc virsotņu apkaimes kokā, vecāka un bērna morfoloģiskajām īpašībām un apstrādes konteksta (frāzes, redukcijas vai atkarības apstrāde).
6.4. Vārdu secība;
Morfoloģijas pēcapstrāde Pēc tam, kad ir iegūta UD sintaktiskā struktūra, ir iespējams precizēt morfoloģisko marķējumu – galvenokārt, mazināt nepareizi piešķirto PRON instanču skaitu, vietniekvārdus, kas nokļuvuši determinētāja lomā det UD sintaktiskajā struktūrā pārmarķējot vārdšķirā DETpārmarķējot par vārdšķiru DET tos vietniekvārdus, kas UD sintaktiskajā struktūrā nokļuvuši determinētāja lomā det.
6.4. Vārdu secība;
Jāuzsver, ka par nopietnu vērtējumu neuzskatu t. s. klientu apmierinātības aptauju saprotams, ka autors visbiežāk būs apmierināts ar redaktoru, kas viņa darbā neko nav labojis, un ārkārtīgi neapmierināts, ja redzēs tekstu pamatīgi pārveidotu (sabojātu).
1. Tehniskais noformējums; 5.1. Nepiemērota pieturzīme;
Cilvēkresursu ierobežojumu dēļ izvērtējums ir salīdzinoši neliels, un līdz ar to nav uzskatāms par augsti reprezentatīvu, taču par spīti tam sniedz vērtīgu ieskatu transformācijas rezultātu kvalitātē.
6.1. Saistāmība; 7.1. Liekvārdība; 7.2. Mazvārdība;
Tiek pārbaudīti 60 teikumi (aptuveni 800 tekstvienību, teikumi izvēlēti, proporcionāli atspoguļojot korpusā pārstāvētos teksta žanrus) un atrastajām UD marķējuma kļūdām tiek noteikts, vai tās radušās kļūdaina oriģinālmarķējuma dēļ, transformācijas nepilnību dēļ vai arī tāpēc, ka LVTB nesaturav informācijuas, kas ļautu noteikt pareizās saites un to lomas.
6.5. Izteicēja izveide; 7.2. Mazvārdība; 9.1. Neuzmanības kļūda; 10.1. Sekundāra: saistāmība;
Pamata atkarību kokos tiek identificētas 19 nepareizas saites/ / saišu lomas, t.i. transformācijas LAS ir 97,6%, kas uzskatāms par ļoti labu rezultātu.
1. Tehniskais noformējums;
No atrastajām problēmām tikai 1viena ir tāpēc, ka LVTB nesatur nepieciešamo informāciju, savukārt 6sešas – oriģināldatu kļūdu dēļ.
1. Tehniskais noformējums;
Pārējās 12 uzskatāmas par uzlabojamām transformatoraācijas kļūdām.
3. Vārddarināšana;
Tajos pašos datos tiek novērtēta arī paplašināto atkarību grafu kvalitāte, taču, to darot, sakarā ar paplašināto atkarību neobligāto raksturu kā kļūdas netiek skaitītas paplašināto atkarību saišu grupas, kas vispār netiek marķētas, t.i., 3.2.21.1.3. nosadaļā aprakstītās paplašināto atkarību specifikācijas grupas 4 un 5(b).
5.3. Pieturzīmes trūkums; 7.3. Neiederīgs vārds;