Meklēšana

Par korpusu Meklēšana Kļūdu tipu statistika Kļūdu kombināciju statistika
Atrasts/-i 1 vienumi
Kā pamata rīku komplekts korpusa manuālajai apstrādei tiek lietots Prāgas Kārļa uUniversitātē izstrādātais TrEd toolkit (Hajič et al., 2001) un kopā ar to arī datu metaformāts Prague Markup Laguage (PML) (Pajas, Štěpánek, 2006). PML ir šīs rīku kopas vietējais (angl. native) datu formāts. Šāda izvēle tika izdarīta TrEd toolkit un PML plašās funkcionalitātes dēļ: (ir izstrādāts vizuālas rediģēšanas rīks TrEd, meklēšanas valoda kokveida struktūrām PML-TQ ar realizāciju (Štěpánek, Pajas, 2010), masveida apstrādes rīks bTrEd u.c., PML ir vietējais (native) datu formāts TrEd toolkit), kā arī tāpēc, ka tas Tie ir aprobētsi, marķējot vairākus korpusus, arī lielus – Prāgas aAtkarību korpusu (Prague Dependency Treebank, PDT) (Hajič et al., 2000), Prāgas aArābu valodas atkarību korpusu (Prague Arabic Dependency Treebank) (Hajič et al., 2004), Slovēņu valodas atkarību korpusu (Slovene Dependency Treebank) (Džeroski et al., 2006) u.c., un Prāgas Turklāt Kārļa uUniversitāte LINDAT/CLARIN iniciatīvas ietvaros piedāvā servisu šādu datu publicēšanais pakalpojumu.
2.3. Sākumburti; 6.4. Vārdu secība; 6.6. Dalījums teikumos; 7.1. Liekvārdība; 7.2. Mazvārdība;