Meklēšana

Par korpusu Meklēšana Kļūdu tipu statistika Kļūdu kombināciju statistika
Atrasts/-i 2 vienumi
Tādeējādi nācās secināt, ka, pat: pat ja tiktu atrisinotātas citas mērogojamības problēmas, Čankera tālākai attīstīšanai par plaša pārklājuma praktiski izmantojamu sintakses parsētāju būtu absoljebkurā gadījumā būtiu nepieciešams sintaktiski marķēts korpuss, no kura šādu statistisko informāciju iegūt.
2.1. Vārdu pareizrakstība; 6.5. Izteicēja izveide; 6.6. Dalījums teikumos; 7.3. Neiederīgs vārds;
Lai gūtu priekšstatu par korpusa izmēru, 1. tabulā tika apkopoti vairāki raksturlielumi, kas iegūti pēc neatbilstošo vārdu izņemšanas. V: vārdlietojumu skaits – cik vārdu ir datu kopā. B; burtu skaits vārdlietojumos – cik burtu ir datu kopā. V; vārdformu skaits – cik daudz unikāldažādu vārdformu parādās datu kopā. Tiek; ieskaitīti arī unikālie vārdu lietojumi, ne tikai vārdu pamatformas. B; burtu skaits vārdformās – cik burtu ir unikālajās vārdformās.
2.1. Vārdu pareizrakstība; 6.5. Izteicēja izveide; 6.6. Dalījums teikumos; 7.3. Neiederīgs vārds;