Meklēšana

Par korpusu Meklēšana Kļūdu tipu statistika Kļūdu kombināciju statistika
Atrasts/-i 6747 vienumi
Viņa noskaidroja, ka runu veido 55 % līdzskaņu un 45 % patskaņu.
1. Tehniskais noformējums;
Nesaule (Лоренц, Несауле 1963) analizēja 60 000 lielu daiļliteratūras tekstu burtu kopu. Praktiskais šī pētījumaŠī pētījuma praktiskais mērķis bija modificēt bBraila rakstu.
2.3. Sākumburti; 6.4. Vārdu secība;
Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss (Levāne-Petrova 2012) ir izstrādāts 2013. gadā Latvijas Universitātes Matemātikas un informātikas institūtā, un tajā noteiktās proporcijās ir iekļauti dažādu tipu teksti: periodika (55 %), daiļliteratūra (20 %), zinātniskie teksti (10 %), normatīvie akti (8 %), LR Saeimas stenogrammas (2 %) un dažādi citi teksti (5 %).
1. Tehniskais noformējums; 5.3. Pieturzīmes trūkums;
LVRK aptuveni līdzīgās daļās ietverti vīriešu (54 %) un sieviešu (46 %) runas ieraksti, ņemot vērā arī runātāju piederību konkrētai vecumgrupai (16–24, 25–51 vai 51–75) un latviešu valodas prasmi (dzimtā valoda; nav dzimtā valoda; dzimtā valoda, bet izrunā jūtamas dzimtās izloksnes īpatnības) (Pinniset et. al 2014).
1. Tehniskais noformējums;
No www.tezaurs.lv vārdu saraksta papildus izņemti īpašvārdi, saīsinājumi un šķirkļi, kas satur interpunkcijas zīmes (punkts, slīpsvītra, defise u. c.), piemēram, izskaņa -isms.
1. Tehniskais noformējums;
Lai gūtu priekšstatu par korpusa izmēru, 1. tabulā tika apkopoti vairāki raksturlielumi, kas iegūti pēc neatbilstošo vārdu izņemšanas. V: vārdlietojumu skaits – cik vārdu ir datu kopā. B; burtu skaits vārdlietojumos – cik burtu ir datu kopā. V; vārdformu skaits – cik daudz unikāldažādu vārdformu parādās datu kopā. Tiek; ieskaitīti arī unikālie vārdu lietojumi, ne tikai vārdu pamatformas. B; burtu skaits vārdformās – cik burtu ir unikālajās vārdformās.
2.1. Vārdu pareizrakstība; 6.5. Izteicēja izveide; 6.6. Dalījums teikumos; 7.3. Neiederīgs vārds;
Vārdformu skaits www.tezaurs.lv nav tiešā veidā salīdzināms ar vārdformu skaitu teksta korpusos (LVK 2013 un LVRK), jo www.tezaurs.lv galvenokārt iekļautas tikai vārdu pamatformas, bet pie vārdformu skaita teksta korpusos tiek pieskaitīti arī visi korpusā sastopamie locījumi.
2.3. Sākumburti;
Izmantojot relatīvā biežuma rādītājus, jauniegūtos datus iespējams salīdzināt ar citiem analoģiskiem datiem. 2. tabulā latviešu valodā sastopamie burti ir sakārtoti alfabētiskā secībā un tiem ir piekārtots rangs (šķirts kārtas numurs konkrētā datu kopā, sakārtojot burtus pēc lietojumu biežuma, sākot ar biežāk sastopamo). 3. tabulā burti ir sakārtoti pēc to ranga konkrētos korpusos, un ir aprēķināts to relatīvais sastopamības biežums uz 10 000 burtu – iem.
4.1. Lietvārds; 5.3. Pieturzīmes trūkums; 7.3. Neiederīgs vārds; 10.3. Sekundāra: interpunkcija;
Vārdu garums 20. gadsimtas. 60. gados burtu skaitu vārdā latviešu valodas tekstos noteikuši vairāki pētnieki.
2.2. Saīsinājuma izveide;
Tiek apskatīti divi dažādi vidējie vārda garumi, ko var izrēķināt no 1. tabulā dotajiem skaitļiem: vidējais vārda garums, kas iegūts, izdalot burtu skaitu vārdlietojumos ar vārdlietojumu skaitu,; vidējais vārdformas garums, kas iegūts, izdalot burtu skaitu vārdformās ar vārdformu skaitu.
5.1. Nepiemērota pieturzīme;
Tie ir, piemēram, izsauksmes vārdi o, ā, ū, ī, saikļi i – i (‘gan – gan’, piemēram, i viens – i otrs), a (‘bet’), tomēr tādu vārdu nav daudz.
1. Tehniskais noformējums;
Lai izpētītu, cik liela daļa no vārdiem ir darināta ar priedēkļiem, automātiski tika izegūts šādu vārdu skaits.
3. Vārddarināšana;
Jāpiemin, ka šādā veidā iegūtā statistika nav pilnībā precīza, jo ir gadījumi, kad, atmetot daļu sākumburtu, kas sakrīt ar priedēkli, atlikušā vārda daļa ir vārdnīcā, tomēr atmestā daļa nav priedēklis, piemēram, vārdā pasaka atmetot pa-, atlikusī daļa saka ir vārdnīcā (saka – ‘teika, sāga’ ME III, 642; saka – ‘upju sazarojums vai sateka’ Karulis 1992, 145), šim vārdam priedēkļa nav. Šādi gadījumi gan ir salīdzinoši reti.
1. Tehniskais noformējums; 4.3. Īpašības vārds; 7.1. Liekvārdība; 7.2. Mazvārdība;
Vārdnīcā netiek uzskaitīti visi vārdi ar priedēkļiem, jo daļā gadījumu vārda nozīmē ar priedēkli ir izskaidrojama, zinot atsevišķi vārda un priedēkļa nozīmi, piemēram, vārdsa nedarīt vārdnīcā nav, jo tas nozīmē antonīmuir vārdam darīt antonīms.
6.1. Saistāmība; 6.4. Vārdu secība; 6.5. Izteicēja izveide; 7.3. Neiederīgs vārds; 10.1. Sekundāra: saistāmība;
Tajā pašā laikā ir vārdi, kuriem priedēkļa pievienošana maina nozīmi, piemēram, vārdam rakstīt (‘veidot burtus ar rakstāmrīku’) pievienojot priedēkli pa-, vārds parakstīt nozīmē ne tikai neilgu laiku, mazliet rakstīt, bet arī ar savu parakstu apliecināt, tāpēc vārds parakstīt ir vārdnīcā. 6. tabulā ir apkopota statistika par biežāk sastopamajiem priedēkļiem.
5.1. Nepiemērota pieturzīme;
Tabulā ir arī redzams, kāds ir burtu rangs, ieskaitot vārdus ar priedēkli, un kāds būtu burta rangs, ja netiktu skaitīti vārdi ar priedēkli.
5.3. Pieturzīmes trūkums;
Statistika liecina, ka tādu vārdu, kas sākas ar burtu p un kuru garums ir no 2 līdz 6 burtiem, ir mazāk nekā 10 % no kopējā vārdu apjoma šajā garumāšādu garuma vārdu kopējā apjoma, bet vārdu, kas sākas ar burtu p un kuru garums ir no 10 līdz 19 burtiem, ir vairāk nekā 15 %.
1. Tehniskais noformējums; 6.1. Saistāmība; 6.4. Vārdu secība;
Tā kā vienu un to pašu burtu var izmantot dažādu latviešu valodas skaņu atspoguļošanai, kā arī burts var būt burtu kopas sastāvdaļa, burtu un skaņu biežumu saraksts atšķiras, piemēram, i burts ir otrais biežāk lietotais gan LVK 2013, gan LVRK, savukārt skaņu biežuma sarakstā patskanis i ir tikai ceturtajā pozīcijā.
4.4. Cita vārdšķira;
To biežs lietojums vērojams arī 20. gadsimtas. 60. un 70. gadu tekstos.
2.2. Saīsinājuma izveide;
Līga Romāne-Kalniņa, Indra Karapetjana Latvijas vValsts prezidentu retorika latviešu nācijas simts gados - dialogs, argumentācija, pārliecināšana vai manipulācija?
1. Tehniskais noformējums; 2.3. Sākumburti; 5.3. Pieturzīmes trūkums; 6.7. Sakārtojuma konstrukcijas;