Meklēšana

Par korpusu Meklēšana Kļūdu tipu statistika Kļūdu kombināciju statistika
Atrasts/-i 8257 vienumi
Pasažiere (50–64) smaidot izsaka piezīmi: Tā jaciņa tāda naudīga gadījusies. (LL 2013) Lietvārda aktualizēšanai visvairāk tiek izmantots vietniekvārds tas, tā, taču šādu funkciju sarunvalodā var veikt arī citi norādāmie vietniekvārdi – šis, šī, tāds, tāda, šitas, šitā, šitāds, šitāda. P: piemēram, kafēejnīcā pusdienojot sieva (50–64) jautā vīram, kurš ēd tādus pašus salātus: Ne visai šie salāti? (LL 2006) Runas situācija lielveikala autostāvvietā.
2.1. Vārdu pareizrakstība; 6.6. Dalījums teikumos; 10.4. Sekundāra: sākumburti;
Vīrietis (25–34), pieiedams pie autobusu kustības saraksta, paziņam saka: Cikos tad viņš te nāk? (LL 2013) Runas situācija kafēejnīcā.
2.1. Vārdu pareizrakstība;
Literārās valoda (standartvaloda) vēsturiskā, normatīvā un sociolingvistiskā skatījumā.
6.1. Saistāmība;
Lai saprastu teksta veidošanas mehānismu un pētītu tā struktūru statistiski, ir svarīgi izzināt lingvistisko vienību sadalījumu / /izplatību saistītā tekstā.
1. Tehniskais noformējums;
Burtu (grafēmu) biežums rakstu valodā ir bijis būtisks izpētes objekts jau kopš 20. gadsimtas. vidus, kad aprēķiniem sāka izmantot elektroniskās skaitļojamās mašīnas.
2.2. Saīsinājuma izveide;
Viņa noskaidroja, ka runu veido 55 % līdzskaņu un 45 % patskaņu.
1. Tehniskais noformējums;
Nesaule (Лоренц, Несауле 1963) analizēja 60 000 lielu daiļliteratūras tekstu burtu kopu. Praktiskais šī pētījumaŠī pētījuma praktiskais mērķis bija modificēt bBraila rakstu.
2.3. Sākumburti; 6.4. Vārdu secība;
Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss (Levāne-Petrova 2012) ir izstrādāts 2013. gadā Latvijas Universitātes Matemātikas un informātikas institūtā, un tajā noteiktās proporcijās ir iekļauti dažādu tipu teksti: periodika (55 %), daiļliteratūra (20 %), zinātniskie teksti (10 %), normatīvie akti (8 %), LR Saeimas stenogrammas (2 %) un dažādi citi teksti (5 %).
1. Tehniskais noformējums; 5.3. Pieturzīmes trūkums;
LVRK aptuveni līdzīgās daļās ietverti vīriešu (54 %) un sieviešu (46 %) runas ieraksti, ņemot vērā arī runātāju piederību konkrētai vecumgrupai (16–24, 25–51 vai 51–75) un latviešu valodas prasmi (dzimtā valoda; nav dzimtā valoda; dzimtā valoda, bet izrunā jūtamas dzimtās izloksnes īpatnības) (Pinniset et. al 2014).
1. Tehniskais noformējums;
No www.tezaurs.lv vārdu saraksta papildus izņemti īpašvārdi, saīsinājumi un šķirkļi, kas satur interpunkcijas zīmes (punkts, slīpsvītra, defise u. c.), piemēram, izskaņa -isms.
1. Tehniskais noformējums;
Lai gūtu priekšstatu par korpusa izmēru, 1. tabulā tika apkopoti vairāki raksturlielumi, kas iegūti pēc neatbilstošo vārdu izņemšanas. V: vārdlietojumu skaits – cik vārdu ir datu kopā. B; burtu skaits vārdlietojumos – cik burtu ir datu kopā. V; vārdformu skaits – cik daudz unikāldažādu vārdformu parādās datu kopā. Tiek; ieskaitīti arī unikālie vārdu lietojumi, ne tikai vārdu pamatformas. B; burtu skaits vārdformās – cik burtu ir unikālajās vārdformās.
2.1. Vārdu pareizrakstība; 6.5. Izteicēja izveide; 6.6. Dalījums teikumos; 7.3. Neiederīgs vārds;
Vārdformu skaits www.tezaurs.lv nav tiešā veidā salīdzināms ar vārdformu skaitu teksta korpusos (LVK 2013 un LVRK), jo www.tezaurs.lv galvenokārt iekļautas tikai vārdu pamatformas, bet pie vārdformu skaita teksta korpusos tiek pieskaitīti arī visi korpusā sastopamie locījumi.
2.3. Sākumburti;
Ja tekstu korpusos sastopamās vārdformas pārveidotu uzpar pamatformām, vārdformu skaits ievērojami saruktu, turpretim www.tezaurs.lv pamatformu skaits praktiski sakristu ar vārdformu skaitu.
2.1. Vārdu pareizrakstība; 6.1. Saistāmība;
Izmantojot relatīvā biežuma rādītājus, jauniegūtos datus iespējams salīdzināt ar citiem analoģiskiem datiem. 2. tabulā latviešu valodā sastopamie burti ir sakārtoti alfabētiskā secībā un tiem ir piekārtots rangs (šķirts kārtas numurs konkrētā datu kopā, sakārtojot burtus pēc lietojumu biežuma, sākot ar biežāk sastopamo). 3. tabulā burti ir sakārtoti pēc to ranga konkrētos korpusos, un ir aprēķināts to relatīvais sastopamības biežums uz 10 000 burtu – iem.
4.1. Lietvārds; 5.3. Pieturzīmes trūkums; 7.3. Neiederīgs vārds; 10.3. Sekundāra: interpunkcija;
Vārdu garums 20. gadsimtas. 60. gados burtu skaitu vārdā latviešu valodas tekstos noteikuši vairāki pētnieki.
2.2. Saīsinājuma izveide;
Tiek apskatīti divi dažādi vidējie vārda garumi, ko var izrēķināt no 1. tabulā dotajiem skaitļiem: vidējais vārda garums, kas iegūts, izdalot burtu skaitu vārdlietojumos ar vārdlietojumu skaitu,; vidējais vārdformas garums, kas iegūts, izdalot burtu skaitu vārdformās ar vārdformu skaitu.
5.1. Nepiemērota pieturzīme;
Tie ir, piemēram, izsauksmes vārdi o, ā, ū, ī, saikļi i – i (‘gan – gan’, piemēram, i viens – i otrs), a (‘bet’), tomēr tādu vārdu nav daudz.
1. Tehniskais noformējums;
Lai izpētītu, cik liela daļa no vārdiem ir darināta ar priedēkļiem, automātiski tika izegūts šādu vārdu skaits.
3. Vārddarināšana;
Jāpiemin, ka šādā veidā iegūtā statistika nav pilnībā precīza, jo ir gadījumi, kad, atmetot daļu sākumburtu, kas sakrīt ar priedēkli, atlikušā vārda daļa ir vārdnīcā, tomēr atmestā daļa nav priedēklis, piemēram, vārdā pasaka atmetot pa-, atlikusī daļa saka ir vārdnīcā (saka – ‘teika, sāga’ ME III, 642; saka – ‘upju sazarojums vai sateka’ Karulis 1992, 145), šim vārdam priedēkļa nav. Šādi gadījumi gan ir salīdzinoši reti.
1. Tehniskais noformējums; 4.3. Īpašības vārds; 7.1. Liekvārdība; 7.2. Mazvārdība;
Vārdnīcā netiek uzskaitīti visi vārdi ar priedēkļiem, jo daļā gadījumu vārda nozīmē ar priedēkli ir izskaidrojama, zinot atsevišķi vārda un priedēkļa nozīmi, piemēram, vārdsa nedarīt vārdnīcā nav, jo tas nozīmē antonīmuir vārdam darīt antonīms.
6.1. Saistāmība; 6.4. Vārdu secība; 6.5. Izteicēja izveide; 7.3. Neiederīgs vārds; 10.1. Sekundāra: saistāmība;