|
Pasažiere (50–64) smaidot izsaka piezīmi: Tā jaciņa tāda naudīga gadījusies. (LL 2013) Lietvārda aktualizēšanai visvairāk tiek izmantots vietniekvārds tas, tā, taču šādu funkciju sarunvalodā var veikt arī citi norādāmie vietniekvārdi – šis, šī, tāds, tāda, šitas, šitā, šitāds, šitāda 2.1. Vārdu pareizrakstība; 6.6. Dalījums teikumos; 10.4. Sekundāra: sākumburti; |
|
Vīrietis (25–34), pieiedams pie autobusu kustības saraksta, paziņam saka: Cikos tad viņš te nāk? (LL 2013) Runas situācija kaf 2.1. Vārdu pareizrakstība; |
|
Literārā 6.1. Saistāmība; |
|
Lai saprastu teksta veidošanas mehānismu un pētītu tā struktūru statistiski, ir svarīgi izzināt lingvistisko vienību sadalījumu 1. Tehniskais noformējums; |
|
Burtu (grafēmu) biežums rakstu valodā ir bijis būtisks izpētes objekts jau kopš 20. g 2.2. Saīsinājuma izveide; |
|
Viņa noskaidroja, ka runu veido 55 % līdzskaņu un 45 % patskaņu.
1. Tehniskais noformējums; |
|
Nesaule (Лоренц, Несауле 1963) analizēja 60 000 lielu daiļliteratūras tekstu burtu kopu. 2.3. Sākumburti; 6.4. Vārdu secība; |
|
Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss (Levāne-Petrova 2012) ir izstrādāts 2013. gadā Latvijas Universitātes Matemātikas un informātikas institūtā, un tajā noteiktās proporcijās ir iekļauti dažādu tipu teksti: periodika (55 %), daiļliteratūra (20 %), zinātniskie teksti (10 %), normatīvie akti (8 %), LR Saeimas stenogrammas (2 %) un dažādi citi teksti (5 %).
1. Tehniskais noformējums; 5.3. Pieturzīmes trūkums; |
|
LVRK aptuveni līdzīgās daļās ietverti vīriešu (54 %) un sieviešu (46 %) runas ieraksti, ņemot vērā arī runātāju piederību konkrētai vecumgrupai (16–24, 25–51 vai 51–75) un latviešu valodas prasmi (dzimtā valoda; nav dzimtā valoda; dzimtā valoda, bet izrunā jūtamas dzimtās izloksnes īpatnības) (Pinniset et 1. Tehniskais noformējums; |
|
No 1. Tehniskais noformējums; |
|
Lai gūtu priekšstatu par korpusa izmēru, 1. tabulā 2.1. Vārdu pareizrakstība; 6.5. Izteicēja izveide; 6.6. Dalījums teikumos; 7.3. Neiederīgs vārds; |
|
Vārdformu skaits 2.3. Sākumburti; |
|
Ja tekstu korpusos sastopamās vārdformas pārveidotu 2.1. Vārdu pareizrakstība; 6.1. Saistāmība; |
|
Izmantojot relatīvā biežuma rādītājus, jauniegūtos datus iespējams salīdzināt ar citiem analoģiskiem datiem. 2. tabulā latviešu valodā sastopamie burti ir sakārtoti alfabētiskā secībā un tiem ir pie 4.1. Lietvārds; 5.3. Pieturzīmes trūkums; 7.3. Neiederīgs vārds; 10.3. Sekundāra: interpunkcija; |
|
Vārdu garums 20. g 2.2. Saīsinājuma izveide; |
|
Tiek apskatīti divi dažādi vidējie vārda garumi, ko var izrēķināt no 1. tabulā dotajiem skaitļiem: vidējais vārda garums, kas iegūts, izdalot burtu skaitu vārdlietojumos ar vārdlietojumu skaitu 5.1. Nepiemērota pieturzīme; |
|
Tie ir, piemēram, izsauksmes vārdi o, ā, ū, ī, saikļi i – 1. Tehniskais noformējums; |
|
Lai izpētītu, cik liela daļa no vārdiem ir darināta ar priedēkļiem, automātiski tika i 3. Vārddarināšana; |
|
Jāpiemin, ka šādā veidā iegūtā statistika nav 1. Tehniskais noformējums; 4.3. Īpašības vārds; 7.1. Liekvārdība; 7.2. Mazvārdība; |
|
Vārdnīcā netiek uzskaitīti visi vārdi ar priedēkļiem, jo daļā gadījumu vārda nozīmē ar priedēkli ir izskaidrojama, zinot atsevišķi vārda un priedēkļa nozīmi, piemēram, vārd 6.1. Saistāmība; 6.4. Vārdu secība; 6.5. Izteicēja izveide; 7.3. Neiederīgs vārds; 10.1. Sekundāra: saistāmība; |