Meklēšana

Par korpusu Meklēšana Kļūdu tipu statistika Kļūdu kombināciju statistika
Atrasts/-i 3548 vienumi
Līdz šim viņu pa latviski rakstīja «ei».
1. Tehniskais noformējums;
Interesanti, ka elektroniskajā vidē parādās vēl divi latviešu valodai samērā neparasti rakstības veidi, kuri hipotētiski varētu nozīmēt arī nedaudz atšķirīgu izrunu: ar -ht- un ar -cht- saknes izskaņā (sal. vācu -cht-), piem., rihtīgs trilleris, richtīgs jaunības maksimālisms.
1. Tehniskais noformējums;
Jāpiezīmē, ka formasvarianti ar -cht- ir skaita ziņa vismazāk pārstāvētasi.
1. Tehniskais noformējums; 7.3. Neiederīgs vārds; 10.1. Sekundāra: saistāmība;
Bez jau minētajām saknes līdzskaņu variācijām parādās arī vārds bez galotņu formanes riktīg. Piemēram, riktīg labs, riktīg lielas pannas, riktīg garlaicīgi, un tikai reizēm bezgalotņu formašis variants parādās ar apostrofu, piem. riktīg’ cepī, riktīg’ jaukās dienas.
5.3. Pieturzīmes trūkums; 6.1. Saistāmība; 7.3. Neiederīgs vārds;
Atsevišķos gadījumos var runāt par lietojumu noteiktā reģionā, piem., Ziemeļkurzemē, uz ko norāda galotņu trūkums arī pārējās vārda formās un konteksts, taču tādu gadījumu nav daudz.
5.3. Pieturzīmes trūkums; 7.2. Mazvārdība;
Vai veidojas jaunas sarunvalodas formavariants ar nozīmi ‘tiešām;, ļoti’?
1. Tehniskais noformējums; 7.3. Neiederīgs vārds; 10.1. Sekundāra: saistāmība;
Tā, piemēram., paralēli vienskaitļa ģenitīva formai (SIA „Hanzas vīna galerija”) ir lietots nosaukums ar nominatīvu (SIA „Hanza koki”).
2.2. Saīsinājuma izveide;
Par vācu valodas lomu reģionālās identitātes veidošanā. Vācu valoda ir bijusi nozīmīga vēsturiskā kontaktvaloda ne tikai Baltijā (galvenokārt Latvijā un Igaunijā), bet daudz plašākā Ziemeļeiropas reģionā.
5.2. Lieka pieturzīme;
Hinderlings (Hinderling) uzsver vācu valodas biežo starpnieklomu, veicinot aizguvumu ienākšanu arī no tai rietumos esošajām vai Vidusjūras baseina valstu kultūrām, tādējādi pievēršot uzmanību kultūru ietekmes ceļiem.
2.4. Īpašvārdu atveide;
Interesants mūsu gadījumā ir secinājums, ka „valodu Eiropas” („Spracheuropa”) izpratnei nepieciešams pievērsties tās tālākajiem reģioniem, jo tur koncentrējas valodas elementi, kuru ceļš vedis caur dažādām valodām un kultūrām (Hinderlings 1981, 210-216).
1. Tehniskais noformējums;
Droši vien ne visi uzreiz iedomāsies, ka populārākbiežāk lietoto vārdu saraksta augšgalā ir palīgvārdi, kam seko visbiežāk lietotie vietniekvārdi. Šajā raksta lasītājiem tiek piedāvāā sniegts ieskats jaunizveidotajā Līdzsvarotajā mūsdienu latviešu valodas tekstu korpusā (LVK2018 (beta)) – simt biežāk lietoto vārdu saraksts un daži novērojumi par to.
7.3. Neiederīgs vārds; 9.1. Neuzmanības kļūda;
LVK2018 (beta) ir apmēram 10 miljonu vārdlietojumu liels vispārīgs, reprezentatīvs tekstu korpuss, kas izstrādāts LUatvijas Universitātes Matemātikas un informātikas institūta Mākslīgā intelekta laboratorijā (MIL) un publicēts 2018. gadā.
2.2. Saīsinājuma izveide;
Pēc uzbūves principiem LVK2018 (beta) līdzinās tekstu korpusa 2013. gada versijai LVK 2013 (Levāne-Petrova 2012), bet šis ir vairāk nekā divas reizes lielāks, arī morfoloģiskais marķētājs ir uzlabpilnveidots (Paikens 2016).
7.3. Neiederīgs vārds;
Līdzsvarotajam tekstu korpusam ir vairākas daļas, kurās iekļauti dažādu valodas funkcionālo paveidu teksti – periodika (60 %);, daiļliteratūra (20 %), zinātniskie teksti (10 %), normatīvie akti (8 %) un Saeimas stenogrammas (2 %) (Levāne-Petrova 2018), tāpēc ir interesantivar izveidot biežuma sarakstu gan visaiem korpusa tekstiem kopā, gan arī dažādu valodasfunkcionālo paveidu tekstiem atsevišķi. 1. tabulā redzami LVK2018 (beta) kopā, kā arīsimt biežāk lietotie vārdi, atsevišķi apskatāmi arī noteiktās korpusa daļās – periodikā un daiļliteratūrā (1. tabula), kā arī simt biežāk lietotie vārdi, savukārt 2. tabulā atrodami zinātniskajos tekstos, normatīvajos aktos un Saeimas stenogrammās biežāk lietotie vārdi(2. tabula).
1. Tehniskais noformējums; 5.3. Pieturzīmes trūkums; 6.5. Izteicēja izveide; 7.1. Liekvārdība; 7.2. Mazvārdība; 7.3. Neiederīgs vārds; 8. Tekstveide;
Tabulās katram vārdam norādīts absolūtais biežums korpusā, t. i., cik reizes attiecīgais vārds ir minēts korpusa vai tā daļas tekstā.
1. Tehniskais noformējums;
Lai būtu vieglāk salīdzināt vārdu biežumu dažādos valodas paveidu veidu tekstos, norādīts arī vārdu īpatsvars, t. i., cik procentu noiem korpusa vai tā daļas vārdlietojumiem aizņemu atbilst attiecīgais vārds.
1. Tehniskais noformējums; 7.1. Liekvārdība; 7.3. Neiederīgs vārds; 10.1. Sekundāra: saistāmība;
Kā redzams, korpusā kopā simt biežākie vārdi aizņemtbilst vairāk nekā 26 % no visiem vārdiem tekstos, tas nozīmē, ka vairāk nekā ceturtdaļa korpusa vārdlietojumu ietilpst pirmajā simtniekā.
1. Tehniskais noformējums; 6.5. Izteicēja izveide; 7.3. Neiederīgs vārds;
Noliegtie darbības vārdi tiek uzskatīti par atsevišķu leksēmu, tāpēc, piemēram, vārdiem būt un nebūt vai darīt un nedarīt ir atšķirīgas pamatformas un biežuma sarakstā tie ir iekļauti kā atsevišķas vienības. ATāpat arī sieviešu un vīriešu dzimtes vietniekvārdi un īpašības vārdi tiek uzskatīti par atsevišķām vienībām, jo tām ir atšķirīgas locīšanas paradigmas un datorizētā valodas apstrādē tas ir būtiski, tā, piemēram, vārdiem viņš un viņa vaisavukārt sieviešu un vīriešu dzimtes īpašības vārdi un skaitļa vārdi tiek uzskatīti par vienu leksēmu, piemēram, vārdiem viņš un viņa ir atšķirīgas pamatformas, un biežuma sarakstā tie ir atsevišķas vienības, bet formām jauns un jauna ir atšķirīgasviena pamatformas un (jauns), tāpēc biežuma sarakstā tie ir atsevišķasviena vienības.
7.2. Mazvārdība; 7.3. Neiederīgs vārds; 8. Tekstveide;
Apskatot dažādu valodas paveidfunkcionālo paveidu tekstus atsevišķi, redzams, ka visos, izņemot periodiku, biežāk lietotais lietvārds ir kāds cits (lai gan arī gads vairumā gadījumu atrodams saraksta pirmajā pusē), ko nosaka attiecīgā valodas funkcionālā paveida specifika.
7.2. Mazvārdība; 7.3. Neiederīgs vārds;
Daiļliteratūra starp valodas patekstu veidiem izceļas arī ar mazāku ciešamās kārtas lietojumu.
7.3. Neiederīgs vārds;