Meklēšana

Par korpusu Meklēšana Kļūdu tipu statistika Kļūdu kombināciju statistika
Atrasts/-i 264 vienumi
Tā, piemēram, burtu kopa (jeb digrafs) ll vairāks netiek izrunāts kaā palatāls l [ʎ], bet kaā [ j] skaņa, piemēram, Valladolid [vajadolid], ir nostiprinājusies tendence x burtu x visās pozīcijās izrunāt kā [ks] : Valladolid [vajadolid], piemēram, texto [teksto].
1. Tehniskais noformējums; 2.1. Vārdu pareizrakstība; 6.4. Vārdu secība; 7.1. Liekvārdība; 7.3. Neiederīgs vārds;
Arī tikaIr ticis reformēts spāņu valodāas alfabēts. T – tajā tagad ir 27 burti un 5 digrafi vai 2 burtu kombinācijas: Spāņu alfabēts: A(a), B(b), C (c), D(d), E (e), F (f), G (g), H (h), I (i), J (j), K (k), L (l), M (m), N (n), Ñ (ñ), O (o), P (p), Q (q), R (r), S (s), T (t), U (u), V (v), W (w), X (x), Y (y), Z (z), D; digrafi vai 2 burtu kombinācijas:ir ch /, ll /, gu /, qu /, rr. Tādu līdzskaņu atveide kā d, f, k, l, m, n, p, r, s ,t, t atveide sakrīt ar analoģiskiem līdzskaņiem, tātad arī burtiem latviešu valodā.
2.1. Vārdu pareizrakstība; 2.3. Sākumburti; 6.4. Vārdu secība; 6.5. Izteicēja izveide; 6.6. Dalījums teikumos; 7.1. Liekvārdība; 7.2. Mazvārdība;
Un pats galvenais ir tas, ka spāņu valodā šo burtu visās pozīcijās izrunā vai kaā [s] vai kaā [Ɵ]. Ņemot vērā, ka pieturamies pievērojam vārdu atveides fonētiskāo principau un jāievēro arī vienveidības princips, ir ieteicams palikt pie L. Ceplīša varianta un atveidot toz ar [s]s visās pozīcijās.
1. Tehniskais noformējums; 2.1. Vārdu pareizrakstība; 7.1. Liekvārdība; 7.3. Neiederīgs vārds; 10.1. Sekundāra: saistāmība;
Jauni vārdi, izmantojot esošos vārdu veidodarināšanas modeļus, tiek veidoti pamatā šādu vajadzību nodrošināšanai: • pārmaiņas sabiedrībā prasa dažu esošo jēdzienu pārdēvēšanu (politkorektums, globalizācija), • pārmaiņas ekonomikā u. c. veicina jaunu nozīmju piešķiršanu jau esošiem vārdiem (piem., tītenis, terīne; jaunā nozīme pamatā vērojama jaunā vārdu savienojumā, piem., tiešsaistes veikals, datu mākonis, finanšu drošības spilvens, probācijas kājsprādze, kafijas bārmenis), • ienāk vārdi, kas aizgūti no citām valodām (pamatā tā ir angļu valoda, taču ēdināšanās jomā vērojami aizguvumi arī no citām valodām), • tiek meklēti jauni pašcilmes vārdi jaunu reāliju apzīmēšanai vai esošo aizgūto apzīmējumu aizstāšanai (brūnītis, mandeļcepums, spilgtnis, vēlbrokastis, straumēšana, informācijpratība, pērļcukurs, arodalus, aluszinis, kopstrāde, barjerstabs), • jau esoši priekšmeti, jēdzieni tiek dēvēti jaunos vārdos (hūdijs ‘džemperis ar kapuci, kapučjaka’). (Wolf-Bleiss 2009, 87).
1. Tehniskais noformējums; 2.1. Vārdu pareizrakstība; 7.3. Neiederīgs vārds;
Labus rezultātus uzrāda arī otrs labākais parsētājs C2L2 – 77,43% UAS un 71,35% UAS (Shi et al., 2017). Šajā pašā gadā latviešu valodas UD koprpuss tiek izmantots kā viens no datu elementkorpusiem pētījumā (Nivre, Fang, 2017), kas argumentē, ka LAS metrika ir orientētalielākoties dotd labākus rezultātus analītisko valodu, piemēram, angļu, parsētājiem, un piedāvā alternatīvu metriku, tādeējādi iezīmējot ceļu prom nomazinot vairākas desmitgades ilgušāso angļu valodas dominancesi iegultajos rīku un metriku pieņēmumos nozarē. 2018. gadā šīs sacensības notiek vēlreiz, izmantojot UD v2.2 datus no 82 korpusos noiem 57 valodām.
1. Tehniskais noformējums; 2.1. Vārdu pareizrakstība; 6.1. Saistāmība; 6.5. Izteicēja izveide; 7.3. Neiederīgs vārds; 10.1. Sekundāra: saistāmība;
Tādeējādi nācās secināt, ka, pat: pat ja tiktu atrisinotātas citas mērogojamības problēmas, Čankera tālākai attīstīšanai par plaša pārklājuma praktiski izmantojamu sintakses parsētāju būtu absoljebkurā gadījumā būtiu nepieciešams sintaktiski marķēts korpuss, no kura šādu statistisko informāciju iegūt.
2.1. Vārdu pareizrakstība; 6.5. Izteicēja izveide; 6.6. Dalījums teikumos; 7.3. Neiederīgs vārds;
Iekļaujot diskursā stratēģijas un paņēmienus, kas klausītāju uzrunā emocijasonāli, kombinācijā ar faktiem un realitātes nosaukšanu, šķiet, var panākt vairāk un uzrunāt lielāku mērķa auditorijas daļu, nekā vienkārši tiešā veidā pasniedzot lielu daudzumu informācijas, skaitļu un faktu, kas daļai auditorijas neko neizsaka un attiecīgi var netpalikt nesadzirdēti (Romāne 2017).
2.1. Vārdu pareizrakstība; 3. Vārddarināšana; 6.3. Noliegums; 6.5. Izteicēja izveide; 7.1. Liekvārdība; 7.2. Mazvārdība;
Tādeējādi, lai iegūtu tā brīža resursiem optimālus semantisko rīku darbības rezultātus, nepietika izvēlēties parsētāju ar augstākajiem precizitātes rādītājiem, pat tad, ja precizitātes rādītāji atšķirāas par vairāk nekā 5pieciem procentpunktiem (~10%).
1. Tehniskais noformējums; 2.1. Vārdu pareizrakstība; 4.2. Darbības vārds; 5.2. Lieka pieturzīme;
Turklāt 3.2.21.1.3. nosadaļā aprakstītā transformatora pārveide pirms UD v2.4 ir tiešā veidāi orientēta uz būtiskāko trūkumu uzlabošanu – tā būtiski uzlabo ar vienlīdzīgiem teikuma locekļiem un teikuma priekšmetiem saistīto paplašināto atkarību saišu piešķiršanas mehānismu, tādeējādi samazinot iespējamo kļūdu apjomu.
1. Tehniskais noformējums; 2.1. Vārdu pareizrakstība; 3. Vārddarināšana; 7.1. Liekvārdība; 10.1. Sekundāra: saistāmība;
Tādeējādi LVTB ir pamats, kurā balstās FullStack-LV projektsbalstīti visi nākamie marķējuma līmeņi FullStack-LV daudzslāņu valodas resursu kopā.
2.1. Vārdu pareizrakstība; 6.4. Vārdu secība; 8. Tekstveide;
Izmaiņas nevar pārvērst par ļaunuma deēmonu un nevar arī vienkāršot – tāpat kā jebkura norise valodā, arī šī ir daudzveidīga un daudzslāņaina.
2.1. Vārdu pareizrakstība;
Datu transformācijas, kas šajos pētījumos tika atzītas par perspektīvām, daudzos aspektos ir līdzīgas UD marķējuma modelim, tādeējādi iezīmējot UD korpusa izveidi kā loģisku darba turpināšanas virzienu.
2.1. Vārdu pareizrakstība;
Dažādu projektu ietvaros takorpuss ir pieaudzis līdz pat 17 tūkstošiem teikumu 2022. gadā un tādeējādi kļuvis par būtisku latviešu valodas datorlingvistikas resursu. Raksturojot LVTB attīstību raksturojot,, nosacīti var runāt par nosacīti divām fāzēm – eksperimentālu sākotnējo marķēšanas fāzi (angl. pilot project) un masveida korpusa paplašināšanas fāzi no apmēram 2016. gada.
2.1. Vārdu pareizrakstība; 6.4. Vārdu secība; 7.2. Mazvārdība; 7.3. Neiederīgs vārds;
Kolonnas FEATS aizpildījumu pamatā nosaka morfoloģiskajā tagā iekļautās pazīmes, taču atsevišķos gadījumos pazīmes piešķir, arī vadoties pēc lemmu uzskaitījuma, piemēram, vairumam īpašības vārdu pazīme Poss (possesive, piederība) netiek aizpildīta, taču to norāda vārdiem manējais, tavējais.
2.1. Vārdu pareizrakstība; 5.3. Pieturzīmes trūkums;
Linda Lauze (2018) norāda, ka “Mmutvārdu tekstā dialogs dominē gan tiešā nozīmē kā galvenā teksta izpausmes forma, gan pārnestā – kā adresanta un adresāta mijiedarbe. un jautājuma formā ir iespējams izteikt pamudinājumu: „Pēc savas uzbūves tie ir it kā jautājuma teikumi, bet šo izteikumu mērķis ir pamudināt uzrunāto personu izdarīt kādu darbību. Sarunvalodas sintakses, kā arī ikdienas saziņas pētījumi apliecina, ka mutvārdu tekstā ir izplatīti gadījumi, kad jautājuma veidā tiek izteikts netiešs lūgums.” (Lauze 2018, 169) Ja vērtējam Latvijas Valsts prezidentu runas valsts pastāvēšanas simts gados, jāsaka, ka gan prezidenti, gan arī situācijas, kurās tauta tiek uzrunāta, ir ļoti dažādas un arī runās parādās dažādas stratēģijas un lingvistiskie paņēmieni, p. Parasti tās nav tieši vērstas uz klausītāju pārliecināšanu vai manipulēšanu, bet drīzāk var tikt skatītāmas kā dialogs ar sabiedrību par tai nozīmīgiem jautājumiem (Wilson 2015, 1).
1. Tehniskais noformējums; 2.1. Vārdu pareizrakstība; 2.3. Sākumburti; 6.5. Izteicēja izveide; 6.6. Dalījums teikumos; 7.2. Mazvārdība;
Tādeējādi šie augstie rezultāti (salīdzinājumam vēl 2016. gadā Andor et al. par SyntaxNet ziņo, ka angļu valodas precizitāte ir virs 90% LAS pamata atkarībām, bet čehu valodas – mazliet zem šī rādītāja) pilnvērtīgi apstiprina darba 2. hipotēzi, ka vidēja izmēra korpuss (10-20 tūkstoši teikumu) ir pietiekams augstas kvalitātes (state-of-the-art) parsētāju izveidei.
1. Tehniskais noformējums; 2.1. Vārdu pareizrakstība; 5.2. Lieka pieturzīme; 7.2. Mazvārdība;
Ja kādreiz (jau 20. gs. literatūrā) arī skaitlis 13 arī pieminēts, tad tikai kā neitrāla vienība homogeēnu skaitļu virknē bez īpašas semantiskas noslodzes, piemēram: Es saskaitīju visus mājas iedzīvotājus, un iznāca tāpat trīspadsmit galvu kā pērnajā gadā.
1. Tehniskais noformējums; 2.1. Vārdu pareizrakstība; 6.4. Vārdu secība; 7.2. Mazvārdība;
Protams, arī daiļliteratūrā dominē daudzskaitļa ģenitīva forma (283 reizes), bet tāpat sastopama gan vienskaitļa ģenitīva (Kā var ienaidnieku atšķirt no īsta latvja?), gan citu vienskaitļa locījumu formas, izņemot lokatīvu (Es kā latvis neesmu izdevies; Kas pat lika dažam labam latvim aiz pārsteiguma saķeŗrt galvu [..]; Es vēlētos, lai mans dēls uzaug par īstu LATVI!), gan arī citi daudzskaitļa locījumi (Mēs, latvji, esam visvairāk cietusī tauta pasaul's vēsturē!; Latvjiem jācīnās un jāuzvar!; Un vāczemnieki spieda latvjus, un krievzemnieki un poloņi, un pat lielie ziemeļnieki spieda un spieda latvjus; Šodien es sākšu apgrozīties latvjos [..]).
1. Tehniskais noformējums; 2.1. Vārdu pareizrakstība;
Savukārt A. Šlesera lietotais izteiciens "nahuj jāvāc nost" atkal demonstrē brīvu un neprecīzu krievu lamu vārdu izmantojumu, jo klasiskā formulā nahuj iezīmē darbības nevajadzīgumu, noliegumu (kā frāzē "nahuj man tas jādara?"), bet šeit acīmredzami pasvītrouzsver darbības nepieciešamību.
1. Tehniskais noformējums; 2.1. Vārdu pareizrakstība; 2.2. Saīsinājuma izveide; 7.3. Neiederīgs vārds;
Un tiešām, tajos ieskatoties un ieklausoties, jūtama valodas spēja spēlēties ar vārdiem, tos apvienot un darināt, lai veidoradītu semantiski ietilpīgus unvārdus ar pavisam skaidru nozīmi izsakošus vārdus: caurbira, ciemkukulis, cukurgailītis, čučumuiža, diegabiksis, dievpalīgs, dritvaikociņ, gaiļbiksīte, jokupēteris, kājāmgājējs, krējumlaiža, krustnagliņa, labrītiņi, perampuika, pretpulksteņrādītājvirziens, rasaskrēsliņš, rāvējslēdzējs, sirdslieta, skursteņslauķis, sniegpulkstenīte, zirgābols. Salikteņu darināšana latviešu valodā patiešām jau izsenis ir bijusis un joprojām ir raksturīgs un produktīvs vārdu darināšanas paņēmiens.
2.1. Vārdu pareizrakstība; 6.1. Saistāmība; 7.1. Liekvārdība; 7.3. Neiederīgs vārds;