Biežākās kļūdas latviešu valodā: korpusā balstīta kļūdu analīze un teksta labošana (Norma)

Projektā “Biežākās kļūdas latviešu valodā: korpusā balstīta kļūdu analīze un teksta labošana” top latviešu valodas rediģējumu korpuss “Norma”, kurā tiek dokumentētas, labotas un skaidrotas biežākās latviešu valodas kļūdas. Korpusa marķēšanai ir izveidota kļūdu klasifikācija, un tajā var meklēt gan fragmentus ar atsevišķiem kļūdu tipiem, gan biežākās kļūdu tipu kombinācijas.

“Normas” izveides metodika un dati ļaus analizēt, kā šādas kļūdas ietekmē latviešu valodas gramatisko sistēmu, un, apkopojot un sistematizējot biežāk sastopamās kļūdas, izstrādāt mūsdienīgus, korpusā balstītus ieteikumus rakstu valodas kvalitātes uzlabošanai. Tāpat kļūdu korpuss tiks izmantots, lai radītu pilnīgāku gramatikas pārbaudītāju, kas norāda ne tikai uz tehniskām neprecizitātēm un vienkāršākām pareizrakstības vai interpunkcijas kļūdām, bet arī uz teikuma konstrukciju izveides un citām kļūdām.

Darbs pie “Normas” skaidri atklāj redaktoru un korektoru ieguldījumu teksta sagatavošanā, tādēļ papildus datu vākšanai un marķēšanai tika mēģināts noskaidrot, kuras kļūdas pamana un izlabo dažādi literārie redaktori, tāpēc tika izveidots redaktoru vienprātības tests.

Sociālajos tīklos tika uzrunāti brīvprātīgie ar pieredzi literārajā rediģēšanā, un viņu uzdevums bija izlabot vienu un to pašu tekstu. Visi rediģējumi tika salīdzināti, tika izrēķināts vidējais labojumu skaits, izveidota labojumu karte un labojumu pārskats.

Komanda: Baiba Saulīte, Ilze Lokmane, Agute Klints, Kristīne Pokratniece, Roberts Darģis, Normunds Grūzītis, Viesturs Jūlijs Lasmanis
Atbalstītāji: Latviešu valodas aģentūra

Norma
Latvijas Zinātnes padomes Fundamentālo un lietišķo pētījumu projekts "Biežākās kļūdas latviešu valodā: korpusā balstīta kļūdu analīze un teksta labošana (Norma)" (lzp-2023/1-0481; 01.01.2024.–31.12.2026.)