Jezik smo ljudje – Ditko.si – Digitalni jezikovni globus

Jezik smo ljudje

»Pisanje je nenaravno. […] Govorjena beseda je starejša od človeške vrste. Pisana beseda pa je novejši izum, ki ni pustil nobenih sledov v človeškem genomu, zato se je moramo s trudom učiti vse otroštvo in še čez.«
Steven Pinker

Ko nas vprašajo o našem jeziku, pogosto mislimo nanj samo v okvirih, ki pomenijo knjižno slovenščino. Toda dejstvo je, da nihče v vsakdanjem življenju ne govori popolne knjižne slovenščine – ne samo v zasebni rabi, niti v javnih situacijah ne, če moramo javno spregovoriti spontano, ne da bi se besedila prej naučili ali ga prebrali. To je normalno. Vsak človek ima nekoliko samosvoj, edinstven jezik. Edinstven na vseh ravneh: kako izgovarjamo posamezne glasove, kako naš govor zveni, katere besede raje ali pogosteje uporabljamo, katere kombinacije besed so v našem govoru bolj običajne kot v govoru koga drugega, kako se odzivamo na sporočila drugih, kako oblikujemo svoja sporočila.

Tudi ko pišemo, uporablja vsak od nas določene jezikovne vzorce, ki so nekoliko posebni, specifični samo zanj. S tem področjem se ukvarja veja jezikoslovja, ki se imenuje jezikovna forenzika. Z računalniško primerjavo več besedil istega avtorja lahko ugotovimo, kateri so zanj značilni jezikovni vzorci, in nato med besedili različnih avtorjev odkrijemo besedilo tega avtorja.

Teoretsko razlago teh fenomenov lahko najdemo v veji jezikoslovja, ki se imenuje korpusno jezikoslovje in ki med izvorno jezikoslovnimi vedami v največji meri izkorišča potencial računalniške analize podatkov. Michel Hoey, znan angleški korpusni jezikoslovec, tako na primer na podlagi analize velikih količin podatkov v jezikovnih korpusih razlaga, da besede s tem, ko jih srečujemo v različnih okoliščinah in sobesedilih, postanejo povezane s sobesedili in okoliščinami, v katerih so bile rabljene. Naše védenje o besedah tako vključuje informacijo, da se sopojavljajo z določenimi besedami v določenih vrstah konteksta. Posledica posameznikovega srečevanja besed v določenih kontekstih je mentalno proženje besed za rabo v komunikaciji. Ker ima vsak posameznik povsem samosvoj, edinstven nabor komunikacijskih kontekstov, v katerih je sodeloval skozi svoje življenje, je rezultat ta, da ima vsak od nas nekoliko samosvoj, edinstven jezik. Če torej posplošimo in karikiramo, lahko rečemo, da imamo v realnosti opravka s toliko različnimi slovenščinami, kolikor različnih ljudi jo govori in piše.

Še o eni pomembni stvari nas uči zgornje spoznanje. Besede vsak dan rabimo v nenehno novih in novih kontekstih, kar vpliva na to, da se naši obstoječi vzorci ali utrdijo ali pa oslabijo, če srečamo besedo v nenavadnem, novem kontekstu. Naš jezik se zato vsak trenutek, z vsakim novim besedilom, ki ga beremo, z vsakim zapisom, ki ga naredimo, z vsakim pogovorom spreminja.

Korpusi so elektronske zbirke avtentičnih besedil, kot so novinarski članki, revije, spletne vsebine, leposlovje itd. Ključno je, da so te zbirke izredno velike. Za slovenščino sta trenutno najvidnejši tovrstni zbirki korpus Gigafida in KRES. Gigafida z več kot 1 milijardo besed tudi v svetovnem merilu sodi med velike korpuse. Ker pa zaradi tolikšnega obsega ne more biti ustrezno uravnotežen, je bil iz njega izluščen manjši, a zato bolj uravnotežen korpus KRES, ki obsega 100 milijonov besed. Za analizo jezika ni namreč vedno pomembna samo velikost podatkov, ampak tudi ustrezna zastopanost podatkov z različnih področij.

Korpusi, kot sta Gigafida in KRES, pa niso pomembni samo za raziskave, pač pa nam lahko pomagajo tudi pri vsakodnevnem odločanju zlasti pri besedah, ki so v slovarjih različno, pomanjkljivo ali še sploh ne opisane. Ko smo v dvomih, ali so otroci, ki obiskujejo vrtec, vrtičkarji, ali je bolje, da pišemo absorpcija ali absorbcija, so delavci prekerni ali prekarni, ali imamo alergijo na penicilin ali alergijo za penicilin, so korpusi nepogrešljiv pripomoček pri odločanju.
Korpusa Gigafida in KRES sta podrobneje opisana v monografiji Korpusi slovenskega jezika Gigafida, KRES, ccGigafida in ccKRES: gradnja, vsebina, uporaba ter prosto dostopna prek uporabniško prijaznega vmesnika.

Kot nasprotni pol knjižne slovenščine pogosto postavljamo idealizirana narečja in tožimo, da izumirajo. Res je, slovenski jezik je narečno eden najbolj razpršenih na svetu. To notranjo raznovrstnost našega jezika upravičeno štejemo za dragoceno kulturno dediščino. Toda spreminjanja narečij ni mogoče ustaviti. Tako kot za knjižni jezik velja, da ni nikogar, ki bi ga v spontanem govorjenju v popolnosti realiziral, tudi pri narečjih velja, da njihova idealizirala, neomadeževana različica v vsakdanji rabi ne obstaja.
Maja Bitenc je v svoji doktorski raziskavi natančno analizirala govor petih oseb, ki so dnevno prehajale iz svojega narečnega okolja v Ljubljano. Tako kot so se tudi v uradnem delovnem oz. šolskem okolju v Ljubljani v njihovem govoru pojavljale določene narečne prvine, so se tudi v njihovem domačem okolju v zasebni rabi pojavljale prvine, ki niso del njihovega narečja. Vendarle pa so med različnimi govorci pomembne razlike, ki izhajajo iz kompleksne celosti naših osebnosti. V podobnih ali istih situacijah različni ljudje ravnamo različno. To velja tudi, ko gre za jezik. In tudi ko gre za jezik, je to povsem legitimno. Različni smo. Nekateri ob prehodu iz svojega domačega v tuje (mestno) okolje spremenimo svoj jezik – iz narečja preklopimo v knjižno slovenščino, kolikor jo najbolje zmoremo in obvladamo. Drugi tudi v tujem okolju ohranjamo svojo domačo govorico. Spet tretji poskušamo preklapljali, vendar počnemo to le deloma – svojo domačo govorico pomešamo s knjižno (ali tujo) govorico. Vse to so legitimne podobe našega vsakdanjega jezika.

Raziskava Maje Bitenc je nastala na podlagi snemanja avtentične govorjene rabe izbranih oseb v vsakdanjem življenju. Takšne posnetke jezikoslovci nato skrbno poslušajo, deloma ali v celoti transkribirajo, nato pa transkribirane podatke tudi kvantitativno analizirajo. Rezultati raziskave Maje Bitenc so objavljeni v monografiji Z jezikom na poti med Idrijskim in Ljubljano.

Sledi: Tako se govori