Denar ni problem, tudi ideje ne, problem je izvedba

Simon Krek: Kako se bomo organizirali glede digitalizacije slovenščine, je povsem naša stvar.

Objavljeno
12. november 2012 18.48
SLOVENIJA,LJUBLJANA,8.11.2012,JEZIKOSLOVEC SIMON KREK.FOTO:MAVRIC PIVK/DELO
Igor Bratož, kultura
Igor Bratož, kultura
Nekdanji urednik knjižne zbirke­ Krt in urednik slovarjev pri DZS Simon Krek ima zdaj dva delodajalca. Večinski je Amebis, eno od dveh podjetij, ki se ukvarjata z jezikovnimi tehnologijami za slovenščino, drugi je Institut »Jožef Stefan«,­ natančneje, laboratorij za umetno inteligenco, kjer skrbi za slovenske jezikovne vire in tehnologije.

Koordinira večji projekt s temi vsebinami Sporazumevanje v slovenskem jeziku 2008–2013. »Znotraj tega smo združili večino akterjev, ki se bodo zmogli dokopati do predpogojev za novi pravopis, slovar in slovnico,« pravi dr. Krek.

Gospod Krek, vaša študija Jeziki v evropski informacijski družbi, ki ste jo pred kratkim predstavili, sledi želji po rasti tehnološke podlage večjezikovne evropske informacijske družbe. Kje v tem oblaku sploh je Slovenija?

Projekt Meta-Net, v katerem sodeluje tudi laboratorij za umetno inteligenco Instituta 'Jožef Stefan', je bil v glavnem namenjen temu, da se pregleda stanje pri vseh jezikih v Evropi; jaz sem bil zadolžen za slovenščino. Izkazalo se je, da obstaja velik prepad med manjšimi jeziki, ki so bili tehnološko podhranjeni v prejšnjih desetletjih, in velikimi. EU je v svojih transformacijah od EGS naprej ves čas skrbela za svoje jezike, tehnologije in vire, ampak preden smo vstopili mi, so bili tega deležni večinoma veliki jeziki, nemščina, italijanščina, španščina, angleščina, francoščina. Vstop Slovenije, Latvije, Estonije, Litve in drugih jezikov z relativno malo govorci, a vendar uradnih jezikov EU, je presenetil, saj so pričakovali, da so vsi jeziki v podobnem stanju, da imajo torej na voljo podobne vire in tehnologije. Prišleki so bili podhranjeni, pokazale so se razlike med velikimi jeziki, ki so komercialno zanimivi za izdelavo slovarjev in drugih jezikovnih virov in tehnologij. Na drugi strani je niz jezikov z drugačno usodo. Slovenščina se po jezikovni opremljenosti uvršča med jezike, kot so slovaščina, estonščina, litvanščina, latvijščina, je pa za češčino, tudi še bolj daleč za nizozemščino, poljščino ... V tem smislu je stanje zdaj jasno, ve se, kaj je treba narediti, bistveno sporočilo primerjave pa je, da pri nas tega ne počnemo na ustrezen način, da nismo organizirani oziroma smo slabo organizirani.

Laičen pogled postreže z ugotovitvijo, da institucio­nalni okvir za razvoj jezikovnih virov in tehnologij imamo, vse institucije, ki bi morale skrbeti za slovenščino, so tu, vprašanje je le figura koordinatorja. Direktorica direktorata za tolmačenje pri evropskem parlamentu je med obiskom v Ljubljani pred slovenskim predsedovanjem postregla z lepo zvenečo sentenco Jezik je vaša zastava. Kako pa plapola?

Za moje pojme slabo, predvsem zaradi neorganiziranosti. Tu bi s prstom pokazal na državo, saj prizadevanj na različnih koncih v razi­skovanju, državno financiranem na različnih koncih, na univerzah in inštitutih ter v industriji in drugod ne zmore povezati. Bistvena vloga skrbnika slovenskega jezika je seveda dodeljena Inštitutu za slovenski jezik.

Tudi koordinatorska?

Kako se organizirati, je posebno vprašanje. Novih načinov nam ni treba izumljati, jeziki, institucije in države so se že organizirali, imamo zglede – estonskega, nizozemskega, niz je dolg –, ki so preverjeni v praksi, zato točno vemo, kaj bi bilo treba narediti. Zadeva je preprosta. Najprej mora nastati podroben načrt, za to je potrebno vsaj eno leto, v katerem vsi, ki se s tem ukvarjamo, analiziramo, kje so naše šibke točke, potem sledi delo, vsi akterji organizirano, po načrtu. Za to je seveda prav tako potreben denar. V Sloveniji to področje že financiramo, imamo pa kaotično situacijo, ker ne vemo, kaj kdo počne. Nekatere stvari zato delamo na treh koncih, nekaterih pa se sploh ne lotimo. Nihče nima dobrega pregleda nad tem področjem, ni preglednega načrta, na katerem bi lahko odkljukali opravljeno. Poleg tega se izdelani viri izgubljajo, ker po koncu projektov nihče ne skrbi zanje. Osnutek predloga resolucije o jezikovni politiki 2012–2016, v katerem je bila predvidena izdelava takšnega načrta, je bil objavljen maja letos, skupina, ki ga je pripravila, je bila razpuščena, zdaj je delo prevzela druga skupina. Počakajmo rezultate. To sicer ni bilo ravno smiselno, odločitev je bila politična, zgodila se je ob menjavi vlade. Moj predlog bi bil konzorcij, povezava akterjev z različnih področij, a z istim in v konsenzu definiranim ciljem, to bi bilo edino smiselno. Tako so naredili tisti, ki so dobro organizirani.

V vašem letošnjem premišljevanju oziroma eseju o stanju Slovenščina,­ nje cvetenje ali osutje naštevate številne želje in tihe načrte v risu jezikovne opremljenosti, slovnico, slovarje, pravopis ... Ni videti, da bi se kaj pomembnega dogajalo.

Tu sta dva problema, namreč da sploh ne vemo, kaj se dogaja. Inštitut, ki skrbi za te stvari, svojega programa nima javno objavljenega. Ne vemo, kaj počne, ne vemo, ali novi pravopis nastaja ali ne, kdaj naj bi bil, če bi bil, kdaj naj bi bil novi slovar in kakšen naj bi bil. Te vrste informacij niso transparentne in javne. Drug velik problem je, da se – kar zadeva jezikovne vire in tehnologije – realnost okoli nas spreminja izjemno hitro, to lahko vsi občutimo. Poglejmo, kaj se dogaja z založbami, knjigami, digitalnimi knjižnicami. Jeziki se digitalizirajo, pospešeno digitalizirajo, če ne bomo na tem vozu zdajle, bomo kot jezik pač zaostali še bolj. Problem je, da mora tako majhna skupnost za svoj jezik poskrbeti sama. Nihče ne bo tega počel namesto nas, Evropska unija bo delno že poskrbela za svoje uradne jezike, ampak kako se bomo organizirali glede digitalizacije, je povsem naša stvar. Pri slovarjih in pravopisih je vse v rokah inštituta, za to je bil ustanovljen in moral bi iti v korak s časom, ta čas pa je predvsem digitalen, spleten in znatno hitrejši kot prej. Zdaj so na voljo viri in orodja, ki omogočajo neskončno natančnejšo in hitrejšo analizo jezika. Na podlagi tega je mogoče narediti bistveno boljše slovnice in slovarje. Dovolj se je le ozreti malo naokrog, na inštitut za bolgarski jezik, inštitut za slovaški jezik, estonski jezik in podobne, pa vidimo, kako nam gre oziroma ne gre. Konkretno lahko denimo povem, da naši izračuni kažejo, da je z novimi tehnologijami mogoče izdelati novi slovar slovenskega jezika v petih letih, popolnoma na novo, od A do Ž. Prvi je nastajal ­štirideset let.

O virih in aplikacijah govorite kot o dveh plateh istega kovanca.

Seveda, eno so tehnologije, ampak tehnologije nujno potrebujejo vire, slovarje, normativne priročnike, pravopis, slovnico, če tega nimamo, tehnologij ne moremo razviti. Tehnologije so postale del vsakdana, pri večjih jezikih je že samoumevno, da lahko govorim v enem, računalnik prepoznava moj govor in ga prevaja v drug jezik. Ne vidim razloga, zakaj ne bi šli v korak z drugimi.

Neučinkovito načrtovanje oziroma nenačrtovanje in razpršenost početja, ki ju omenjate, zahtevata nekakšnega koordinatorja, 'firerja'.

No, firerja ne rabimo, rabimo predvsem koordinacijo, odločitev z vrha, to pa ima smisel, če ima tisti, ki odloča, tudi finance.

Govoriva o ministrstvu za vse?

Da, o povsem konkretnem ministrstvu, ker – paradoksalno – zdaj obsega vse potrebno. Prej je bilo drugače, o teh zadevah so soodločala tri ministrstva, za šolstvo, za znanost in tehnologijo in za kulturo, zdaj je vse združeno, domnevati bi bilo mogoče, da bo zdaj, ko so pod eno streho, odločanje lažje – mislil bi si, da bodo z resolucijo dobili načrt za naslednjih pet let in potem, ko bi bil načrt, ki bi vključeval vse akterje in svetovalce, dokončan, bi le še izvajali tisto, kar je bilo sklenjeno. To bi bila dobra organizacija. Tu gre za politično odločitev, to lahko naredi le vlada Republike Slovenije, mi sami se ne moremo ustrezno dogovoriti, ker ne obvladujemo financ.

Pa gre res le za denar? So težave še drugačne, niso morda posredi tudi kadrovske zadrege? Pomanjkanje idej? Sploh vemo, kaj bi si morali želeti?

Moje mnenje je, da je denarja – paradoksalno, čeprav smo v krizi – dovolj. Z denarjem, namenjenim vsem organizacijam, ki se ukvarjajo z jezikom, bi se v resnici z boljšo organizacijo dalo narediti tisto, kar je treba. Z idejami nimamo problema iz preprostega razloga, ker poznamo dobre prakse iz tujine, gre le za to, da se tiste, ki bi bile primerne za slovenščino, smiselno prenesejo v naš prostor. Denar ni problem, ideje niso problem, problem je izvedba: ne bo spontanega izbruha, za spremembe je treba poskrbeti.

Kako komentirate intervencijo informacijske pooblaščenke v zvezi s korpusom Nova beseda?

Kočljivo vprašanje, zato ker stanje ni povsem jasno. Nova beseda je zadeva Znanstvenoraziskovalnega centra SAZU, jaz nisem tam, sem na IJS. Tu gre po mojem mnenju za trk dveh sodobnih trendov, prvi je ta, da je na internetu težko varovati osebne podatke, in tu je institut informacijskega pooblaščenca smiseln, prav je, da obstaja; varovanje osebnih podatkov je ena plat te zgodbe, druga pa je, da je internet prinesel dostop do ogromne količine podatkov, ki ga prej ni bilo. To je načeloma tudi dobro, ker lahko delamo – predvsem pri jezikovnih tehnologijah in virih – tisto, česar prej enostavno nismo mogli početi. Ampak trenda sta trčila na nepričakovan način. Stvari v resnici namreč niso urejene v tem smislu, da bi tisti, ki upravljajo zbirke besedil, kakršen je korpus Nova beseda, točno vedeli, kakšne strategije uporabljati, na drugi strani pa je bila reakcija informacijske pooblaščenke izjemno ostra, nepričakovana in v bistvu se ni skladala s tem, kar delajo drugi informacijski pooblaščenci po evropskih državah, kjer imajo natančno take korpuse, kakršna sta Nova beseda in Gigafida, prav tako prosto dostopna na internetu. Tu je šla slovenska pooblaščenka en korak predaleč, seveda pa se moramo tudi tisti, ki besedila zbiramo in obdelujemo, uskladiti med sabo in premisliti, kje dejansko ogrožamo ljudi, ki ne želijo biti razkriti. V Evropi je v procesu sprejemanja zakonodaja o tako imenovani pravici do pozabe, ko bo sprejeta in uveljavljena v praksi, bomo vsi vedeli, kako ravnati.

Pa postopek pri nas še ni ­sklenjen?

Drugače je šlo, izdana je bila odločba, nato je prišlo do pogovorov – o tem težko kvalificirano govorim, ker nisem bil udeležen – in potem je bila odločba baje razveljavljena, ker je prišlo do dogovora med Inštitutom za slovenski jezik in pisarno pooblaščenke; to pomeni, da odločba ne velja več. Če je to res, bi inštitut pravzaprav lahko celo tisto, kar je zdaj implementirano – da je onemogočeno iskanje kombinacij lastnih imen – prezrl in bi to bilo brez konsekvenc. A to visi v zraku, nikjer ni zapisano, samo izrečeno je bilo.