V nadaljevanju preberite:

Vida Kocijana računalniki privlačijo že od nekdaj. V mladosti je celo opustil igranje v heavy metal bandu, ker zaradi ukvarjanja z računalniki ni imel dovolj časa za vaje. Fascinira ga, da »ko računalnik enkrat naučiš reševanje nekega problema, ga vedno lahko reši namesto nas«. Zanima ga, katere naloge bi bilo še mogoče učinkovito avtomatizirati in s tem prihraniti človeško delo. »Se pa v praksi pogosto izkaže, da imamo več dela s pisanjem programa, ki bi rešil nalogo, kot z njenim običajnim reševanjem,« prizna med smehom.



Vid Kocijan

Po študiju računalništva in matematike na Univerzi v Ljubljani je z magistrskim in doktorskim študijem nadaljeval na elitni univerzi v Oxfordu, kjer trenutno piše doktorsko nalogo, v kateri se ukvarja predvsem s načinom, kako z računalniškimi programi procesirati človeška besedila.

V okviru doktorskega študija na univerzi v Oxfordu se je Vid Kocijan podrobneje ukvarjal s problemom zdrave pameti. FOTO: Osebni arhiv

Dvoumnost človeškega jezika

Ko beremo ali poslušamo govor, se za razumevanje samodejno zanašamo na znanje, čeprav bi mnogi stavki lahko pomenili marsikaj drugega.

Predavanja na Oxfordu niso nujno boljša kot v Ljubljani, je pa nivo in zahtevnost lahko višja, je svoje izkušnje povzel Kocijan. FOTO: Osebni arhiv

Avtomatizirana diskriminacija

»Študij v okolju, ki je znano po talentu, zaradi česar privablja še več talenta in priložnosti, je velik privilegij,« je študij na oxfordski univerzi opisal Kocijan. FOTO: Osebni arhiv

Zmagovalno zaznavanje lažnih novic

Ob kavi

① Najpomembnejši izum v zgodovini človeštva?

Pisava.

② Tri stvari, brez katerih si ne predstavljate življenja?

Spanje, zeljna solata in slovenski hribi.

③ Koga najbolj občudujete?

Alan Turing je bil kar fascinanten.

④ Katero knjigo imate trenutno na nočni omarici?

Mitološko izročilo Slovencev Zmaga Šmitka.

⑤ Slovenija ali tujina?

Slovenija za udobno življenje, tujina za kariero. Za katero se bom odločil, še ne vem.

Vida Kocijana računalniki privlačijo že od nekdaj. V mladosti je celo opustil igranje v heavy metal bandu, ker zaradi ukvarjanja z računalniki ni imel dovolj časa za vaje. Fascinira ga, da »ko računalnik enkrat naučiš reševanje nekega problema, ga vedno lahko reši namesto nas«. Zanima ga, katere naloge bi bilo še mogoče učinkovito avtomatizirati in s tem prihraniti človeško delo. »Se pa v praksi pogosto izkaže, da imamo več dela s pisanjem programa, ki bi rešil nalogo, kot z njenim običajnim reševanjem,« prizna med smehom.V okviru doktorskega študija na univerzi v Oxfordu se je podrobneje ukvarjal s problemom zdrave pameti. »Trenutno že obstajajo programi, ki znajo zelo sofisticirano odgovarjati na zelo specifične probleme, za katere bi ljudje potrebovali mnogo časa in raziskovanja, saj informacije zelo hitro najdejo na spletu,« je pojasnil. Že pred desetimi leti so pri IBM razvili računalniški sistem Watson za odgovarjanje na vprašanja, ki je na televizijskem kvizu Jeopardy! premagal človeške tekmece. »Po drug strani pa imajo takšni programi težave z vprašanji o najbolj preprostih samoumevnostih, za katere predvidevamo, da so vsakomur jasne. Ker nam jasnih dejstev, kot je denimo, da če iz roke izpustim žlico, bo ta padla, zaradi njihove samoumevnosti ni treba posebej izrekati, računalniški sistemi, ki se učijo z analizo besedil, nanje ne poznajo odgovorov,« je težavo orisal Kocijan.Računalniški modeli za avtomatsko obdelavo človeških besedil večinoma uporabljajo strojno učenje, oziroma njegovo vejo globoko učenje, ki za reševanje problemov uporablja velike nevronskih mreže. Kocijan opozarja, da si grajenja nevronskih mrež ne smemo predstavljati kot ustvarjanja umetnih možganov. V resnici so to zgolj matematične funkcije, ki so zelo uporabne v statistični analizi, saj se dobro prilagajajo podatkom in jih lahko uspešno posplošujejo na podobne podatke. Ko so pred skoraj sto leti prvič razvili tovrstne matematične funkcije, se jim je zdelo, da so morda podobne možganom. Čeprav danes vemo, da to ni res, se je ime obdržalo, je pojasnil Kocijan.Zaposluje ga izziv, kako iz človeškega besedila ekstrahirati podatke v logični matematični obliki. »Dvoumnost človeškega jezika me vedno znova preseneča. Ko beremo ali poslušamo govor, se za razumevanje samodejno zanašamo na naše znanje, čeprav bi mnogi stavki lahko pomenili marsikaj drugega, a o drugih možnostih interpretacije ponavadi sploh ne razmišljamo,« je pojasnil Kocijan. Prizadeva si, da bi lahko računalniki sami v besedilih našli želene podatke in jih pravilno izpisali v logičnem, nedvoumnem jeziku.Področje, ki ga raziskuje, je na preseku računalništva in jezikoslovja. A Kocijan se bolj kot na jezikoslovne teorije zanaša na statistične obdelave besedil. Kljub temu, da je problem umetne inteligence pri vprašanjih, ki terjajo zdravo pamet, ravno v tem, da zdravorazumskih stvari nikoli ne zapišemo, ker so nam samoumevne, ga je zanimalo, kako uspešno rešiti te probleme zgolj z obdelavo enormnih količin besedila. Seveda bi te izrečene samoumevnosti lahko jasno zapisali, a izkazalo se je, da obstaja preprostejša rešitev. »Ko smo iz spleta pobrali še večje količine teksta, smo prišli celo do boljših rezultatov, kot če bi vse te situacije opisovali sami, poleg tega pa so na ta način delo opravljali računalniki, ne ljudje,« je pojasnil Kocijan.Podoben izziv predstavljajo tudi Winogradove sheme, serija lingvističnih dvoumnosti, zasnovana kot nadgradnja Turingovega testa, preizkusa zmožnosti stroja izkazovati inteligentno obnašanje, ki je čim bolj podobno človeškemu. Pri stavku »žoga ni šla v škatlo, ker je bila premajhna,« ali »žoga ni šla v škatlo, ker je bila prevelika,« bo človek brez pomisleka vedel, da se »premajhna« nanaša na škatlo, »prevelika« pa na žogo. A s to majhno spremembo besede se spremeni celotna nanašalna struktura stavka, računalniški program, ki nima življenjskih izkušenj ljudi, pa lahko o tem, na kaj se kaj nanaša, le ugiba.Dolgo je veljalo, da se teh težav ne da rešiti zgolj s statistično obdelavo besedil, saj predvidevajo poznavanje sveta. »Dokazali smo, da se to da,« je povedal Kocijan. Pred dvema letoma je njegova raziskovalna skupina predstavila prvi model, ki je precej dobro rešil zbirko Winogradovih shem. Lani so drugi njihovo metodo še nadgradili in dosegli rezultate, enake človeškim. »To pa še ne pomeni, da imajo stroji zdaj zdravo pamet, temveč le, da obstajajo naloge, za katere smo mislili, da jih stroji ne morejo rešiti, ker je zanje potrebna zdrava pamet, a se je izkazalo, da jih lahko rešujemo tudi s stroji,« je pojasnil.Metoda, ki smo jo razvili za pristop k analizi nestrukturiranega teksta, in s katero smo si pomagali pri reševanju Winogradovih shem, deluje, a pri analizah enormnih količin besedil s spleta dobimo rezultate, ki so pogosto zelo pristranski. Na Wikipediji je skoraj 90 odstotkov biografij o moških, kar je zaradi patriarhata v zgodovini razumljivo, a v praksi to pomeni, da se podatki o moških pojavljajo pogosteje, zato modeli delujejo bolje na primerih moških kot žensk, kar je vir napak in novih neenakosti. Model namreč perpetuira stereotipe, denimo, da so zdravstveni tehniki ženske, kirurgi pa moški. Pomembno je, da se zavedamo teh pristranskosti, ki izhajajo iz besedil s spleta, in jih odstranimo iz modela.Dodatne težave povzroča relativno pogosto neujemanje družbenega, biološkega in slovničnega spola. Računalničarji so pri tem pogosto površni, zlasti angleško govoreči raziskovalci včasih spol izenačijo s slovničnim spolom, kar povzroča napake zlasti v jezikih, ki niso angleščina.Razlike med spoloma je Kocijan sicer raziskoval že pred leti, ko je z novoizvoljenim rektorjem Univerze v Ljubljani Gregorjem Majdičem sodeloval pri raziskavi o razlikah v reševanju vizualno-prostorskih nalog med dečki in deklicam. Za Majdičevo raziskavo je zasnoval računalniško igrico, s katero je bilo mogoče preveriti hipotezo o razlikah med možgani dečkov in deklic pri reševanju določenih nalog.Predavanja na Oxfordu niso nujno boljša kot v Ljubljani, je pa zaradi ugleda univerze in posledične stroge selekcije najbolj zagnanih in nadarjenih nivo in zahtevnost lahko višja, je svoje izkušnje povzel Kocijan. S pisanjem prijave in s postopkom pri sprejemnih testih je imel kar nekaj dela, a meni, da proces selekcije na Oxfordu očitno dobro funkcionira, saj ga »obdajajo zelo nadarjeni kolegi«.Veliko večje je tudi zanimanje sponzorjev in gospodarstva. Pred dvema letoma je Kocijan z zasnovo programa, ki bi lahko analiziral in zaznaval lažne novice, opozarjal uporabnika in predlagal bolj zaupanja vredne novice, zmagal na oxfordskem hekatonu in za nagrado prejel potovanje in spoznavanje delovanja Silicijeve doline na stroške sponzorja. »Študij v okolju, ki je znano po talentu, zaradi česar privablja še več talenta in priložnosti, je velik privilegij,« je študij na oxfordski univerzi opisal Kocijan.