Jon A. Krosnick: Obamova internetna zmaga je mit

So objektivni podatki res zanesljivejši od ljudi? Ameriški politolog Jon A. Krosnick ni tako prepričan.

Objavljeno
04. oktober 2013 13.45
prof. Jon A.Krosnick 25. september 2013
Lenart J. Kučić, Sobotna priloga
Lenart J. Kučić, Sobotna priloga
Razkritja nekdanjega ameriškega obveščevalca Edwarda Snowdna so potrdila sume zasebnostnih aktivistov, da obveščevalne službe prestrezajo in analizirajo naše elektronske komunikacije.

Nemški politik Malte Spitz je od največjega telekomunikacijskega ponudnika Deutsche Telekoma pridobil svoje komunikacijske podatke in pokazal, kako natančno je lahko morebitni nadzorovalec spremljal njegovo gibanje, klepete in družabne navade. Možnosti elektronskega nadzora se zdijo brezmejne, vendar prave nevarnosti morda ne pomenijo nadzorovalci, ampak slepa vera v vsemogočnost podatkovne analize.

Preveč podatkov je lahko enako nekoristnih kot premalo, je povedal ameriški politolog in profesor na univerzi Stanford Jon A. Krosnick, ki je prejšnji teden gostoval na ljubljanski fakulteti za družbene vede. Družboslovci so se v prvih sto letih modernega empiričnega raziskovanja naučili, da s številkami ni mogoče prav natančno razumeti ali celo napovedati človeškega obnašanja. Zato ne moremo pričakovati, da bodo zmogljivi računalniški algoritmi v ogromnih podatkovnih zbirkah sami od sebe poiskali teroriste in reševali kompleksne probleme sodobnih družb. So le orodja, ki se jih šele učimo uporabljati.

Bi vas kot politologa in dolgoletnega raziskovalca javnega mnenja mikalo pokukati v zbirke podatkov, ki jih o vaših sodržavljanih zbirajo trgovci, upravljavci družabnih omrežij in varnostne službe?

Vsekakor! Ampak ne toliko zaradi morebitnih presenetljivih novih odkritjih o mojih sodržavljanih. Te po več kot tridesetih letih raziskovanja javnega mnenja kar dobro poznam in dvomim, da bi me lahko obveščevalni podatki prav neznansko presenetili (nasmešek). Kot metodologa me bolj zanima, kako se obveščevalni analitiki sploh lotijo tako velikih podatkovnih zbirk: katere podatke izločijo, na kakšne informacije so pozorni in kako jih ovrednotijo.

Verjetno iščejo posameznike, ki ustrezajo določenemu vzorcu: sodelujejo v skrajnih spletnih forumih, obiskujejo spletne strani z navodili za izdelavo domače bombe ...

Poznate fenomen glasbenega videoposnetka Gangnam Style, ki ga je na spletu videla milijarda ljudi? No, ko je ta posnetek že postal spletna uspešnica, lahko uporabite zmogljiva programska in računalniška orodja za boljše razumevanje fenomena: kje se je začel, kako se je širil, katero družabno omrežje je povečevalo njegov doseg, v katerih državah ga je videlo največ ljudi in podobno. Ko vse to analizirate, ga lahko poimenujete 'fenomen Gangnam' in objavite znanstveni članek. Če ste podjetni, v raziskavi prepoznate poslovno idejo in glasbenim založbam ponudite poseben algoritem, ki bo zasledoval spletne posnetke in med njimi iskal nove gangnamovske uspešnice. Kaj menite, bo takšen lov učinkovit?

Verjetno ne. Raziskovalci so v analizah glasbenih posnetkov ugotovili, da ima velika večina uspešnic podoben glasbeni odtis: ritem, harmonije in zgradbo. A jim še ni uspelo obrniti postopka in iz tega odtisa ustvariti nove uspešnice.

Med analizo preteklega dogodka in predvidevanjem prihodnjega je ogromna razlika. Če začnete zaradi utemeljenega suma preiskovati poslovanje nekega podjetja, so komunikacijski in metapodatki izjemno koristni. Iz njih je mogoče izluščiti veliko dokaznega gradiva in zelo natančno rekonstruirati, kdo vse je bil vpleten, kdo obveščen in kdo je odločal. Zelo pa dvomim, da boste z dostopom do vseh podatkov o izplačilih, prebiranjem pisem in analiziranjem telefonskih klicev vnaprej zaznali koruptivno delovanje. Enako velja za lov na teroriste, saj vemo, da imajo ljudje zelo različne motive, zakaj nastavijo bombo ali začnejo streljati na ulici. Včasih je razlog politično prepričanje, drugič maščevanje ali duševna motnja. Tudi za obiskovanje spletnih forumov in strani imate lahko zelo različne razloge. Kaj če v kak forum priklikate po naključju ali pa ste novinar, ki proučuje radikalna politična gibanja?

Tehnološki novinarji se zelo sumljivo obnašamo. Klikamo po piratskih straneh, uporabljamo programe za skrito brskanje po spletu, pošiljamo šifrirana sporočila sms …

Takšno obnašanje zelo verjetno ustreza spletnemu profilu prestopnika. Če bi se zaradi vaših neprimernih klikov znašli med sto najbolj nevarnimi spletnimi Slovenci, bi vas verjetno ročno izločili iz seznama, ko bi ugotovili, da ste novinar. A so z vami še vedno izgubili veliko časa. Družboslovci smo zelo zadržani do obljub, da je mogoče iz takšnih podatkov in korelacij vsaj približno zanesljivo določiti kriminalca ali terorista. Verjetnost lažnih preplahov je izjemno visoka in večine dejanskih napadalcev z elektronskim nadzorom ne bi mogli odkriti. Vse agresivnejši elektronski nadzor razumljivo sproža veliko nelagodja in pomislekov zaradi vdorov v zasebnost. Čudim pa se, zakaj tako malo razpravljamo o smiselnosti takšnega nadzora. So nadzorovalni sistemi in metode sploh izpostavljeni kakemu merjenju učinkovitosti? Ali varnostna industrija res izvaja svoje poslanstvo ali se je vse skupaj izrodilo v velikansko potrato denarja in človeških ur?

Ali ni glavni argument zagovornikov avtomatizacije prav prihranek časa, denarja in človeških ur?

Že, ampak kako merite učinke? Lahko odgovorim z malce drugačnim primerom?

Seveda.

Ste imeli najljubšega knjigarnarja ali knjižničarja, ki vam je vedno znal priporočiti zanimivo knjigo?

Sem. In ju še zdaj pogrešam.

Tudi jaz (smeh). No, onadva sta zelo dobro poznala vaše bralne navade in okus, hkrati sta imela pregled nad knjižnimi novostmi, ki so prišle vsak teden. Zato sta vam večinoma znala svetovati primerno knjigo. Ko so knjižno prodajo prevzeli veliki spletni prodajalci, so začeli človeške prodajalce nadomeščati s statističnimi algoritmi. Ti prav tako analizirajo vaše pretekle nakupe, vas primerjajo s kupci podobnih knjig in poskušajo uganiti vaš okus. Če ste kupili prvi del Harryja Potterja, vam bodo ponudili še drugega ali vam predlagali Pullmanov Zlati kompas, ki ga prav tako kupujejo ljubitelji mladinske fantazijske književnosti. Za Amazon je merjenje učinkovitosti takšnega algoritma razmeroma preprosto. Če z izboljšanim algoritmom kljub nenatančnosti in napačnim priporočilom zaslužite nekaj dodatnih milijonov dolarjev, lahko dokažete, da se vam je naložba izplačala. Obveščevalne službe in druge javne storitve nimajo tako preproste metrike. Ne morejo reči, da so zaradi novega nadzorovalnega sistema preprečili sedem odstotkov potencialnih terorističnih napadov. Napake njihovih algoritmov pa so lahko za posameznika usodne: preiskave, aretacije, kartoteke, napadi brezpilotnih letal …

Direktor ameriškega inštituta PEW Lee Rainie mi je lani povedal, da se algoritemska miselnost seli tudi v raziskave javnega mnenja. Naročniki ga vse pogosteje sprašujejo, ali so tradicionalne meritve javnega mnenja s telefonskimi anketami in terenskimi intervjuji sploh še smiselne. Marsikdo meni, da je ceneje in natančneje uporabiti Google in Facebook, ki o uporabnikih vesta skoraj vse.

Merilcem javnega mnenja so napovedovali izumrtje že pred dvajsetimi leti, ko so začeli mediji, politiki in korporacije uporabljati prve preproste spletne ankete. Prepričani so bili, da bodo lahko javnomnenjske in tržne raziskave izvajali kar sami, brez pomoči dragih agencij in nadležnih metodologov (nasmešek). A so zelo hitro ugotovili, da pridobivanje kakovostnih podatkov zahteva zelo veliko znanja – od priprave vprašanja do izbire vzorca in razlage rezultatov. Uporabniški podatki, ki jih pridobimo od Googla in Facebooka, so uporabni za podobne namene, kot sem jih opisal pri Amazonu: za nekaj odstotkov lahko izboljšajo prodajo ali oglaševalske učinke. Ne morejo pa nam prav dosti pomagati niti pri navidez preprostih vprašanjih. Dober primer so ameriške predsedniške volitve. Volivci izbirajo samo med dvema kandidatoma, a vam analiza družabnih omrežij ne bo prav dosti pomagala pri napovedovanju izida.

Ne? Ali nista med zadnjimi predsedniškimi volitvami v ZDA oba kandidata porabila na milijone dolarjev za programerje in analitike družabnih omrežij, ker da je o zmagovalcu odločala informacijska vojna?

Res sta namenila veliko dolarjev za informatizacijo kampanje, a ni prav dosti dokazov, da sta učinkovito porabila ta denar. Domnevna internetna zmaga Baracka Obame leta 2008 je eden izmed največjih mitov v sodobni ameriški politični zgodovini. Internet so zelo pametno izrabili za zbiranje denarja in za utrjevanje sodobne javnomnenjske podobe novega kandidata, nisem pa še videl analize ali študije, ki bi internetni kampanji pripisala odločilen vpliv. Dva meseca pred volitvami je ameriško gospodarstvo strmoglavilo in vsak izkušen politični analitik bi napovedal, da stari predsednik Bush nima skoraj nikakršne možnosti za vnovično izvolitev. Njegov protikandidat bi zmagal tudi, če bi se do volitev samo smehljal. Če niti ne omenjam odpora javnosti do vojne v Iraku in Afganistanu ter republikanskih notranjepolitičnih polomij.

Kaj pa v lanski kampanji? Ali ni bila izvolitev Obame odvisna predvsem od uspešne mobilizacije volivcev, ki jih je razočaral njegov prvi mandat?

V lanski kampanji je bila strategija drugačna. V ZDA je velik del volilnega telesa razdeljen že pred volitvami. Če zagovarjate vitko državo, nizke davke, malo intervencionizma in več ekonomske svobode, volite republikance. Če želite močnejšo vlogo države, več socialnih storitev in ste pripravljeni plačati višje davke, volite demokrate. Dober politični strateg ve, da s kampanjo ne more vplivati na volivce, ki so že odločeni, zato mora najprej izločiti tri tipe volivcev. Prvi so tisti, ki bodo zagotovo volili njegovega kandidata. Drugi so tisti, ki zagotovo ne bodo volili, in zadnji tisti, ki bodo zagotovo volili nasprotnika. Zato so za načrtovalce kampanj zanimivi predvsem državljani, ki so po svetovnem nazoru blizu vašemu kandidatu, a jih morate še prepričati, naj se udeležijo volitev.

Ali niso prav takih volivcev iskali Obamovi in Romneyjevi podatkovni analitiki? Menda so na politično pripadnost uporabnikov spletnih storitev sklepali celo iz filmskega okusa. Igralec George Clooney je bil močan pokazatelj demokratskosti.

Takšnih zabavnih korelacij je bilo veliko in morda so analitiki družabnih omrežij Obami v resnici prinesli nekaj pomembnih točk prednosti. Zelo pa dvomim, da so odločili predsedniško dirko. Sploh zato, ker so Nate Silver, Simon Jackman in drugi strokovnjaki že nekaj mesecev pred volitvami zelo natančno napovedali Obamovo zmago, a so uporabljali tradicionalne raziskovalne metode in se informacijsko prepričevanje še ni zares začelo. Nočem zveneti preveč konservativno in nikakor ne zanikam izjemnih raziskovalnih priložnosti, ki jih prinašajo nova orodja. Algoritmi lahko včasih preprečijo človeške napake in robotski avtomobili bodo nekoč verjetno povzročili manj nesreč kot človeški vozniki. Vendar se kljub temu ne strinjam s poenostavljenimi trditvami, da bodo računalniki odpravili vse pomanjkljivosti družboslovnega raziskovanja, ker da so objektivni podatki zanesljivejši od zmotljivih in subjektivnih ljudi. To zelo lepo pokaže nedavni primer iz ameriške politične teorije. Vas lahko prosim za eno novinarsko oceno?

Izvolite.

V ZDA se je zadnjih predsedniških volitev po podatkih volilne komisije udeležilo približno 55 odstotkov volilnih upravičencev. Ko smo po volitvah izvajali nacionalno raziskavo o volilnih navadah Američanov, pa nam je kar 70 odstotkov vprašanih odgovorilo, da so volili. Kako si razlagate to razliko?

Ljudje se v anketah včasih zlažemo in izbiramo družbeno sprejemljive odgovore.

Se mi je zdelo, da bo to vaša prva misel (nasmešek). Res je, ljudje v anketah včasih izbirajo družbeno zaželene odgovore in se radi zlažejo, kadar jih sprašujemo o političnem prepričanju, spolnih navadah, razvadah, zaslužku in podobnem. Vendar se to dogaja predvsem v spletnih in telefonskih anketah, v osebnih intervjujih pa večinoma govorijo resnico. Ko smo analizirali rezultate, smo ugotovili, da je bila raziskava izvedena pravilno in se je 70 odstotkov vprašanih skoraj zagotovo res udeležilo volitev.

Ste izbrali nereprezentativen vzorec?

Dober pomislek. Iz izkušenj vemo, da na ankete pogosteje odgovarjajo politično aktivnejši državljani, ki se udeležujejo volitev, zato nam telefonske in terenske raziskave lahko napovedo višjo volilno udeležbo. Vendar tudi napaka vzorca in morebitno anketno laganje ne razložita tako velike razlike. Česa še nisva upoštevala?

Hm, je bilo kaj narobe s podatki volilne komisije?

Tako je. Več neodvisnih raziskav je pokazalo, da so bili volilni registri in podatki volilne komisije zelo nepopolni, zato je v resnici volilo več ljudi, kot so kazali uradni viri. Če bi nekritično verjeli uradnim podatkom, bi pač ostali pri prvi razlagi – da ljudje lažejo ali da smo slabo opravili raziskavo. A bi se zelo zmotili.

Bi takšne napake lahko preprečilo udejanjanje popolne transparence, kar verjamejo informacijski aktivisti in zagovornik znanstvenega novinarstva Julian Assange? Če bi bili ti registri javno dostopni, bi morda raziskovalci že prej opazili nepravilnosti.

Prepričanje, da bomo z radikalnim osvobajanjem podatkov človeštvu pomagali spoznati objektivno resnico, je zelo naivno.

Zakaj?

Ker podatki niso nevtralni, ampak jih vedno zbiramo, analiziramo in razlagamo ljudje, ki delujemo v določenih družbenih in ekonomskih okoliščinah. To velja tudi za delo v raziskovalni sferi, ki ga zagovorniki transparentnosti in znanstvenega novinarstva očitno ne poznajo preveč dobro, sicer ga ne bi tako idealizirali. Leta 2011 je zvezdniški nizozemski profesor socialne psihologije na univerzi v Groningenu Diederik Stapel priznal, da je več let ponarejal rezultate raziskav. Njegovo priznanje je prizadelo več kot petdeset znanstvenih publikacij in številne raziskovalce, ki so bili sopodpisani pod njegovimi članki. Sledilo je podobno razkritje harvardskega evolucijskega biologa Marca Hauserja in nekaterih drugih znanih raziskovalcev, ki so v raziskavah prav tako uporabljali 'mučenje podatkov' in druge statistične trike za prirejanje rezultatov. Zato se je med mlajšimi znanstveniki okrepilo gibanje, ki zagovarja večjo transparentnost raziskovalnega dela. Zagovorniki transparentnosti trdijo, da bi morale biti vse raziskave vnaprej prijavljene in javno objavljene, da bi lahko vsak neodvisno preveril izsledke. Takšna javna objava bi bila sicer koristna, a ne bi odpravila glavnih razlogov za prirejanje raziskav.

Ker rezultatov kljub javni objavi ne bi nihče preverjal?

Le vrhunski raziskovalci imajo dovolj znanja, da znajo prepoznati metodološke napake in statistično prirejanje rezultatov. Za takšno pregledovanje bi morali biti zelo motivirani in bi ga verjetno opravljali v prostem času, saj jim ne bi nihče financiral ponovljene raziskave. Če se kljub temu lotijo ponovitve, pa jim znanstvene publikacije ne bodo objavile rezultatov, ker urednike zanimajo samo nove in vznemirljive raziskave, ki povečujejo citiranost in privabljajo nove naročnike. Če bi hoteli zares izboljšati kakovost znanstvenih objav, bi morale znanstvene revije zaostriti merila objavljanja in spodbujati ponovitve. A se to v današnjem konkurenčnem in vse bolj komercializiranem akademskem okolju verjetno ne bo zgodilo. Ko doktorske študente opozarjam na najbolj pogoste metodološke napake in statistično 'friziranje' podatkov, mi včasih povedo, da je to danes skoraj edina pot do akademske kariere. Vsi se zavedamo problema, a smo le redki zares pripravljeni na spremembe.

Je to podobno kot pri globalnem segrevanju – vaši drugi priljubljeni raziskovalni temi? Vse več podatkov kaže, da se podnebje spreminja, a kljub temu nismo pripravljeni spremeniti načina življenja.

Ste prepričani, da nočemo spremeniti načina življenja? Ko sem začel sredi devetdesetih let sistematično meriti, kaj ameriška javnost meni o globalnem segrevanju, nisem mogel verjeti, da se je skoraj devetdeset odstotkov Američanov strinjalo s trditvijo, da se planet segreva zaradi človeškega vpliva. To stališče je ostalo presenetljivo trdno do danes – kljub vztrajnim prizadevanjem podnebnih skeptikov, da bi globalno segrevanje prikazali kot znanstveno pomanjkljivo in ideološko sporno hipotezo. Vsa leta zaznavamo povečano skrb za okolje, saj danes tri četrtine Američanov trdi, da pri nakupih upoštevajo tudi okoljsko prijaznost in varčnost izdelkov, da ločujejo odpadke in so pripravljeni podpreti bolj zeleno politiko. Več je tudi dolgoročnega razmišljanja, saj se je vse večji odstotek Američanov pripravljen že danes potruditi za boljše zdravje v starosti: pazijo na prehrano, opuščajo kajenje, meditirajo in se ukvarjajo s športom. Vendar takšno mnenje ameriške javnosti doslej ni imelo nikakršnega vpliva na odločevalce, saj ZDA niso podpisale nobenega pomembnega mednarodnega okoljskega sporazuma ali pripravile resnejšega ukrepa za zmanjšanje ogljičnih izpustov – naj je administracijo vodil republikanec ali demokrat.

Ali ni prav takšno razhajanje med javnim mnenjem in političnim odločanjem krivo za nizko zaupanje v demokratične ustanove in padanje volilne udeležbe?

Zaupanje v kongres je doseglo najnižjo točko v zgodovini. Skoraj polovica Američanov je prepričanih, da njihov glas ne more ničesar spremeniti. Tudi če bi izvolili kakega drugega politika, bi se ta obnašal enako kot predhodniki. Takšno razmišljanje je nalezljivo in še spodbuja državljansko pasivnost. Vendar imam tudi dobro novico. Naše raziskave volilnega obnašanja so pokazale, da je enako nalezljivo tudi aktivno državljanstvo. Če se odločite aktivno podpreti politiko ali državljansko gibanje, v katero verjamete, ne boste dolgo ostali sami. Brez aktivnosti pa ne more biti sprememb.