Bistvo Googlovega avta ni v tem, da vozi sam, ampak v tem, da ve več

Rolf Schumann, SAP: Prehajamo v dobo sprotnega odločanja na osnovi obdelave velikih podatkovnih zbirk.

Objavljeno
04. avgust 2014 10.35
Matjaž Ropret, Infoteh
Matjaž Ropret, Infoteh
Rolf Schumann v korporaciji­ SAP, do zdaj znani po optimizaciji procesov, vodi eno od skupin, ki se ukvarja s popolno­ transformacijo procesov v podjetjih. Namesto tega ­Schumannova skupina s programsko opremo SAP Hana z obdelovo velikih količin podatkov vzpostavlja sisteme za odločanje na osnovi podatkov v realnem času.

Na letošnjem dogodku SAP forum je Schumann zatrdil, da bodo velike podatkovne zbirke (big data) povsem spremenile poslovanje in odločanje, da je konec pisanja poročil. Začenja se doba sprotnega ukrepanja. Poslušalcem je omenil primer Mercedesa, v katerem so po obisku njegove skupine bistveno skrajšali testiranje motorjev. Za kar so prej potrebovali pet dni, zdaj preizkusijo v štirih dneh.

Lahko bolj konkretno poveste, kaj ste spremenili v Mercedesu, da ste za petino skrajšali testiranje motorjev?

Povsem preprosto. Opravili so test, zbrali podatke iz tipal in naredili poročilo o njih. Nato so se odločili, ali je bil preizkus uspešen, in vnesli rezultate v bazo. Odločali so se zgolj na osnovi končnih rezultatov. Niso pa podatkov, ki so jih zajemali med preizkusom, sproti primerjali s tistimi, ki so jih že imeli zbrane. Četudi je bil pritisk za 20 odstotkov previsok, so test nadaljevali še več ur. Vsak tak test se je po nekaj urah končal neuspešno, vendar tega vmes niso ugotovili.

Rekel sem jim: 'Fantje, že dve uri veste, da bo test neuspešen, ustavite ga.' Začudeno so me pogledali:­ 'Kako naj to vemo.' Pa sem jim pokazal dva tisoč primerov v bazi s povsem enakimi rezultati. Zakaj tega niso ugotovili? Ker so bili podatki s tipal v ločeni bazi, samo agregirane rezultate so vnesli v naš sistem. Da bi sami prišli do enakih rezultatov kot z našimi orodji, bi morali postaviti nov raziskovalni laboratorij za 750 milijonov evrov. Za našo ceno se sploh niso pogajali (smeh).

Bi tako opisali besedno zvezo velika podatkovna zbirka (big data), ki je v zadnjem času postala zelo priljubljena zvenljivka?

Zvenljivka je zato, ker si marsikdo pod to besedno zvezo res predstavlja samo ogromno količino podatkov. Kar 90 odstotkov digitalnih podatkov je nastalo v zadnjih treh letih. Na voljo je tudi vrsta podatkov z družabnih omrežij, ki niso vredni nič. Pa tudi ogromno podatkov z različnih tipal, nekakšnih temnih podatkov, ki jih doslej nismo uporabljali. Zato se je treba naučiti najti prave signale. Trende, spremembe, odstopanja od običajnih vzorcev, anomalije.

Poanta big data so pametni podatki. Pametnejše odločanje s pomočjo podatkov. Včasih si nismo mogli predstavljati, da bi lahko programer predlagal boljšo rešitev od zdravnika, tako razmišljanje je bilo bogokletno. V Mercedesu so nekoč naredili načrt preizkušanj, zdaj pa rečejo – pozabite model, imamo podatke. Novo je tudi prenašanje podatkov med različnimi industrijami. Zakaj bi iskalne rezultate z googla prenesli v logistično ali farmacevtsko podjetje? Če na potovanju zbolite za gripo, najprej na spletu poiščete informacijo, kje lahko dobite zdravila. Taki podatki lahko ponudnikom pomagajo.

Prej nismo imeli pravih podatkov?

Mislim, da smo jih imeli, vendar jih nismo mogli sprocesirati. Vsaj ne v realnem času. Ni bilo tehnologije, procesorske moči in prostora za shranjevanje.

Kakšni algoritmi in strojna oprema so potrebni za obdelavo velikih količin podatkov?

Danes zadostuje standardna strojna oprema. Večjedrni procesorji so bistveno spremenili obdelavo podatkov. Procesor s 120 jedri pomeni, da lahko naenkrat izvajamo 120 procesov. Z današnjo tehnologijo, ki je na voljo v oblaku in jo je mogoče najemati po potrebah, lahko na eno procesorsko jedro v sekundi obdelamo gigabajt podatkov. Vprašanje je torej samo, koliko jeder potrebujete. Treba pa bo spremeniti logiko. Podjetja bodo morala začeti sprejemati odločitve sproti, iz tekočih podatkov, ne več iz agregiranih.

Kako velika je nevarnost, da napačno obdelamo podatke? Da je nekje nepravilna predpostavka in zaradi tega kljub kakovostnim podatkom sprejmemo napačno odločitev?

Nevarnost napačne obdelave je manjša od nevarnosti sprejemanja napačnih odločitev zaradi fiksnega modela. Tudi najslabša obdelava je boljša od vztrajanja pri starih ­vzorcih.

Torej ni nevarnosti, da bo računalnik v banki ali zavarovalnici, ko bo pregledal naše podatke, rekel, da ne moremo dobiti posojila ali zavarovanja? Čeprav bi agentu zelo verjetno lahko pojasnili, da ne predstavljamo takega tveganja, kot morda na prvi pogled kažejo podatki.

Tako debato sem že imel s predstavniki banke. Rekli so: 'Včasih se lahko odločimo na osnovi intuicije. Kako nam lahko zagotovite, da je odločitev na osnovi algoritmov boljša?' Moj odgovor – na svetu so dobri in slabi ljudje. Vmes pa je ogromno nepoznanih, ki jih je treba izobraževati. Edini način, kako rešiti to situacijo, je javna razprava o zaupanja vrednem in zaupljivem ravnanju s podatki. Če vas sistem zavrne, se je treba o tem pogovoriti. Banka bi morala predstaviti indikatorje, na osnovi katerih se je računalnik odločil, vi bi tako imeli možnost, da popravite podatke, in sistem bi lahko ponovil odločanje. O tem je treba najti družbeni ­konsenz.

Moramo najti ravnovesje med varstvom osebnih podatkov in preprečevanjem zlorab ali kakšno drugo dobrobitjo.

Veste, kako deluje preprečevanje zlorab kreditnih kartic? Ukradem vam kartico, se podpišem pod plačilo, vi podate ugovor, češ da niste nakupovali v New Yorku, policija odpre preiskavo, preda zadevo ponudniku kreditnih kartic, ta vam zaradi policijskega zapisnika verjame in vrne denar, sama pa pošlje zahtevo zavarovalnici, ki poplača škodo. Tak sistem je skrajno ­neumen.

Banki sem povedal, da bi lahko vzpostavil sistem, ki bi preprečil vse tovrstne primere, in so samo strmeli. Ima kdo na tem svetu kreditno kartico, nima pa mobilnega telefona? Ko plačujem s kreditno kartico in ima banka občutek, da nekaj ni v redu, bi mi lahko poslala sms z vprašanjem, 'ali res v tem trenutku poskušate kupiti za tri tisoč evrov blaga v Diorjevi trgovini na letališču v Zürichu'. Če bi jim odgovoril z ne, transakcija ne bi šla skozi in bi preprečili zlorabo, še preden bi nastala.

Koliko podatkov bi moral dati banki, da bi bil sistem učinkovit?

Recimo, da bi vas banka vprašala, ali dovolite namestitev njene aplikacije v vaš telefon ali jo dodate v profil na omrežju foursquare, da banka ve, kje ste. Če bi dovolili, bi rešili 99 odstotkov težav. V določenih primerih ne bi bilo treba poslati niti sporočila. Pred dvema urama je bila kartica v Frankfurtu, zdaj pa je že v New Yorku. To fizično ni mogoče in pri takem primeru bi banka lahko ukrepala sama, brez spraševanja.

Kaj pa banke počnejo zdaj? Pošljejo vam elektronsko pošto. Elektronsko sporočilo, da mi prav zdaj nekdo krade pet tisoč evrov z računa!? Naravnost sem jim povedal: 'Ne razumete. Še preden pošljete mail, me vprašajte. Imate mojo številko.' Bi nasprotovali, če bi banka hotela dostop do informacije o vaši lokaciji in vam zagotovila, da bo do tega podatka dostopala samo, ko boste hoteli kaj kupiti, in da ga ne bo zlorabila? Zagotovo bi privolili. Ne samo vi, ampak vsi, saj bi vedeli, da vam to prihrani vse morebitne sitnosti, ker ne bi bilo več zlorab.

Pa banke sploh resno razmišljajo o takih možnostih?

Danes še vedno delajo precej po starem. Sicer obdelujejo podatke o zlorabah, ampak jih aktivno ne preprečijo. Vse se dogaja šele, ko se goljufija že zgodi. Toda v igri so preveliki denarji, da se ne bi prilagodile. Na leto lahko prihranijo milijarde. Podobno tudi zavarovalnice. Na osnovi podatkov bi lahko ponujale zavarovanja v realnem času. Denimo za ta dan, ko ste na konferenci, ali za potovanje. Poznajo lokacijo, vreme, koliko ljudi bo tam, kaj boste počeli, kakšna so tveganja in lahko dinamično prilagajajo višino zavarovalne vsote.

Lahko torej pričakujemo, da se bodo tudi proizvajalci tehnoloških naprav ali denimo avtomobilov hitreje prilagajali trendom in prodaji, tako kot proizvajalci oblačil?

To se že dogaja. Tesla vam ponoči nadgradi avtomobil, pri čemer v nadgradnjah upošteva svoja dognanja in pripombe voznikov. Zjutraj imate tako lahko na dvorišču avtomobil, ki se vozi povsem drugače, bolje, kot se je vozil včeraj (smeh). Večina stvari ni več nadzorovana mehansko, ampak s programsko opremo. Veste, kaj je najbolj hecno pri tem? Sam vozim BMW i3 in nikoli ne sprožim nadgradenj med tednom, vedno med vikendi. Preprosto nočem, da bi mi avtomobil na zaslonu napisal, 'nadgradnja ni uspela', namesto da bi me odpeljal v službo ali na sestanek (smeh).

Mislite, da bodo samovozeči ­avtomobili postali resničnost?

Da. Podatkov iz različnih tipal je več kot dovolj. In dogajanje zaznavajo bistveno hitreje kot človek. Toda prava vrednost samovozečih avtomobilov ni v posameznih vozilih. Predstavljate si, da imate podatke iz vseh avtomobilov, podatke o zastojih in celotnem poteku prometa, in na osnovi vseh teh informacij krmilite avtomobile na cesti. Podobno kot pri letalih. Poanta ni v tem, da se avtomobil lahko vozi sam, ampak da imamo informacije o dogajanju na cesti, ki jih kombiniramo z informacijami o dogodkih in še čem, da lahko prilagajamo obnašanje v realnem času.

Ljudje bodo seveda trdili, da lahko vozijo bolje kot avtomobil s tipali. Toda takšno vozilo ve, da za ovinkom stoji okvarjen avtomobil, vi pa se mu približujete z veliko hitrostjo. To je prihodnost, s katero ne morete tekmovati. Največja težava bo v zakonih in prevzemanju odgovornosti. Če se boste zaleteli, ko boste v samovozečem avtomobilu, bo to najbrž odgovornost proizvajalca, ki se ji bo seveda hotel izogniti. Okrog tega bodo največje dileme in zapleti.

Bodo klasične taksi družbe še lahko tekmovale s podjetji, kot sta Uber in Lyft, ki uporabljata napredne algoritme za razpošiljanje voznikov in ponujata preprosto aplikacijo za naročilo in plačilo vožnje?

Težko. Če bi sam vodil taksi družbo, bi jo spremenil v 'mobilnostno' družbo, ki bi ponujala različne načine prevoza. Taksi, prevoz z limuzino ali najem avtomobila. Morda tudi po načinu, vzemi tukaj in pusti drugje. Vsaka od storitev, čeprav z istim avtomobilom, bi imela drugačno ceno. Seveda mora biti v ozadju sposobna centrala z veliko podatki in odločanjem na njihovi osnovi v realnem času.

Kakšna je nevarnost, da celotna zadeva postane prekompleksna?

Edina resna nevarnost velikih podatkovnih zbirk je, da bi zlobneži zlorabili podatke. Toda možnosti in priložnosti so veliko večje od nevarnosti zlorab. Če bi nekdo zlorabljal podatke, bi ga tako hudo kaznovali, da še pomislil ne bi več na kaj takega.