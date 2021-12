V nadaljevanju preberite:

Statistiki ne slovijo ravno po sočnem jeziku, a to je velika krivica. V njihovem žargonu je veliko posrečenih izrazov in med njimi­ prav gotovo izstopa osamelec, ki so si jo statistiki najbrž izposodili od planincev. Tako kot je lahko osamelec skala, ki se osamljeno dviga sredi prostranih ravnic, so statistični osamelci (ang. outliers) podatki, ki štrlijo iz množice sicer podobnih vnosov. To so podatkovne točke, ki kvarijo sicer lepe grafe in ki zakrivijo, da so podatkovne krivulje manj gladke kot tiste v matematičnih učbenikih.

Velikokrat se izkaže, da so osamelci v resnici bile napake, in zato so cele generacije statistikov učili, da se kakšne zoprne podatke včasih izplača izpustiti iz izračunov. Sosedov mulc ni, ni bil in nikoli ne bo, visok štiri metre dvajset centimetrov; to ne more biti nič drugega kot napaka v preglednici, ker je nekomu zdrsnil prst na tipkovnici. A večina primerov ni tako enoznačnih zatipkov. Čistost podatkov gor ali dol, včasih osamelcev ne moreš kar tako izpustiti iz analize.