Priemer nie je relevantný pre väčšinu populácie, no aj tak ho pri meraní populácie často používame. Zvykli si na to všetci so základným vzdelaním. O čo prichádzame?
Obsah
Priemer ako spôsob merania skresľuje, najmä ak ho používame bezbreho na všetko okolo. Je úplne bežné, že výrazne väčšia časť populácie zarába viac alebo menej než virtuálny priemer. Nie je to tak, že by bol priemer nepoužiteľný, ale rovnako nie vždy je priemer najlepší spôsob ako porovnávať ceny, mzdy, ale ani iné populačné parametre.
Priemerná populácia neexistuje
Naša západná civilizačná spoločnosť je však zvláštne fixovaná práve na priemer a často ho tiež používame nevhodne. V článku pridám aj pár odporúčaní na akademikov a praktikov, ktorí vám môžu pomôcť rozmýšlať inak, než priemerne. Ale začnime po poriadku.
Keď sa povie priemer, zväčša myslíme aritmetický priemer. Je to často najjednoduchší spôsob, ako porovnať akékoľvek veci v bežnom živote. Definíciu pozná každý, vysvetliť ako je táto jedna zo stredových hodnôt relevantná komukoľvek z nás, je už náročnejšie. Napríklad:
- Priemerný počet žiakov na učiteľa v škole
- Priemerný počet najazdených kilometrov na aute
- Priemerná mzda sestričiek v štátnych nemocniciach
A to nezabúdam na fakt, že existuje viac než jeden premier. Máme premier aritmetický, geometrický, kvadratický a kubický, harmonický, ale aj úplne iné štatistiky, ktoré nám povedia, kde je stred. Pri priemere totiž hľadáme práve centrum, stred, rovnováhu. Máme priemer, ktorý postavený nad virtuálnym nekonečnom, kde priemerujeme alternatívne svety, ktoré nikdy neexistovali, a máme priemer rastu v čase. Ak investujete, stávkujete, alebo hoci len v malom odkladáte peniaze, pochopenie rozdielov medzi nimi môže doslova zmeniť váš život. Viac o ergodicite a nápadoch Ole Petersa, zakladateľa Londýnskeho Matematického Laboratória, v inom článku. To je však jedno z prvých odporúčaní, koho určite sledovať.
Kritické udalosti sú často asymetrické
Okrem ekonómov a matematikov, ktorí mi vysvetlili, že nie je priemer ako priemer, musím v článku určite spomenúť aj Nassima Nicholasa Taleba. Taleb totiž kdekoľvek príde, búši do ľudí, že riziko nie je symetrické. Bol to práve on, kto ma svojimi textami naučil zamýšľať sa nad distribúciou ako takou. Aritmetický priemer si totiž v sebe nesie jeden kľúčový predpoklad, ktorý nakomplet civilizačne ignorujeme – normálnu distribúciu dát.
Znamená to najmä to, čo môžeme často vidieť vo výstupoch prieskumných agentúr. Odchýlky prieskumov sú totiž tiež normálne distribuované, a teda s intervalom spoľahlivosti 95% môžeme povedať, že prieskum bude +/- 3.1% okolo “priemerného” výsledku. Tento odhad je pritom ako väčšina matematických modelov: užitočný, ale vo svojej podstatne naivný.
Riziko nesprávnosti odhadov totiž v praxi nikdy nie je symetrické. Priemer normálnej distribúcie implikuje rovnomerné rozloženie rizika na obidve strany. To však nie je pravidlo, ak distribúcia dát nie je normálna, teda nekopíruje tzv. Gaussovu krivku. Vo financiách, pri riziku, ale aj pri predikciách a prieskumoch je symetria úplne kritický predpoklad. Počas krízy 2008/ 2009 to bolo podľa Taleba práve riziko vyplývajúce z asymetrie, ktoré položilo americký finančný sektor, až ho musel za veľkú cenu zachraňovať federálny štát. Nassim Nicholas Taleb sa preslávil najmä tzv. čiernou labuťou ( ang. black swan event), ale za seba môžem najviac odporučiť jeho knihu Antifragile.
Ako ilustráciu, že ani pri nakupovaní akcií, nie je všetko normálne, pripájam jeden graf. Ukazuje možné ročné výnosy akcií amerického S&P 500 za takmer 150 rokov jeho existencie. Ak sa pozrieme na priemerné a mediánové hodnoty, uvidíme, že nie sú rovnaké. Krivka nie je Gaussova, je “špicatá” okolo stredových hodnôt, a mierne skresľuje doľava.
Z toho vyplýva, že pravdepodobnosť, že by ste zarobili za 1 rok menej, než priemer/ medián, je vyššia než ako že by ste zarobili viac. Možno na nejaké tie percentá hore-dole neberiete ohľad, ale ak zohladníme v uváhu, že aj dáta za infláciu budú vyzerať veľmi podobne, asi by vám nemalo byť jedno, že máte počas roku s medziročnou infláciou 12% pravdepodobnosť okolo 50% zarobiť menej, než tých 12.
Priemer a medián sa stretnú len “normálne”
Priemer má ale aj iné slabosti. Ľahšie ním hýbať v porovnaní oproti iným štatistikám stredu; deje sa to napríklad tak, ak do vzorky zaradíme extrémne hodnoty. Ak chcete zvýšiť priemerné bohatstvo ľudí v meste či krajine, stačí ak si jeden či dvaja najbohatší milionári (Elon Musk a Jeff Bezos) zmenia pobyt, a štatistika priemernej mzdy ľudí v meste poletí nahor, aj keď sa ľuďom platy nezmenia ani o cent.
Omnoho stabilnejšia, matematicky povedané robustnejšia, je pritom jedna zo stredových hodnôt, tzv. medián. Mediánovú mzdu výrazne žiadnym technologickým milionárom v meste nezmeníte. Ani zvýšenie mzdy pre časť populácie, napríklad len lekárom, výrazne mediánovou mzdou nepohne. Mediánová znamená, že za každých okolností, polovica vzorky má vyššiu hodnotu ako medián, a polovica vzorky nižšiu ako medián.
V prípade Gaussovej krivky, normálne rozložených dát, je medián rovný priemeru. V prípade, že nie je, tak sa nejedná o normálne Gaussove rozloženie. A tu je chyták; v interpretácií je jednoduchšie vysvetliť hodnotu mediánu, než priemeru, ktorý je často pre veľkú časť distribúcie nerelevantný, a skresľuje na vyššie alebo nižšie stredové hodnoty. Názorná ukážka môže byť napríklad distribúcia platových skupín hrubej mzdy na Slovensku. Vysvetlíte bežnému človeku, čo zarába 900 eur v hrubom jednoduchšie medián alebo priemer? (Graf vyššie).
Priemer nie je vždy ten dôležitý
Aritmetický priemer používame často aj v biznise, nielen v demografickej štatistike, či pri správe štátu. Priemerná cena za inzerciu (CPM), priemerný počet užívateľov na stránke, priemerný počet stránok na užívateľa, premierná cena objednávky, priemerný čas doručenia. Inflácia je tiež len priemer. Priemer rastu cien za určitý čas. Priemer rastu, ktorý nie je rovnaký pre všetky produkty a služby. Priemer rastu, ktorý nie je rovnaký ani pre jednotlivé príjmové skupiny, ani pre všetky druhy produktov.
Čo potom znamená priemerná hodnota? Nie je to hodnota, ktorá je výpovedná pre veľkú časť populácie, ale je mediálne veľmi zaujímavá. Popisuje stav, v ktorom by sme sa mali nachádzať všetci alebo väčšina, a pritom už vieme z textu vyššie, že to sa nedeje. Počíta sa jednoducho, a možno to je jej príťažlivosť. Ak však chceme naozaj porozumieť svetu okolo, musíme sa začať pýtať viac. Musíme sa pýtať na mediány, percentily, distribúcie.
Poďakovanie
Ďakujem, že ste dočítali až sem. Zároveň sa chcem poďakovať aj agentúre Median SK, z ktorej MML konferencie (miesto konania Bratislava – Binarium, 25.5.2023) moje slidy pochádzajú, za možnosť hovoriť o tejte téme aj naživo, pred veľmi cenným publikom. A vďaka aj za spätnú väzbu od expertiek a expertov v téme, ktorú som sa ako nematematik, neekonóm a neštatistik snažil priblížiť.
P.S. Zaujal vás článok? Napíšte mi, prosím, svoj názor do komentára alebo priamo na mail (kontakt). Môžete sa tiež prihlásiť do newslettra, a ja vám pošlem najnovšie texty na stránke, keď ich publikujem.