středa 11. března 2009

Průměrná a mediánová mzda


Český statistický úřad vydal nové pravidelné statistiky o vývoji průměrných mezd. Opět se přitom objevily diskuse o tom, že uvádění průměrné mzdy je irelevantní, protože většina lidí na ni stejně nedosáhne a průměrná mzda vůbec nic nevypovídá o tom, kolik berou chudí a kolik bohatí, přičemž bohatí mohou statistiku průměrné mzdy pořádně vychýlit. A každý přitom operuje slovem medián.

Ukážeme si, že průměrná mzda vypovídá o celkovém rozdělení a zejména o růstu mezd v ekonomice mnohem více, než si kritici myslí. Už nyní přitom prozradím koeficient 0,8, který bude hrát důležitou roli níže. Zároveň si vysvětlíme, proč Český statistický úřad vlastně obvykle uvádí průměrnou mzdu a ne mzdu mediánovou.
Než se pustíme ke grafům, jsou na místě dvě důležité poznámky.

Za prvé - průměr je samozřejmě jednorozměrná statistika mnoharozměrného souboru, takže nutně při jejím používání dojde ke ztrátě informace. Klíčová je však otázka, kolik relevantní informace vlastně ztratíme. Samozřejmě, že můžeme vykonstruovat statistické soubory, ve kterých nebude mít průměr žádnou vypovídací schopnost (protože nevíme nic o rozdělení, ze kterých byl vypočítán), jak činí například můj jmenovec biogeochemik. Ten ze svého umělého příkladu vyvozuje, že podobně nesmyslné je i uvádění průměrné mzdy.

Můj jmenovec se však mýlí. Narozdíl od jeho smyšleného souboru je rozdělení relativních mezd v ekonomice dlouhodobě poměrně stabilní. Pokud tedy známe rozdělení v minulém období, můžeme s velkou dávkou přesnosti vypočítat nové rozdělení pouze na základě růstu průměrné mzdy, který ČSÚ uvádí.

Za druhé - i když jsem solidní stabilitu rozdělení mezd očekával, i tak mě překvapilo, jak stabilní ono rozdělení za posledních 10 let je. Viz grafy níže.

Proč vlastně ČSÚ nevyhoví svým kritikům a nepublikuje i mediánovou mzdu? Protože nemůže. ČSÚ vypočítává průměrnou mzdu z výkaznictví firem, které mají informační povinnost a dodávají mimo jiné objem vyplacených mezd a počet zaměstnanců. Zatímco celorepublikový průměr lze z těchto dat lehce vypočítat, celorepublikový medián tímto způsobem vypočítat nelze. K tomu by musely firmy statistickému úřadu hlásit mzdu každého jednotlivého zaměstnance. A to se nedělá.

Mediánová mzda se přesto získává na základě výběrového šetření, které provádí pro Ministerstvo práce a sociálních věcí Trexima - tato data následně zveřejňuje i ČSÚ. Problém je v tom, že jsou to data výběrová a tedy zatížená větší chybou, a i jejich zpracování déle trvá. Každý si je ale může dohledat.

Právě z těchto dat jsou sestavené i následující grafy.

Trexima sleduje jak průměrné měsíční mzdy, tak i průměrné hodinové mzdy. Oboje data dávají prakticky identické výsledky, ovšem u hodinových mezd se rovněž uvádí podíl lidí pracujících za nižší než hodinovou mzdu, takže se podívejme právě na ně. Veškeré údaje jsou pro mzdy v podnikatelské sféře.

První graf znároňuje vývoj průměrné hodinové mzdy a tří percentilů - dolního decilu, mediánu a hodního decilu. Z obrázku je zřejmé, že celé rozdělení se sice multiplikativně rozšiřuje, jak mzdy rostou, nicméně zůstává velmi stabilní.

Czech Republic - hourly wage

Vývoj hodinové mzdy v České republice, stálé ceny roku 2005.
Zdroj: Trexima

Ještě lepší obrázek poskutuje vývoj poměru mediánové a decilové mzdy k průměrné mzdě. Právě tady je patrná velká stabilita celého rozdělení. A právě odtud plyne onen koeficient 0,8, který přijde vhod kritikům průměrné mzdy. Až příště uvidíte údaj o nové průměrné mzdě, vynásobte jej 0,8 a získáte s velkou přesností mediánovou mzdu. Podobně použijte koeficient 0,47 a získáte dolní decil, respektive koeficient 1,55, abyste získali horní decil.

Czech Republic - hourly wage - ratios

Vývoj poměrů kvantilů hodinové mzdy k průměrné hodinové mzdě v České republice.
Zdroj: Trexima a vlastní výpočty.

Jak úzce spolu souvisí růst průměrné a mediánové mzdy, znázorňuje následující graf. Korelační koeficient mezi mírami růstu obou veličin je 0,96. Je ovšem důležité podotknout, že data publikovaná Treximou nejsou sezónně očištěná, takže část společných pohybů je dána sezónností (vysoké růsty zejména ve 4.čtvrletí v souvislosti s prémiemi, poklesy v 1.čtvrletí).

Czech Republic - hourly wage - growth

Mezičtvrtletní růst průměrné a mediánové hodinové mzdy, stálé ceny roku 2005.
Zdroj: Trexima a vlastní výpočty.

A konečně poslední graf sleduje, jaká část zaměstnanců pobírá nižší než průměrnou hodinovou mzdu. Tento údaj se už delší dobu pohybuje na úrovni 67-68%.

Czech Republic - hourly wage - share under average

Podíl zaměstnanců pobírajících nižší než průměrnou hodinovou mzdu.
Zdroj: Trexima

Na závěr je dobré připomenout, že dlouhodobě se tvar rozdělení mezd mění, takže dochází ke změnám poměru percentilových mezd k průměrné mzdě. Příště si to ukážeme třeba na amerických datech za posledních 60 let. Ovšem pro krátkodobý vývoj je výše popsaná úvaha celkem postačující - stačí si pamatovat tři konstanty - 0,47, 0,8 a 1,55.

12 komentářů:

  1. Výborný článek, díky za vyčíslení tohoto dosud mlhavého tématu.

    OdpovědětVymazat
  2. ahoj
    tema ma zaujima, ale nepoznam statistiku, tak sa skusim spytat.
    Co je presne v Tvojom ponati median a priemer? Poznam aritmeticky priemer a napr. sa mi zda, ze v tomto pripade by bol zaujimavejsi aritmeticky priemer z dolnych 95% hodnot aby som orezal bizarnosti typu sef Cisca. Spodok je orezany minimalnou mzdou.
    Je median vyska platu, ktory pobera najviac ludi v CR? Lebo to je zaujimavejsia hodnota ako priemer (ked bude vysoky, bude nas prevazna vacsina stastna :0)
    Ale ked tak nad tym rozmyslam, pre predstavu bohate staci rozdelenie a aritmeticky priemer. Rozumiem, ze to rozdelenie je stabilne ale nikde v clanku ho nevidim...

    OdpovědětVymazat
  3. není zase až tak překvapivá. Kritizivané zkreslení přeci není v tom, že by průměrná mzda rostla, zatímco mediánová klesá, ale v tom, že průměrná mzda opticky zvyšuje blahobyt většiny společnosti a poskytuje tak záminku k odmítání větší participace bohatých na chodu společnosti (úhradě nákladů s ním spojených).

    Chápu důvody, proč není mediánová mzda uváděna, nicméně mzdu průměrnou za zavádějící považuji. Nebylo by nakonec lepší používat jinou metriku, například kolika % domácností zbude po úhradě bazálních nákladů určité procento příjmu, které může uspořit či investovat (přiznávám, že nemám představu, nakolik je takováto metrika reálně zkonstruovatelná)?

    OdpovědětVymazat
  4. Ač se ohledně průměru a mediánu nelze ubránit určitému pocitu marnosti, Vámi navrhovaná poměrová metrika se běžně používá tam, kde dává smysl - tedy nikoli u mezd (implikujících zaměstnání, a tedy vypovídajhící o poměrech v celé populaci jen nepřímo), ale u příjmu (všech) domácností. Jde o tzv. Eurochudobu definovanou životem v domácností s příjmem pod 60% ekvivalizovaného mediánu. Dle tohoto kritéria je chudý každý šestý obyvatel EU. Ovšem nejnižší míru takto definované chudoby vykazuje v unii ČR a Švédsko, takže ani to není lokálně dobrý argument pro touhu po zostřeném uspokojování cizích potřeb za cizí peníze.

    OdpovědětVymazat
  5. vypadá to logicky, i když ta výhrada, že průměrná mzda právě vzhledem k tomu dvacetiprocentnímu posunu od mediánu je zavádějící, je těžko vyvratitelná. Další věc, která mi na tom vadí, že se zásadně uvádí hrubá mzda, která je od skutečné životní úrovně odpojena.

    Takže, aby se dal udělat nějaký obrázek o mzdách, musel by být uváděn vývoj hrubých mezd, čistých mezd i čistých příjmů, k tomu rozdělení dle decilů či percentilů a ještě navíc vývoj v jednotlivých odvětvích, profesích a oblastech. Navíc by to muselo být zpracováno podle pohlaví, dosaženého vzdělání a věku. Chápu, že takto zpracováno by to bylo \"příliš mnoho čísel\", a novináři mají rádi, když mohou vyvodit dalekosáhlé závěry z jednoho čísla, ale potom to opravdu vypadá tak, že většina lidí oprávněně cítí pokles životní úrovně a pak si koupí noviny, kde je napsáno, že si vlastně vydělávají stále více.

    A to už se vůbec nebavím o manipulacích, které se dělají s údaji o inflaci a nezaměstnanosti.

    OdpovědětVymazat
  6. Nechapete jeden uplne zakladny predpoklad explicitne uvedeny v clanku: rozdenie platov sa v Cechach v case nemenilo. To co sa menilo je hladina.
    Clanok je prave o to, ze asi to tak je.

    Tym padom to \"jedine cislo\" naozaj staci.

    Samozrejme, je myslitelne, ze rozdelenie sa nejak zasadne zmenilo, ale vzhladom k znamym faktom to nevyzera pravdepodobne.
    Ciselka ktore Vam k stastiu chybaju su uvedene v odkaze uvedenom v clanku. Takze mozte si sfalsovat vlastnu statistiku :).

    OdpovědětVymazat
  7. 1) Není pravda, že se neměnilo rozdělení, nůžky se rozevíraly, i když ne tak výrazně, jako v období 1990 - 2000. I tak je vidět, že se nejvyšší decil i v období 2000 - 2008 vzdaloval od stagnujícího, či spíše klesajícího mediánu.
    2) Nestačí jediné číslo o hrubé mzdě, když se po celou dobu měnilo daňové zatížení tak, že se snižovalo těm nejvyšším příjmovým skupinám, a je samozřejmé, že pro životní úroveň rodiny není důležitý hrubý, ale čistý příjem.
    3) Nestačí jediné číslo, když se stále více rozevíraly nůžky mezi Prahou a zbytkem ČR.
    4) Nestačí jediné číslo, když ani změny v daních nebyly neutrální ve vztahu k různým příjmovým skupinám.
    5) Nestačí jediné číslo, když se manipulují a stále lajdáčtěji sledují výběrové údaje o cenách výrobků a výdajích domácností.

    Je to pořád o jediném - vhodným a neúplným výběrem statistických charakteristik dokázat občanům, že se mají stále lépe a radostněji. Přitom se mění metodiky pro zjišťování a výpočet tak, aby se nepoznalo to, co občané podvědomě cítí a těžko vyjadřují - že jejich životní úroveň nestoupá, a to i přesto, že stoupá produktivita práce, že nůžky mezi vysoce a nízkopříjmovými skupinami se stále více rozevírají, že klesá kvalita výrobků pro masové spotřebitele atd.

    Bohužel teď budeme mít všichni jiné starosti, ale ten článek je manipulativní a na tom si trvám.

    OdpovědětVymazat
  8. Z grafu uvedenom v clanku krasne vidno, ze hned prva veta je sice pravdiva, ale tie \"roztvorene noznice\" nie su ziadna katastrofa.
    Z uvedenych dat je pomerne ocividne jasne, ze mate sice pravdu, ale v tak bezvyznamnej miere, ze to nestoji za zvazovanie dosledkov.
    Ked median vzrastie o 40% a 9.decil o 55%, tak v ziadnom pripade nie je dovod hovorit o \"roztvarani noznic\", hoci technicky mate pravdu.

    Kludne sformulujte exaktne na zaklade dat vlastny clanok, kde dokazete svoju pravdu cislami a nie vseobecnymi frazami. Ja som autorovi povdacny za zaujimavy zdroj dat a pracu ktoru si dal zo spracovanim casti z nich.
    Uvedene grafy su presne to, co odlisuje pivne reci od zmysluplnych postrehov.
    Stabilny vztah medzi medianom a priemerom z krcmovych reci nevypadne.

    OdpovědětVymazat
  9. jestli jsou \"roztvorené nožnice\" bezvýznamné, záleží tak trochu na tom, na které jejich straně se ten, kdo takový hodnotící soud pronese, právě nachází. Autorovi neupírám, že své tvrzení podložil precizně zpracovanými grafy, já jen tvrdím, že tento článek neodstraňuje několik problémů, které sledování a interpretace údajů o mzdách pomíjí a měl jsem tolik drzosti, že jsem se je pokusil pojmenovat (a to jsem ještě nezmínil nepeněžní benefity typu služební auta k soukromému použití apod.).

    K datům jednak nemám přístup, jednak pochybuji o tom, že je někdo exaktně a u dostatečně velkého výběrového souboru sleduje, a konečně mám jisté pochybnosti i o tom, že lze v tomto směru nějaká objektivní data vůbec naměřit. Mzdy jsou jedna z věcí, u nichž se nejvíce lže. A tak se budeme pravděpodobně všichni muset spokojit s tím, že nám občas někdo vysvětlí, jak úžasně vzrostla průměrná mzda, protože to se poměrně snadno zjistí prostým vydělením dvou čísel.

    A to o těch pivních řečích jste si mohl odpustit, ty se vedou úplně jinak :)

    OdpovědětVymazat
  10. Rad bych byl tak sectely a mel tolik casu, abych se mohl zabyvat pohyby ve spolecnosti a analyzovat, jak jednotlive zmeny v nastaveni dani a pojistnem ovlivnuji obcany v realnem svete. Jeste do celeho mixu primichat vlivy zmen v zakoniku prace a zmeny ve zdravotnictvi. Podle toho bych si mohl velmi presne udelat obrazek o tom, jak a kam se to vsechno sune (jiste jsou dalsi vlivy, ktere by bylo vhodne a zajimave zakomponovat).

    Bohuzel na tohle vsechno nemam cas, mam dost prace s tim, abych si na sebe vydelal. A tak si cas od casu nekde prectu nejaky clanek, selskym rozumem zhodnotim, jestli je autor blbec a nekde na neco zrejmeho zapomel (nekdy myslim ze zamerne), a nebo to vse docela dava smysl.

    No a tak jsem dneska nasel nestrany clanek analyzujici pomerne rozumne cely stav okolo jednoho statistickeho cisla. Ze ja blbec vubec lezl na komentare - marne se snazim tomuto nesvaru odnaucit. Takze dekuji pane Stan za naproste michani vsech faktu dohromady bez uvedeni jakychkoliv dat. Opravdu mi to pripadlo jak z agitacniho letaku nejake populistice politicke strany a doufam ze tahle zkusenost mi v budoucnu pomuze s mym odvykanim cetby komentaru pod clanky.

    Nu coz, ulevil jsem si, je cas se vratit k vytvareni neceho smysluplneho a produktivniho.

    PS Zajimave je, ze podobna kritika je slyset obycejne z ust lidi, kteri nemuzou, nebo nechteji neco ve svem zivote zmenit, aby prelezli median ci dokonce prumer (plati i mimo oblast mezd). Casto je to skoda jak pro cloveka, tak pro celou spolecnost - mohli jsme byti zas o trochu bohatsi.

    OdpovědětVymazat
  11. Vážně dobrý článek, díky za informace!

    OdpovědětVymazat