Ako čítať distribučné grafy

  • 16. 10. 2024

Vo výstupoch uvádzame niekoľko typov grafov. Ponúkame stručný návod, ako ich čítať. Číselné hodnoty v grafoch sú ilustračné.

1. Decilový graf

V grafe sú na osi x zoradené všetky rodiny podľa výšky ich ročného ekvivalentného príjmu do rovnako početných skupín (tzv. príjmových decilov). To znamená, že disponibilný príjem je prepočítaný na jedného člena rodiny. Je to kvôli „spravodlivému“ zaraďovaniu rodín do decilov. Teda aby sa nestalo, že všetky 1-členné rodiny budú automaticky v nižších deciloch a väčšie rodiny vo vyšších.

Počet členov rodiny je určený medzinárodnou modifikovanou OECD škálou – váha 1 pre prvého dospelého, váha 0,5 pre každého ďalšieho dospelého člena a váha 0,3 pre každé dieťa mladšie ako 14 rokov. To znamená, že rodina 2+2 má v tomto prípade počet členov 2,1 (1+0,5+0,3+0,3)

Samotný vplyv opatrení v jednotlivých deciloch je však už vyčíslený na neekvivalizovaných príjmoch (hodnoty na osi y). Ak hovoríme, že vplyv opatrení je 270 eur, ide o priemerný vplyv na celú rodinu v eurách.

Decilovy_graf

2. Grafy ukazujúce vplyvy po jednotlivých skupinách rodín

Grafy znázorňujú vplyv opatrení v jednotlivých typoch rodín (napr. rodiny so starobnými dôchodcami, rodiny s nezaopatrenými deťmi).

V tomto prípade je vyčíslený priemerný vplyv opatrení v celej skupine týchto rodín. Čiže ak sa napríklad rodinám s nezaopatrenými deťmi znížia ich disponibilné príjmy priemerne o 251 eur, nerozlišujeme štruktúru týchto rodín (či ide o rodinu typu jednotlivec + dieťa, jednotlivec+2 deti, dvojica+1 dieťa, dvojica+2 deti a pod).

Graf_jednotlive_skupiny_rodin

 

3. Histogram

Histogram je graf, ktorý zobrazuje, ako často sa vyskytujú rôzne hodnoty v údajoch tým, že ich rozdelí do skupín. Výška stĺpcov v grafe ukazuje, koľko hodnôt patrí do každej skupiny. Pomáha to znázorniť, či sú údaje rozdelené rovnomerne alebo ich je v niektorých skupinách výrazne menej alebo viac.

V našom ilustračnom príklade sú na osi x zobrazené sumy rodičovského dôchodku, na osi y počty poberateľov, ktorí sú rozdelení podľa výšky rodičovského dôchodku do jednotlivých kategórií.

Histogram

4. Boxplot (krabicový graf)

Graf znázorňuje distribúciu rozdielov vo výške rodičovského dôchodku v závislosti od počtu detí. Na osi x sú zoradení dôchodcovia podľa počtu ich detí. Na osi y je znázornený rozptyl hodnôt vo výške rozdielu rodičovského dôchodku v novom a starom systéme.

Box_plot

Boxplot pomáha vizualizovať rozptyl a symetriu rozdelenia dát, ako aj identifikovať prípadné extrémne hodnoty. Samotný boxplot sa skladá z obdĺžnika, ktorý je doplnený tzv. „fúzami“ (whiskers). Vodorovná čiara vnútri obdĺžnika vyznačuje medián (tzv. stredová hodnota alebo 50. percentil). Spodná hrana obdĺžnika vyznačuje 25. percentil (alebo 1. kvartil). To znamená, že 25% údajov má nižšie hodnoty než tento kvartil. Horná hrana obdĺžnika vyznačuje 75. percentil (alebo 3. kvartil). To znamená, že 25% údajov má vyššie hodnoty ako tento kvartil. Rozdiel medzi 3. a 1. kvartilom označuje tzv. medzikvartilové rozpätie (IQR). Platí, že v obdĺžniku (v medzikvartilovom rozpätí) sa nachádza 50% pozorovaných hodnôt. Fúzy siahajúce za hranice obdĺžnika určujú vzdialenosť ostatných hodnôt od mediánu a sú definované ako 1,5-násobok medzikvartilového rozpätia. Extrémne, neobvyklé hodnoty sa nachádzajú za hranicou fúzov.

Boxplot_detail