Vizsgáljuk meg a következő adatsort.
4; 5; 6; 6; 6; 6; 6; 7; 7; 7; 7; 7; 7; 7; 8; 8; 8; 9; 10

Ezt az adatsort az alábbi hisztogrammal lehet ábrázolni. Minden intervallum szélessége egy, és minden érték egy intervallum közepén helyezkedik el.

2.11. ábra

A hisztogram az adatok szimmetrikus eloszlását mutatja. Egy eloszlás akkor szimmetrikus, ha a hisztogram valamelyik pontján egy függőleges vonal húzható úgy, hogy a függőleges vonaltól balra és jobbra lévő alakzat egymás tükörképe. Az átlag, a medián és a módusz ezeknél az adatoknál egyenként hét. Tökéletesen szimmetrikus eloszlásban az átlag és a medián megegyezik. Ebben a példában egy módusz van (unimodális), és a módusz megegyezik az átlaggal és a mediánnal. Egy olyan szimmetrikus eloszlásban, amelynek két módusza van (bimodális), a két módus eltérne az átlagtól és a mediántól.

Az adatok hisztogramja: A 2.11. ábrán látható 4; 5; 6; 6; 6; 6; 7; 7; 7; 7; 8 nem szimmetrikus. A jobb oldal “levágottnak” tűnik a bal oldalhoz képest. Az ilyen típusú eloszlást balra ferde eloszlásnak nevezzük, mert balra húzódik. Formálisan mérhetjük egy eloszlás ferdeségét, ahogyan matematikailag mérhetjük az adatok középponti súlyát vagy általános “speadness”-ét is. A ferdeség matematikai képlete: a3=∑(xi-x¯)3ns3a3=∑(xi-x¯)3ns3. Minél nagyobb az eltérés a nullától, annál nagyobb fokú ferdeséget jelez. Ha a ferdeség negatív, akkor az eloszlás balra ferde, mint a 2.12. ábrán. A ferdeség pozitív mértéke jobbra ferdeséget jelez, mint a 2.13. ábrán.

2.12. ábra

A középérték 6,3, a medián 6,5, a módusz pedig hét. Vegyük észre, hogy az átlag kisebb, mint a medián, és mindkettő kisebb, mint a módusz. Az átlag és a medián is tükrözi a ferdeséget, de az átlag jobban tükrözi azt.

A 2.12. ábrán látható adatok:6; 7; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 10 hisztogramja szintén nem szimmetrikus. Jobbra ferde.

2.13. ábra

A középérték 7,7, a medián 7,5, a módusz pedig hét. A három statisztika közül az átlag a legnagyobb, míg a módusz a legkisebb. Ismét az átlag tükrözi leginkább a ferdeséget.

Összefoglalva, általában, ha az adatok eloszlása balra ferde, az átlag kisebb, mint a medián, amely gyakran kisebb, mint a módusz. Ha az adatok eloszlása jobbra ferde, a módusz gyakran kisebb, mint a medián, amely kisebb, mint az átlag.

Az átlag, a medián és a módusz, valamint – amint azt rövidesen látni fogjuk – a variancia esetében is léteznek olyan matematikai képletek, amelyek pontos mérőszámokat adnak az adatok eloszlásának ezen jellemzőire. Ismét megnézve a ferdeség képletét, láthatjuk, hogy ez az adatok átlaga és az egyes megfigyelések kockára vetett értéke közötti kapcsolat.

a3=∑(xi-x¯)3ns3a3=∑(xi-x¯)3ns3

ahol ss az adatok mintavételi szórása, XiXi , x¯x¯ pedig a számtani átlag és nn a minta mérete.

A számtani átlagot formálisan az eloszlás első momentumának nevezzük. A második momentum, amit látni fogunk, a variancia, a ferdeség pedig a harmadik momentum. A variancia az adatoknak az átlagtól való négyzetes eltéréseit, a ferdeség pedig az adatoknak az átlagtól való kockás eltéréseit méri. Míg a variancia soha nem lehet negatív szám, a ferdeség mértéke lehet, és így határozzuk meg, hogy az adatok jobbra vagy balra ferdék. Normális eloszlás esetén a ferdeség értéke nulla, és minden szimmetrikus adat ferdeségének nulla közelében kell lennie. A ferdeség negatív értékei balra ferde adatokat, a pozitív értékek pedig jobbra ferde adatokat jeleznek. A balra ferde alatt azt értjük, hogy a bal farok hosszú a jobb farokhoz képest. Hasonlóképpen, a jobbra ferde azt jelenti, hogy a jobb farok hosszú a bal farokhoz képest. A ferdeség az eloszlás átlaga körüli aszimmetria mértékét jellemzi. Míg az átlag és a szórás dimenziós mennyiségek (ezért vesszük a variancia négyzetgyökét ), azaz ugyanazokkal az egységekkel rendelkeznek, mint a mért XiXi mennyiségek, addig a ferdeséget konvencionálisan úgy definiálják, hogy az dimenziótlan legyen. Ez egy tiszta szám, amely csak az eloszlás alakját jellemzi. A ferdeség pozitív értéke olyan eloszlást jelöl, amelynek aszimmetrikus farka a pozitívabb X felé nyúlik ki, a negatív érték pedig olyan eloszlást, amelynek farka a negatívabb X felé nyúlik ki. A ferdeség nulla mértéke szimmetrikus eloszlást jelöl.

A ferdeség és a szimmetria fontos lesz, amikor a valószínűségi eloszlásokat tárgyaljuk a későbbi fejezetekben.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.