Hajontaluku

testwikistä
Siirry navigaatioon Siirry hakuun
Keskihajonta normaalijakauman tapauksessa: yhden keskihajonnan etäisyys keskiarvosta rajaa todennäköisyysmassasta 68,27 %, kahden keskihajonnan etäisyys 95,45 % ja kolmen keskihajonnan etäisyys 99,73 %.

Hajontaluku on tilastotieteessä todennäköisyysjakauman hajonnan eli sen satunnaismuuttujan vaihtelun mitta.[1] Yleisimpiä hajontalukuja ovat keskihajonta, varianssi, otoskeskihajonta, otosvarianssi, kvantiili ja variaatiokerroin. [2] Hajontaluvut ovat keskilukujen ohella keskeisimpiä jakaumiin liittyviä käsitteitä.[1]

Hajonnan mittaaminen

Hajontaluku on reaaliluku, joka saa sitä suuremman arvon mitä enemmän vaihtelua jakauman satunnaismuuttujien arvoissa esiintyy. Yleensä tämä lasketaan mittaamalla havaittujen arvojen etäisyyttä havaintoarvojen odotus- tai keskiarvosta. Käytettävän hajontaluvun valinta riippuu käyttötarkoituksesta; eri hajontaluvut sopivat eri tilanteisiin riippuen, pyritäänkö tarkastelemaan jakauman absoluuttista vaiko suhteellista hajontaa. Jos otannassa ei ole vaihtelua, hajontaluku saa arvon nolla.[1]

Joskus hajontaa kuvattaessa käytetään mittauksen kohteen kanssa samaa yksikköä. Jos mittauksen kohteen yksikkö on esimerkiksi kilogramma, myös hajonnan yksikkönä käytetään kilogrammaa. Tällöin hajontalukua voi käyttää hajonnan absoluuttisten arvojen tarkasteluun. Tällaisia hajonnan mittoja ovat:

Yksiköttömät hajontaluvut kuvaavat suhteellista hajontaa satunnaismuuttujan odotusarvoon nähden. Usein nämä voidaan ilmaista prosentteina. Tällöin on mahdollista vertailla myös eri yksiköissä ilmaistujen jakaumien hajontoja. Yksiköttömiä hajontalukuja ovat:

Muita hajontalukuja ovat:

Yleisimmät hajontaluvut

Varianssi

Malline:Pääartikkeli Varianssi kuvaa, kuinka kaukana satunnaismuuttujan arvot ovat tyypillisesti sen odotusarvosta. Reaaliarvoisen satunnaismuuttujan varianssi on sen toinen keskimomentti. Varianssin neliöjuurta sanotaan keskihajonnaksi.

Diskreetin jakauman varianssi lasketaan kaavalla

Var(X)=σx2=E[(Xμx)2], jossa X on satunnaismuuttuja ja μ on sen odotusarvo tai keskiarvo.[3]

Jatkuvan jakauman varianssi lasketaan kaavalla Var(X)=σx2=+(xμx)2f(x)dx.[3][1]

Keskihajonta

Malline:Pääartikkeli Satunnaismuuttujan standardipoikkeama eli keskihajonta kuvaa keskimääräistä poikkeamaa odotusarvosta. Keskihajonta on varianssin neliöjuuri: D(X)=σx=σx2.[2][3] Etuna varianssiin nähden on tulkinnan helppous, sillä keskihajonnan asteikko vastaa mittausten asteikkoa.

Otosvarianssi

Otosvarianssi on varianssi, joka lasketaan suuremman joukon osajoukosta. Kun n lukuarvon joukko y1,y2,,yn on suuremman joukon Y osajoukko, tämän otosvarianssi on s2=i=1n(yiy)2n1, missä y=i=1nyin  on tutkittavan muuttujan y keskiarvo.[3]

Otoshajonta

Malline:Pääartikkeli Otoksen (y1,,yn) keskihajonnan harhatonMalline:Lähde estimaatti eli otoshajonta on otosvarianssin neliöjuuri:

s=i=1n(yiy)2n1.[3]

Kvantiiliväli

Kvantiilit ovat satunnaismuuttujan kertymäfunktiolta säännöllisin välein poimittuja prosenttipisteitä. Satunnaismuuttujan x β-kvantiili kβ, 0<β<1, on luku, joka toteuttaa ehdot P(x<kβ)<=β ja .[1]

Jakamalla todennäköisyysjakauman kertymäfunktio q kappaleeseen yhtä suuria joukkoja saadaan q-kvantiili. Osalle kvantiileista on vakiintuneet nimet: 100-kvantiilit ovat persentiilejä, 10-kvantiilit ovat desiilejä, 5-kvantiilit ovat kvintiilejä, ja 4-kvantiilit ovat kvartiileja. Kvantiilien avulla on mahdollista muodostaa kvantiiliväli, joka kuvaa todennäköisyyttä, jolla satunnaismuuttuja saa arvot kahden eri kvantiilin välillä.[1]

Variaatiokerroin

Variaatiokerroin on hajontaluku, joka ei ole mittayksikköön sidottu. Variaatiokertoimen avulla on mahdollista vertailla kahden eri mitta-asteikolla mitatun jakauman hajontoja. Variaatiokerroin v on määritelty keskihajonnan s ja keskiarvon x¯ osamääränä:

v=s/x¯*100%.[4][1]

Vaihteluväli

Vaihteluväli on järjestys-, välimatka- ja suhdeasteikon muuttujille sopiva hajontaluku. Se kuvaa pienimmän ja suurimman muuttujan välin [Minx,Maxx], joka lasketaan näiden arvojen erotuksena MaxxMinx.[2][1]

Käyttötarkoituksia

Hajonnan avulla on mahdollista saada kattavampi käsitys satunnaismuuttujan todennäköisimmistä arvoista. Esimerkiksi joukkojen A=(1,1,1,9,9,9) jaB=(4,5,5,5,5,6) lukuja arpomalla saadaan alkioiden arvojen yhtäsuuresta odotusarvosta huolimatta hyvin erilaisia tuloksia. Tunnettujen hajontalukujen avulla onkin mahdollista arvioida erilaisten tapahtumien todennäköisyyksiä, mikä on keskeistä muun muassa riskienhallinnassa.

Fysiikassa, kemiassa ja muissa mitattavissa luonnontieteissä mittaustulosten vaihtelua tarkastelemalla on mahdollista arvioida koetulosten luotettavuutta.

Biologiassa populaation ominaisuuksien määrittämisessä on keskeistä huomioida havaittujen ominaisuuksien vaihtelu.

Rahoitusmatematiikassa portfolion odotetun tuoton varianssi ja keskihajonta kuvaavat sijoitukseen kohdistuvaa riskiä. Mitä pienempi hajonta on, sitä todennäköisemmin sijoituksesta saatu tuotto vastaa sen odotusarvoa ja sitä houkuttelevampi sijoituskohde on.

Taloustieteessä, rahoituksessa ja muissa tieteissä hajontaa pyritään selittämään regressioanalyysillä, joka kuvaa muuttujan saamia arvoja suhteessa toiseen muuttujaan.[5]

Katso myös

Lähteet

Malline:Viitteet


Aiheesta muualla

Malline:Commonscat

Malline:Metatieto