Varianssi

testwikistä
Versio hetkellä 27. tammikuuta 2025 kello 19.43 – tehnyt imported>Abc10 (Tammi)
(ero) ← Vanhempi versio | Nykyinen versio (ero) | Uudempi versio → (ero)
Siirry navigaatioon Siirry hakuun

Varianssi on todennäköisyyslaskennassa ja tilastotieteessä satunnaismuuttujan hajonnan mitta. Varianssi kuvaa sitä, kuinka paljon satunnaismuuttujan arvot keskimäärin vaihtelevat odotusarvosta tai populaation keskiarvosta. Varianssissa yksittäisen mittauksen poikkeamat keskiarvosta tai odotusarvosta korotetaan toiseen potenssiin (neliöön). Varianssi saadaan ottamalla keskiarvo näistä neliöön korotetuista eroista. Kun arvot keskittyvät odotusarvon ympärille tiiviisti, on varianssin arvo pieni, ja kun arvot ovat hajallaan odotusarvon ympärillä, on sen arvo suuri. Reaaliarvoisen satunnaismuuttujan varianssi on sen toinen keskusmomentti. Varianssin yksikkö on satunnaismuuttujan yksikkö korotettuna toiseen potenssiin. Varianssin neliöjuurta sanotaan keskihajonnaksi, jonka yksikkö on sama kuin satunnaismuuttujalla.[1][2][3][4]

Määritelmä ja merkinnät

Matemaattisesti varianssi σX2 määritellään reaaliarvoisen satunnaismuuttujan X odotusarvon E avulla

σX2=E((Xμ)2), [2]

missä μ=E[X] on satunnaismuuttujan odotusarvo. Varianssin arvo on ääretön, ellei odotusarvo E[X2] ole äärellisenä olemassa. Varianssi voidaan merkitä myös

σX2=σ2(X)=σ2=Var(X)=D2(X). [2][4]

Varianssin avulla voidaan esittää myös keskihajonta eli standardipoikkeama σX=σX2. [2]

Diskreetti satunnaismuuttuja

Diskreetin satunnaismuuttujan varianssi lasketaan

σX2=xX(xμX)2fX(x), [2][3][4]

missä fX(x) on jakauman pistetodennäköisyysfunktio.

Jatkuva satunnaismuuttuja

Jatkuvan satunnaismuuttujaparin varianssi on taas

σX2=+(xμX)2fX(x)dx, [2][3][4]

missä fX(x) on jakauman tiheysfunktio.

Ominaisuuksia

Rinnakkaiskaavan johtaminen

Varianssin lauseketta voidaan kehittää edelleen käyttämällä hyväksi odotusarvon ominaisuuksia:[2]

σX2=E[(XE[X])2]=E[X22XE[X]+(E[X])2]=E[X2]2E[X]E[X]+(E[X])2=E[X2](E[X])2

Ensimmäistä muotoa kutsutaan toiseksi keskusmomentiksi ja viimeisessä muodossa käytetään toista ja ensimmäistä origomomenttia.[4]

Varianssin laskemiseksi on käytössä myös tekijämomentin sisältävä muoto:

σ2=E[X(X1)]+E[X](E[X])2 [3]

Ominaisuuksia

Varianssin arvo on aina epänegatiivinen. Kun varianssi on nolla, ei arvoissa esiinny vaihtelua ja satunnaismuuttuja antaa vain samoja arvoja. Siten

σ2(X)0. [3]

Varianssi on kovarianssi kahden identtisen satunnaismuuttujan välillä

σ2(X)=σ(X,X). [5] (kovarianssi)

Päättelysääntöjä summista

Jokaisen satunnaismuuttujan arvoon lisätty vakio ei vaikuta varianssin arvoon eli

σ2(X+a)=σ2(X), [2][3][4]

mutta arvojen kertominen vakiolla kasvattavat (|a|>1) tai vähentävät (|a|<1) varianssia

σ2(aX)=a2σ2(X). [2][3][4]

Kahden satunnaismuuttujan lineaarikombinaatiossa varianssiin vaikuttaa myös satunnaismuuttujien kovarianssi

σ2(aX±bY)=a2σ2(X)+b2σ2(Y)±2abσ(X,Y), [2]

mikä merkitään yleisemmässä tapauksessa

σ2(a1X1+a2X2++anXn)=i=1nai2σ2(Xi)+21i<jnaiajσ(Xi,Xj). [2][4]

Nämä arvot voidaan käsitellä hallitummin kovarianssimatriisissa.[6] Tämä ominaisuus vaikuttaa myös satunnaismuuttujien summan varianssiin

σ2(X1+X2++Xn)=i=1nj=1nσ(Xi,Xj)=i=1nσ2(Xi)+ijσ(Xi,Xj). [4]

Kovarianssia ei tarvitse huomioida, mikäli satunnaismuuttujat ovat korreloimattomia σ(Xi,Xj)=0 ,  (ij), jolloin

σ2(X1+X2++Xn)=i=1nσ2(Xi).

Riippumattomat satunnaismuuttujat ovat aina korreloimattomia. Korreloimattomilla satunnaismuuttujilla välimerkki ei vaikuta varianssin arvoon

σ2(X±Y)=σ2(X)+σ2(Y). [2]

Päättelysääntöjä tuloista

Kahden satunnaismuuttujan tulon varianssi voidaan määrittää odotusarvon ominaisuuksien avulla

Var(XY)=[E(X)]2Var(Y)+[E(Y)]2Var(X)+Var(X)Var(Y)=E(X2)E(Y2)[E(X)]2[E(Y)]2.

Populaatio- ja otosvarianssi

Varianssi lasketaan äärelliselle populaatiolle (y1,,yN) seuraavasti

σx2=1Ni=1N(yiy)2, [1][7][4]

missä y on populaation keskiarvo. Tätä kutsutaan toisinaan otosvarianssiksi, mutta termin käyttö on vaihtelevaa. Kun (y1,,yN) on otos laajemmasta populaatiosta, σ2 on varianssin tarkentuva mutta harhainen estimaatti. Harhaton estimaatti on

sx2=1N1i=1N(yiy)2, [1][7][4]

jota yleensä kutsutaan otosvarianssiksi. Suurten otosten tapauksessa ei ole käytännössä merkitystä kumpaa estimaattoria käytetään. Molempien keskihajonta saadaan ottamalla varianssista neliöjuuri.[7][4]

Lähteet

Malline:Viitteet

Malline:Metatieto

  1. 1,0 1,1 1,2 Viittausvirhe: Virheellinen <ref>-elementti; viitettä ala6_31 ei löytynyt
  2. 2,00 2,01 2,02 2,03 2,04 2,05 2,06 2,07 2,08 2,09 2,10 2,11 Viittausvirhe: Virheellinen <ref>-elementti; viitettä mellin165 ei löytynyt
  3. 3,0 3,1 3,2 3,3 3,4 3,5 3,6 Viittausvirhe: Virheellinen <ref>-elementti; viitettä hr ei löytynyt
  4. 4,00 4,01 4,02 4,03 4,04 4,05 4,06 4,07 4,08 4,09 4,10 4,11 Viittausvirhe: Virheellinen <ref>-elementti; viitettä Variance ei löytynyt
  5. Viittausvirhe: Virheellinen <ref>-elementti; viitettä Covariance ei löytynyt
  6. Viittausvirhe: Virheellinen <ref>-elementti; viitettä CovarianceMatrix ei löytynyt
  7. 7,0 7,1 7,2 Viittausvirhe: Virheellinen <ref>-elementti; viitettä mellin240 ei löytynyt