Kovarianssi

testwikistä
Siirry navigaatioon Siirry hakuun
Kuvassa tapauksiin liittyvien kahden satunnaismuuttujan arvojen mukaan tulostetut pisteet muodostavat kuvion, joka on selvästi jotain muuta kuin pyöreä pistepilvi. Sen mukaan satunnaismuuttujien arvot voisivat riippua toistaan eli niillä olisi kovarianssia.

Kovarianssi on todennäköisyyslaskennassa ja tilastotieteessä kahden satunnaismuuttujan välisen riippuvuuden mitta. Se kuvaa, kuinka läheisesti muuttujat vaihtelevat yhdessä. Yksinkertaistaen voidaan havainnollistaa, että kovarianssi saa positiivisen arvon, kun satunnaismuuttujan arvot jäävät samalle puolelle odotusarvoihinsa nähden, ja vastaavasti negatiivisen arvon, kun niiden arvot jäävät eri puolille odotusarvoihinsa nähden. Kovarianssi on yhteisjakauman toinen keskusmomentti, jonka yksiköksi eli dimensioksi tulee kummankin satunnaismuuttujan yksiköiden tulo. Momentin käsitteeseen liittyy tulkinta, että kovarianssi on niin sanotun yhteisjakauman "todennäköisyysmassan painopisteen" (E[X],E[Y]) ympärillä tapahtuvan vaihtelun mitta. Korrelaatio on kovarianssin normalisoitu tunnusluku, joka on puolestaan yksikötön.[1]

Todennäköisyyslaskennassa kovarianssi on yhteisjakauman tunnusluku, kun taas tilastolaskennassa kovarianssi on todennäköisyyslaskennan tunnusluvun estimaatti.

Määritelmä ja merkinnät

Matemaattisesti kovarianssi σXY on määritelty kahden reaaliarvoisen satunnaismuuttujan X ja Y avulla

σXY=E[(XμX)(YμY)],

missä E[X]=μX ja E[Y]=μY ovat vastaavasti satunnaismuuttujien odotusarvot. Kovarianssi voidaan merkitä erilaisilla vaihtoehtoisilla tavoilla, kuten esimerkiksi

σXY=σ(X,Y)=cov(X,Y)=Cov(X,Y). [1]

Yhteisjakaumassa voi esiintyä myös merkinnät σX ja σY. Ne esittävät satunnaismuuttujien keskihajontoja σX=σX2 ja σY=σY2.[2]

Diskreetit satunnaismuuttujat

Diskreetin satunnaismuuttujaparin kovarianssi lasketaan

σXY=xXyY(xμX)(yμY)fXY(x,y), [1]

missä fXY(x,y) on yhteisjakauman pistetodennäköisyysfunktio.

Jatkuvat satunnaismuuttujat

Jatkuvan satunnaismuuttujaparin kovarianssi on taas

σXY=++(xμX)(yμY)fXY(x,y)dydx, [1]

missä fXY(x,y) on yhteisjakauman tiheysfunktio.

Ominaisuuksia

Rinnakkaiskaavan johtaminen

Yleisessä tilanteessa satunnaismuuttujat ovat toisistaan riippuvia jossakin mielessä. Silloin kovarianssi voidaan kehittää edelleen hyödyntämällä odotusarvo-operaattorin tunnetut ominaisuudet:[1]

σ(X,Y)=E[(XE[X])(YE[Y])]=E[XYXE[Y]E[X]Y+E[X]E[Y]]=E[XY]E[X]E[Y]E[X]E[Y]+E[X]E[Y]=E[XY]E[X]E[Y]=E[XY]μXμY.

Riippumattomuus

Jos satunnaismuuttujat ovat riippumattomia, saadaan odotusarvoksi

E[XY]=E[X]E[Y]=μXμY.

Yleisen kovarianssin kehitetystä lausekkeesta tulee silloin

cov(X,Y)=E[XY]E[X]E[Y]=E[X]E[Y]E[X]E[Y]=0.

Siten, jos satunnaismuuttujat ovat riippumattomia toisistaan, saadaan kovarianssiksi nolla. Päinvastainen ei pidä aina paikkaansa, sillä kovarianssin ollessa nolla eivät satunnaismuuttujat aina ole riippumattomia toisistaan.[2][1]

Arvojoukko

Kovarianssin yksikkö määräytyy satunnaismuuttujien tulosta. Koska korrelaation arvo jää välille 1rXY1, saadaan kovarianssin arvolle väli σXσYσXYσXσY, missä σXσY on keskihajontojen tulo.

Päättelysääntöjä

Kovarianssille voidaan johtaa seuraavia laskusääntöjä (a,b ovat reaalivakioita):

σ(X,a)=0
σ(X,X)=σ2(X) eli σXX=σX2 [2][3][1] (varianssi)
σ(X,Y)=σ(Y,X) [2] (symmetrisyys)
σ(aX,bY)=abσ(X,Y) (kertoimien ulosotto)
σ(X+a,Y+b)=σ(X,Y) (vakionlisäys)
σ(X+Z,Y)=σ(X,Y)+σ(Z,Y) [2] (summan kovarianssi)
σ(aX+bY,cW+dV)=acσ(X,W)+adσ(X,V)+bcσ(Y,W)+bdσ(Y,V) (lineaarikombinaatiot)
σ(iXi,jYj)=ijσ(Xi,Yj) [2] (useiden satunnaismuuttujien summat)

Tilastollinen kovarianssi

Arvioitaessa kahden tilastomuuttujan kovarianssia, käytetään estimaattorina lauseketta

σXY=i=1n(xix¯)(yiy¯)n, [2]

missä otoksen suuruus on n ja otoksen muuttujien keskiarvot ovat x¯ ja y¯. Usein kuitenkin jaetaan summa otoksen suuruutta yhtä pienemmällä luvulla (vapausaste)

σXY=i=1n(xix¯)(yiy¯)n1. [4]

Satunnaisvektorit

Kun X ja Y ovat n- ja m-ulotteisia pystyvektoreita, n x m-ulotteinen kovarianssimatriisi on määritelty:

σ(X,Y)=E((XμX)(YμY)).

Matriisit cov(X,Y) ja cov(Y,X) ovat toistensa transpooseja. Kun X on vektori, matriisia cov(X,X) sanotaan X:n kovarianssimatriisiksi tai pidemmin varianssi-kovarianssi-matriisiksi.[5]

Korrelaatiokerroin

Kovarianssilla voidaan mitata satunnaismuuttujien riippuvuuksia, mutta satunnaismuuttujien keskihajonnat vaikuttavat myös kovarianssin arvoon. Tuloksesta voidaan puhdistaa keskihajontojen vaikutukset jakamalla kovarianssi niillä, jolloin saadaan uusi riippuvuuden mitta korrelaatiokerroin

ρXY=σXYσXσY. [1]

Sen arvot vaihtelevat välillä 1ρXY1 eikä sillä ole mittayksikköä.

Katso myös

Lähteet

Malline:Viitteet

  1. 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 Viittausvirhe: Virheellinen <ref>-elementti; viitettä mellin210 ei löytynyt
  2. 2,0 2,1 2,2 2,3 2,4 2,5 2,6 Viittausvirhe: Virheellinen <ref>-elementti; viitettä Covariance ei löytynyt
  3. Viittausvirhe: Virheellinen <ref>-elementti; viitettä Variance ei löytynyt
  4. Viittausvirhe: Virheellinen <ref>-elementti; viitettä mellin240 ei löytynyt
  5. Viittausvirhe: Virheellinen <ref>-elementti; viitettä CovarianceMatrix ei löytynyt