Kendallin järjestyskorrelaatiokerroin

testwikistä
Siirry navigaatioon Siirry hakuun

Kendallin järjestyskorrelaatiokerroin, eli Kendallin tau on ei-parametrinen tilastollinen tunnusluku kahden järjestysasteikollisen suureen välisen korrelaation mittaamiseen. Testin kehitti Maurice Kendall, vuonna 1938.[1]

Määritelmä

Olkoon (x1,y1),(x2,y2),,(xn,yn) havaintoja muuttujien X ja Y yhteisjakaumasta. Parit (xi,yi) ja (xj,yj) ovat samansuuntaisia, mikäli xi>xj ja yi>yj, tai xi<xj ja yi<yj. Muuten parit ovat vastakkaissuuntaisia. Määritelmän mukaan mikäli xi=xj tai yi=yj parit eivät ole vastakkais- eivätkä samansuuntaisia.

Kendallin tau-järjestyskorrelaatiokerroin on

τ=nsnvn0,[2]

missä

ns=samansuuntaisten parien lukumäärä
nv=vastakkaissuuntaisten parien lukumäärä
n0=n(n1)/2 (parien lukumäärä yhteensä).

Näin ollen taun kertoimen arvo on välillä 1τ1.

Merkitsevyyden testaaminen

Kendallin järjestyskorrelaatiokerrointa voidaan käyttää testisuureena testaamaan hypoteesia kahden muuttujan välisestä riippuvuudesta. Testi ei vaadi oletuksien muuttujien X tai Y jakaumista tai näiden yhteisjakaumasta.

Nollahypoteesin ollessa voimassa (muuttujien X ja Y ollessa riippumattomia) korrelaatiokertoimen τ otosjakauman odotusarvo on nolla. Tarkkaa jakaumaa ei voida ilmaista yleisesti tunnettujen jakaumien avulla, mutta se on laskettavissa otoskokojen ollessa pieniä. Suurille otoskoille voidaan käyttää approksimaatiota normaalijakaumasta keskiarvolla nolla ja varianssilla

2(2n+5)9n(n1).[3]

Tasatulokset

Tilanteessa, jossa muuttujien järjestysluvuissa esiintyy tasatuloksia eli sidoksia voidaan tunnusluvusta käyttää versioita, joissa tasatulokset on otettu huomioon.[4]

Lähteet

Malline:Viitteet

Aiheesta muualla