Odotusarvo

testwikistä
Versio hetkellä 27. tammikuuta 2025 kello 20.31 – tehnyt imported>Abc10 (Tammi)
(ero) ← Vanhempi versio | Nykyinen versio (ero) | Uudempi versio → (ero)
Siirry navigaatioon Siirry hakuun

Odotusarvo on todennäköisyyslaskennassa ja tilastotieteessä satunnaisilmiön tuottamien lukujen odotettavissa oleva arvo. Numeerisia lukuarvoja tuottavia satunnaisilmiöitä kutsutaan satunnaismuuttujiksi. Satunnaismuuttujan tuottamat luvut ja niiden todennäköisyydet muodostavat yhdessä todennäköisyysjakauman. Odotusarvo on todennäköisyysjakauman ensimmäinen tunnusluku eli momentti.[1][2][3][4]

Keskiarvo ja odotusarvo samaistetaan usein toisiinsa, vaikka odotusarvo on todennäköisyyslaskennan käsite ja keskiarvo lukuihin liittyvä tilastotieteen käsite. Odotusarvo saadaan laskemalla keskiarvo äärettömän monesta, yhden satunnaismuuttujan tuottamasta luvusta. Se voidaan myös tulkita keskiarvoksi äärettömän monesta äärellisen kokoisesta otoskeskiarvosta. Odotusarvolla on sama yksikkö kuin satunnaismuuttujalla.[1][4][5][3]

Määritelmä ja merkinnät

Odotusarvo voidaan merkitä eri tavoilla E(X)=μX=μ=X. [5][4][2]

Matemaattisesti odotusarvo E(X) määritellään diskreeteille ja jatkuville satunnaismuuttujille erikseen.

Diskreetti satunnaismuuttuja

Diskreetin satunnaismuuttujan X saamien kaikkien arvojen joukkoa kutsutaan todennäköisyyslaskennassa perusjoukoksi ja se merkitään Ω=X={x1,x2,,xn}. Kunkin arvon esiintymistodennäköisyyttä merkitään vastaavasti p1,p2, ja pn. Näitä todennäköisyyksiä kutsutaan usein pistetodennäköisyyksiksi ja niitä saatetaan merkitä myös

pi=p(xi)=fX(xi), [5]

jossa funktioita p(xi) ja fX(xi) kutsutaan pistetodennäköisyysfunktioiksi.

Diskreetin satunnaismuuttujan odotusarvo määritellään nyt (eri merkintätapoja käyttäen)

E(X)=i=1nxipi=xiΩxip(xi)=xiXxifX(xi). [2][3][6]

Esimerkkinä nopanheitto

Pisteluvun odotusarvo kuusitahoiselle nopalle, jonka kaikkien pistelukujen todennäköisyys on yhtä suuri, on

E(X)=116+216+316+416+516+616=1+2+3+4+5+66=3,5.[5][2]

Noppapelissä pelaaja voi odottaa etenevänsä pelilaudalla noin 3,5 askelta kierrosta kohti.[3]

Jatkuva satunnaismuuttuja

Jatkuvan satunnaismuuttujan X saamien reaalilukuarvojen joukko muodostaa vähintään yhden yhtenäisen lukuvälin I, joka on reaalilukujen osajoukko. Luvut I muodostavat satunnaismuuttujan perusjoukon Ω ja se voidaan merkitä I=Ω. Reaalilukuja ei voida luetella, joten yksittäiseen lukuun liittyvää todennäköisyyttäkään ei voida esittää luettelemalla. Sen sijaan jokaisen välin I luvulle voidaan liittää lukuarvo käyttämällä funktiota. Tätä funktiota kutsutaan todennäköisyyslaskennassa tiheysfunktioksi. Tiheysfunktion arvot eivät ole suoraan todennäköisyyksiä, mutta sen avulla voidaan eri tapahtumille laskea ne.[5]

Jatkuvan satunnaismuuttujan tiheysfunktio on fX(x) ja tämän avulla määritellään satunnaismuuttujan odotusarvo

E(X)=xfX(x)dx. [5][2]

Yleisempi jatkuva määritelmä

Määritellään satunnaismuuttujan X:Ω odotusarvo integraalina yli satunnaismuuttujan perusjoukon Ω todennäköisyysmitan P suhteen

E(X)=ΩXdP. [7]

Tämä voidaan kirjoittaa satunnaismuuttujan X kertymäfunktion F suhteen Lebesgue–Stieltjes-integraalilla

E(X)=xdP(Xx)=xdF(x). [7]

Satunnaismuuttujan funktion odotusarvo

Jos g(x) on mitallinen funktio, voidaan laskea sillekin odotusarvo E(g(X)). Jos X on diskreetti satunnaismuuttuja, on odotusarvo

E(g(X))=xiXg(xi)fX(xi). [6][7]

ja jos se on jatkuva, saadaan odotusarvoksi

E(g(X))=g(x)fX(x)dx [7]

Tällä ajattelulla on mahdollista määrittää esimerkiksi origomomentteja E(X2) E(Xn) tai keskusmomentteja E((Xμ)n).

Ehdollinen odotusarvo

Satunnaismuuttujan X ehdollinen odotusarvo alisigma-algebralla 𝒢 on 𝒢-mitallinen satunnaismuuttuja E(X|𝒢), jolle yhtälö

GE(X|𝒢)dP=GXdP

pätee kaikilla G𝒢. Satunnaismuuttujan X ehdollinen odotusarvo ehdolla satunnaismuuttuja Y on E(X|σ(Y)), missä σ(Y) tarkoittaa satunnaismuuttujan Y virittämää sigma-algebraa.

On huomattava, että ehdollinen odotusarvo on satunnaismuuttuja, eli funktio ehdollistettavasta muuttujasta. Ehdollinen odotusarvo ehdolla G𝒢 on E(X|𝒢)(ω), missä ωG on reaaliluku.

Ominaisuuksia

Todennäköisyysmassalla tarkoitetaan todennäköisyyslaskennassa pistetodennäköisyysfunktion pylväikköä tai tiheysfunktion kuvaajan alle jäävää aluetta. Odotusarvo on sellainen satunnaismuuttujan arvo, joka vastaa tämän alueen painopistettä. Symmetrisen jakauman keskikohta on myös jakauman odotusarvo.[5]

Satunnaismuuttujan X, jonka ulostuloina on vain vakion a arvoja, odotusarvo on

E[X]=a. [4]

Tästä seuraa myös, että E[E[X]]=E[X]=a. [5]

Odotusarvon olemassaolo

Todennäköisyysjakaumalla ei välttämättä ole olemassa odotusarvoa, jos jakauma ei toteuta niin sanottua itseistä satunnaismuuttujan odotusarvoa (itseisarvo)

xiX|xi|p(xi)<

tai jatkuvassa tapauksessa

|x|fX(x)dx<. [5][6][7]

Satunnaismuuttujan sanotaan olevan integroituva, jos sen odotusarvo on äärellinen eli E(X)<. Jos se ei ole integroituva, on se vielä kvasi-integroituva, jos E(max{X,0})< tai E(min{X,0})<.

Summat ja lineaarikombinaatiot

Seuraaville satunnaismuuttujille X,Y ja {X1,X2,,Xn} sekä reaaliluvuille a,b ja {a1,a2,,an} voidaan johtaa seuraavia tuloksia.

Odotusarvo on lineaarinen operaattori, jolloin suorien summien odotusarvo on

E(X±Y)=E(X)±E(Y) [5]

ja lineaarikombinaatioiden odotusarvo on

E(aX+bY)=aE(X)+bE(Y). [5][7]

Tällöin useamman satunnaismuuttujan tapauksissa on myös

E(X1+X2++Xn)=E(X1)+E(X2)++E(Xn) [4]

ja

E(a1X1+a2X2++anXn)=a1E(X1)+a2E(X2)++anE(Xn). [4]

Luvun lisääminen satunnaismuuttujien arvoihin vaikuttaa myös sen odotusarvoon

E(X+a)=E(X)+E(a)=E(X)+a.

Satunnaismuuttujan ensimmäinen keskusmomentti on aina nolla, koska

E(XμX)=E(X)E(μX)=E(X)μX=E(X)E(X)=0,

jos μX=E(X).

Tulot

Riippumattomien satunnaismuuttujien tulon odotusarvo on kahden satunnaismuuttujan tapauksessa

E(XY)=E(X)E(Y)

ja usean satunnaismuuttujan tapauksessa

E(X1X2Xn)=E(X1)E(X2)E(Xn). [8]

Riippuvassa tapauksessa

E(XY)=E(X)E(Y)+σ(X,Y).

Lisäksi jos X0, niin E(X)0, ja yleisemmin jos XY, niin E(X)E(Y).

Ehdolliselle odotusarvolle pätee niin sanottu iteroidun odotusarvon laki

E(X)=EY(EX(X|Y)).

Populaatio- ja otoskeskiarvo

Odotusarvo on satunnaismuuttujan tärkein tunnusluku. Otoskeskiarvolla tarkoitetaan suppean otoksen keskiarvoa suuremmasta populaatiosta. Sen avulla on mahdollista selvittää odotusarvon suuruus likimääräisesti, mutta kuitenkin "edullisesti". Keskiarvoa on tällöin pidettävä odotusarvon estimaattorina.[9]

Kun lasketaan otoskeskiarvojen odotusarvoa, saadaan edellisten päättelysääntöjen avulla

E(x¯)=E(1ni=1nxi)=1ni=1nE(xi)=1ni=1nE(X)=1nnE(X)=E(X).

Tämä tarkoittaa sitä, että keskiarvon lausekkeella saadaan keskimäärin odotusarvon tuloksia eli estimaattori on harhaton.[10]

Keskiarvolla on toinen ominaisuus, joka liittyy estimointiin. Kun keskiarvon laskemiseksi kasvataetaan otoksen lukumäärää (otoksen ulostulot ovat riippumattomia toisistaan), käy keskiarvon varianssin

σ2(1ni=1nxi)=1n2σ2(i=1nxi)=1n2i=1nσ2(xi)=1n2i=1nσ2=σ2n.

Keskiarvo on tarkentuva odotusarvon estimaattori, koska varianssi pienenee kun otoksen lukumäärä n kasvaa.[10]

Suurten lukujen lakien mukaan satunnaismuuttujan keskiarvo toistokokeessa on sen odotusarvo ja keskiarvo on siten odotusarvon harhaton ja tarkentuva estimaattori.

Lähteet

Malline:Viitteet

  1. 1,0 1,1 Viittausvirhe: Virheellinen <ref>-elementti; viitettä etalukio1 ei löytynyt
  2. 2,0 2,1 2,2 2,3 2,4 Viittausvirhe: Virheellinen <ref>-elementti; viitettä kivela_j4 ei löytynyt
  3. 3,0 3,1 3,2 3,3 Viittausvirhe: Virheellinen <ref>-elementti; viitettä ala6_66 ei löytynyt
  4. 4,0 4,1 4,2 4,3 4,4 4,5 Viittausvirhe: Virheellinen <ref>-elementti; viitettä ExpectationValue ei löytynyt
  5. 5,00 5,01 5,02 5,03 5,04 5,05 5,06 5,07 5,08 5,09 5,10 Viittausvirhe: Virheellinen <ref>-elementti; viitettä mellin155 ei löytynyt
  6. 6,0 6,1 6,2 Viittausvirhe: Virheellinen <ref>-elementti; viitettä emet17 ei löytynyt
  7. 7,0 7,1 7,2 7,3 7,4 7,5 Viittausvirhe: Virheellinen <ref>-elementti; viitettä hr ei löytynyt
  8. Viittausvirhe: Virheellinen <ref>-elementti; viitettä mellin204 ei löytynyt
  9. Viittausvirhe: Virheellinen <ref>-elementti; viitettä emet41 ei löytynyt
  10. 10,0 10,1 Viittausvirhe: Virheellinen <ref>-elementti; viitettä ArithmeticMean ei löytynyt