Kriging-interpolointi

testwikistä
Siirry navigaatioon Siirry hakuun
Yhden muuttujan arvojen interpolointia Pistekrigingiä käyttäen. Punainen käyrä näyttää menetelmän interpoloimat arvot ja neliöt merkitsevät näytteiden arvoja. Vihreällä käyrillä on rajattu 95% luottamusväli (pystysuuntaisena) olettaen estimoinnin olevan normaalisti jakautunut. Normaalijakauman odotusarvo sijaitsee punaisella käyrällä ja jakauman varianssi on estimoinnin krigingvarianssi. Tämä on kuvaajaa varten muutettu luottamusväliksi.

Kriging-interpolointi (Malline:K-en [1]) eli Pistekriging on (Malline:K-en [2]) on tilastotieteessä ja todennäköisyyslaskennassa ja erityisesti geostatistiikassa monimuuttujainen interpolointimenetelmä, jossa kriging-estimointimenetelmällä lasketaan pisteissä xin sijaitsevien pistemäisten näytteiden fi avulla kohdassa xn sijaitsevan kohteen suureen arvo f(x). Jos näytteiden otos säilyy samana, voidaan laskea interpolointikäyrä (yksiulotteinen tapaus) tai -pinta (kaksiulotteinen tapaus) f(x) näytteiden lähiympäristössä. Kunkin arvioitavan kohdan arvo lasketaan määrittämällä ensin kaikille näytteille painokertoimet λi ja muodostamalla sitten painokertoimilla ja näytteiden arvoilla fi painotettu aritmeettinen keskiarvo

f(x)=λ1f1+λ2f2++λnfn. [3][4][1]

Pistekriging ei ole yksinkertainen menetelmä, koska painokertoimet lasketaan huomioimalla näytteiden keskinäiset riippuvuudet ja näytteiden ja kohteen väliset riippuvuudet. Riippuvuudet johtuvat estimoitavan suureen spatiaalisesta autokorrelaatiosta. Kun käytetään n näytteen otosta, joudutaan painokertoimia määritettäessä ratkaisemaan n+1 yhtälön yhtälöryhmä.[3][2][4][1]

Taustaa

Menetelmä on johdettu geostatistiikassa käytettävästä krigingistä, jolla estimoidaan suureen arvoja halutuissa kohdissa ja jossa suureen arvot muuttuvat tilassa spatiaalisesti levittäytyvän ilmiön vaikutuksesta. Geostatistiikassa ajatellaan, että tila muodostuu satunnaiskentästä Z(x), jonka todennäköisyyslaskennallisia ominaisuuksia pyritään hyödyntämään tilastollisesti.[3][5]

Geostatistiikassa käytettävä Kriging on johdettu sovelluksia silmällä pitäen. Siitä voidaan kuitenkin modifioida interpolointimenetelmä yksinkertaistamalla sen alkuoletuksia. Ensiksi, näytteet eli arvojen otos ajatellaan olevan interpoloitavan funktion arvoja yksittäisissä pisteissä. Toiseksi, interpoloinnissa lasketaan vain käyrän tai pinnan arvoja annetuissa pisteissä. Aito kriging-estimointimenetelmä yrittää estimoida alojen tai tilojen sisältämiä suureen kokonaisarvoja. Kolmanneksi, eri pisteiden välisiä riippuvuuksia ilmaistaan annetulla kovarianssifunktiolla, korrelogrammilla tai variogrammilla. Tässä laskut on esitetty kovarianssifunktiolla.[3][6][5]

Merkinnät ja tavalliset reunaehdot

Interpoloidaan funktiota, joka on määritelty avaruudessa xn, missä dimensio voi olla esimerkiksi n=2 eli taso tai n=3 eli tila. Merkitään interpoloitavaa funktiota f(x) kohdassa x, siihen tarvittavia näytteitä fi paikoissa xi ja kovarianssifunktion arvot merkitään σij=σ(hij), kun pisteiden välinen etäisyys on halutulla metriikalla hij=||xixj||, tai merkitään σi=σ(hi), kun hi=||xxi||.[4]

Interpolointimenetelmän tulee käyttäytyä näytteiden välisessä tilassa niin, että kaikki estimoidut arvot ovat odotusarvoltaan samat kuin on koko näyteavaruuden odotusarvo. Tässä esityksessä oletetaan satunnaiskentän odotusarvon E[Z(x)]=μ olevan vakio, mutta silti sen tarkka arvo olisi tuntematon. Yhtälöihin liitettävä harhattomuusehto eli normitus

Σi=1nλi=λ1+λ2++λn=1,

saadaan siitä, että virheen odotusarvo pitäisi olla nolla:

E[f(x)Z(x)]=E[f(x)]E[Z(x)]
=E[λ1f1+λ2f2++λnfn]E[Z(x)]
=(λ1E[f1]+λ2E[f2]++λnE[fn])E[Z(x)]
=(λ1μ+λ2μ++λnμ)μ]
=(λ1+λ2++λn)μμ]=0.

Kovarianssifunktio on oltava positiividefiniitti eli

σ(h)0. [7]

Se on tasan nolla, kun riippuvuus näytteiden nälillä on olematon eli ne ovat tilastollisesti riippumattomia. Tällöin etäisyys h on ylittänyt riippuvuuden etäisyyden raja-arvon. Kovarianssi tulee saada suurimman arvonsa, kun etäisyys h=0. Yleensä vaaditaan, että kovarianssi saa näyteavaruuden tilastollisen varianssin

σ(0)=σ2. [7][5]

Kovarianssi on yleensä monotonisesti laskeva käyrä.[7][5]

Arviovarianssin minimointi

Geostatistiikassa Kriging-estimointi syntyy tilanteessa, jossa on voitu arvioida eri painokertoimien valinnan aiheuttaman virheen varianssi eli arviovarianssi σE2. Optimoimalla painokertoimia, voidaan virheen varianssia pienentää. Kriging-interpoloinnissa arvo lasketaan sellaisilla painokertoimilla, joilla virheen varianssi on pienimmillään. Tätä varianssin minimiarvoa kutsutaan Krigingvarianssiksi σK2. Se on yleensä pienempi kuin näyteavaruuden tilastollinen varianssi σ2.[3][1][5]

Interpoloinnin suorittaminen

Seuraavassa selostetaan, miten kokonaisen alueen kaikki pisteet interpoloidaan, kun aina käytetään samoja näytteitä. Jos näytteet vaihdetaan välillä, tulee interpolointi aloittaa alusta uudelleen.

Interpoloinnin valmistelut

Koska laskut ovat mutkikkaat ja usein käytetään useita näytteitä, voidaan laskut suorittaa vektori- ja matriisilaskutoimituksin. Aluksi lasketaan näytteiden xi ja interpoloitavan kohteen x väliset riippuvuudet ja kootaan niistä kovarianssivektori, joka on pystyvektori[2][1]

k~(x)=[σ1σ2σn].

Kootaan painokertoimet λi samalla tavalla vektoriksi

λ~=[λ1λ2λn].

Sitten määritetään kaikkien näytteiden väliset riippuvuudet ja kootaan ne kovarianssimatriisiin[8] (neliömatriisi)[3][2]

K~=[σ11σ12σ1nσ21σ22σ2nσn1σn2σnn]=[σ2σ12σ1nσ21σ2σ2nσm1σm2σ2],

koska σii=σ2.[9]

Nyt lisätään normitusta eli harhattomuusehtoa varten matriisiin alimmaiseksi riviksi ja oikeanpuoleisemmaksi sarakkeeksi ykköset ja nolla matriisin kulmaan. Nämä ovat nyt[3][2][1][6]

K=[σ2σ12σ1n1σ21σ2σ2n1σm1σm2σ211110]jak(x)=[σ1σ2σn1].

Geostatistiikan teorian mukaan paras estimaatti saadaan sellaisilla painokertoimien λi arvoilla, jotka saadaan yhtälöryhmän eli matriisiyhtälön[3][2][1]

[σ2σ12σ1n1σ21σ2σ2n1σm1σm2σ211110][λ1λ2λnμ]=[σ1σ2σn1].

ratkaisuna. Lagrangen parametri μ tarvitaan mukana, jotta yhtälöiden rivit ja sarakkeet menisivät tasan. Matriisiyhtälö voidaan myös kirjoittaa vektorien ja matriisin nimillä

Kλ=k(x), [4]

jolloin ratkaisu saadaan kääntämällä matriisi K

λ=K1k(x). [3][4]

Matriisin kääntäminen voidaan tehdä Gaussin eliminointimenetelmällä.

Ensimmäisen pisteen interpolointi

Saatu painokerroinvektori sisältää tarvittavat painokertoimet, joilla voi laske interpolaatiolle arvon

f(x)=λ1f1+λ2f2++λnfn. [3]

Viimeinen lauseke voidaan merkitä ja laskea vektorilaskennalla, kun näytteistä muodostetaan lyhyt pystyvektori

f=[f1f2fn]

ja sitten vektorit kerrotaan keskenään

f(x)=fTλ=[f1f2fn][λ1λ2λn]

Seuraavien pisteiden interpolointi

Seuraavan pisteen x interpolointi, kun käytetään samoja näytteitä fi kuin aikaisemmin, aloitetaan päivittämällä kovarianssivektori[4]

k(x)=[σ1σ2σn1].

Koska interpoloitava piste x vaihtui, muuttuvat näytteiden xi ja pisteen x väliset riippuvuudet, joten ne lasketaan aina uudelleen. Toisaalta, koska näytteet ovat samat, ei niiden väliset riippuvuudet ole vaihtuneet ja nyt voidaan hyödyntää valmiiksi käännettyä matriisia K1 painokertoimien λ laskemisessa. Uudet painokertoimet lasketaan[4]

λ=K1k(x)

ja ne sijoitetaan lausekkeeseen

f(x)=λ1f1+λ2f2++λnfn,

joka antaa uuden interpolaation. Tätä jatketaan kunnes halutaan vaihtaa uudet näytteet, jolloin aloitetaan valmistelemalla uusi matriisi K.

Krigingvarianssi

Interpoloinnin krigingvarianssi pisteessä x lasketaan teorian mukaan

σK2(x)=σ2λTk(x), [4]

missä ratkaisun mukaan on Kλ=k(x), joten varianssi voidaan kirjoittaa

σK2(x)=σ2λTKλ

niillä painokertoimilla, joilla varianssi minimoituu.[3]

Pistekrigingin ominaisuuksia

Pistekriging on eksakti interpolaatiomenetelmä, sillä näytteiden kohdissa xi se antaa interpolaattoriksi näytteen arvon f(xi)=fi krigingvarianssilla σK2(x)=0. Menetelmä on toisaalta tasoittava interpolaatio, koska interpoloinnin tuloksien f(x) pisteessä xxi varianssit ovat näytepopulaation varianssi.[3][10]

Kun tarkastellaan Kriging-interpoloinnin tuottaman käyrän tai pinnan ominaisuuksia, periytyvät sen jatkuvuus- ja derivoituvuusominaisuudet käytettävän kovarianssifunktion vastaavista ominaisuuksista.[10]

Lähteet

Malline:Viitteet

Aiheesta muualla

  1. 1,0 1,1 1,2 1,3 1,4 1,5 1,6 Viittausvirhe: Virheellinen <ref>-elementti; viitettä gsa ei löytynyt
  2. 2,0 2,1 2,2 2,3 2,4 2,5 Viittausvirhe: Virheellinen <ref>-elementti; viitettä pk ei löytynyt
  3. 3,00 3,01 3,02 3,03 3,04 3,05 3,06 3,07 3,08 3,09 3,10 3,11 Viittausvirhe: Virheellinen <ref>-elementti; viitettä gm ei löytynyt
  4. 4,0 4,1 4,2 4,3 4,4 4,5 4,6 4,7 Viittausvirhe: Virheellinen <ref>-elementti; viitettä gb ei löytynyt
  5. 5,0 5,1 5,2 5,3 5,4 Viittausvirhe: Virheellinen <ref>-elementti; viitettä rb ei löytynyt
  6. 6,0 6,1 Viittausvirhe: Virheellinen <ref>-elementti; viitettä th14 ei löytynyt
  7. 7,0 7,1 7,2 Viittausvirhe: Virheellinen <ref>-elementti; viitettä jh10 ei löytynyt
  8. Viittausvirhe: Virheellinen <ref>-elementti; viitettä CovarianceMatrix ei löytynyt
  9. Viittausvirhe: Virheellinen <ref>-elementti; viitettä Covariance ei löytynyt
  10. 10,0 10,1 Viittausvirhe: Virheellinen <ref>-elementti; viitettä jh32 ei löytynyt