Pääkomponenttianalyysi

testwikistä
Versio hetkellä 17. joulukuuta 2024 kello 19.16 – tehnyt 37.33.252.237 (keskustelu)
(ero) ← Vanhempi versio | Nykyinen versio (ero) | Uudempi versio → (ero)
Siirry navigaatioon Siirry hakuun

Malline:Lähteetön Pääkomponenttianalyysi (Malline:K-en) on dimension redusointitekniikka. Pääkomponenttianalyysin tavoitteena on löytää monidimensioisesta datasta ne komponentit, joiden avulla sen keskeisimmät piirteet voidaan esittää ilman, että merkittävää informaatiota menee hukkaan.

Pääkomponenttianalyysi on eräs keskeisimpiä menetelmiä hahmontunnistuksessa ja signaalinkäsittelyssä. Samankaltaisia menetelmiä ovat esimerkiksi faktorianalyysi, Karhunen–Loève-muunnos, Hotelling-muunnos ja singulaariarvohajotelma (SVD).

Määritelmä

Pääkomponenttianalyysi pyrkii löytämään datasta keskeisimmät komponentit, eli löytämään ne avaruuden pinnat, joille projisoituna data tuottaa suurimman varianssin ja joiden avulla ilmaistuna datasta menee mahdollisimman vähän informaatiota hukkaan.

Voidaan osoittaa, että varianssin maksimoi datan kovarianssimatriisin suurinta ominaisarvoa vastaava ominaisvektori.

maxD2(βTX)=β1TΣβ1T=λ1
y1=β1TX
  • y1 on datamatriisi X:n suurin pääkomponentti

Pääkomponenttianalyysi asettaa siis datamatriisin komponentit suuruusjärjestykseen ominaisarvojen mukaan. Pääkomponenttianalyysin suorittamisen jälkeen tulee vielä suorittaa valinta siitä, että mitkä komponentit voidaan hylätä vähämerkityksisinä, sillä menetelmä ei automaattisesti hylkää mitään komponentteja, vaan ainoastaan asettaa löytämänsä komponentit suuruusjärjestykseen.

Malline:Tynkä/Matematiikka