korrelaatio

Mikä on korrelaatio:

Korrelaatio tarkoittaa kahden asian, ihmisten tai ideoiden samankaltaisuutta tai suhdetta . Se on samankaltaisuus tai vastaavuus, joka esiintyy kahden eri hypoteesin, tilan tai objektin välillä.

Tilastojen ja matematiikan alalla korrelaatio viittaa toimenpiteeseen kahden tai useamman siihen liittyvän muuttujan välillä.

Termi korrelaatio on naisellinen substantiivi, joka on peräisin latinalaisesta korrelaatiosta.

Sana korrelaatio voidaan korvata synonyymeillä, kuten: suhde, yhtälö, nexus, kirjeenvaihto, analogia ja yhteys.

Korrelaatiokerroin

Tilastoissa Pearsonin korrelaatiokerroin (r), jota kutsutaan myös tuotemomenttikorrelaatiokertoimeksi, mittaa kahden muuttujan välistä suhdetta samassa metrisessä mittakaavassa.

Korrelaatiokertoimen tehtävänä on määrittää tunnettujen tietoryhmien välisen suhteen intensiteetti.

Korrelaatiokertoimen arvo voi vaihdella välillä -1 ja 1, ja saatu tulos määrittää, onko korrelaatio negatiivinen tai positiivinen.

Kertoimen tulkitsemiseksi on tiedettävä, että 1 tarkoittaa, että muuttujien välinen korrelaatio on täydellinen positiivinen ja -1 tarkoittaa, että se on täydellinen negatiivinen . Jos kerroin on 0, se tarkoittaa, että muuttujat eivät ole riippuvaisia ​​toisistaan.

Tilastoissa on myös Spearmanin korrelaatiokerroin, jolla on tämä nimi tilastollisen Charles Spearmanin kunniaksi. Tämän kertoimen tehtävänä on mitata kahden muuttujan välisen suhteen intensiteetti riippumatta siitä, ovatko ne lineaarisia vai eivät.

Spearman-korrelaation avulla voidaan arvioida, voidaanko kahden analysoidun muuttujan välisen suhteen voimakkuus mitata yksitoikkoisella funktiolla (matemaattinen funktio, joka säilyttää tai kääntää alkuperäisen järjestyssuhteen).

Pearson-korrelaatiokertoimen laskeminen

Menetelmä 1) Pearson-korrelaatiokertoimen laskeminen käyttäen kovarianssia ja standardipoikkeamaa.

jossa

S XY on kovarianssi;

S x ja S y edustavat muuttujien x ja y standardipoikkeamaa.

Tässä tapauksessa laskennassa on ensin löydettävä muuttujien välisen kovarianssin ja kunkin standardin keskihajonnan. Tämän jälkeen kovarianssi jaetaan standardipoikkeamien kertomalla.

Usein lauseke sisältää jo joko muuttujien standardipoikkeamat tai niiden välisen kovarianssin vain soveltamalla kaavaa.

Menetelmä 2) Pearson-korrelaatiokertoimen laskeminen raakatiedoilla (ilman kovarianssia tai standardipoikkeamaa).

Tällä menetelmällä suorin kaava on seuraava:

Esimerkiksi olettaen, että meillä on tietoja, joissa on n = 6 havaintoa kahdesta muuttujasta: glukoositaso (y) ja ikä (x), laskenta seuraa seuraavia vaiheita:

Vaihe 1) Rakenna taulukko olemassa oleviin tietoihin: i, x, y ja lisää tyhjiä sarakkeita xy: lle, x²: lle ja y²: lle:

Vaihe 2: Kerro x ja y täyttääkseen "xy" -sarakkeen. Esimerkiksi rivillä 1 on: x1y1 = 43 × 99 = 4257.

Vaihe 3: Nosta sarakkeen x arvot ja tallenna tulokset sarakkeeseen x². Esimerkiksi ensimmäisellä rivillä on x 1 2 = 43 × 43 = 1849.

Vaihe 4: Tee sama kuin vaiheessa 3, nyt käytä y-saraketta ja tallenna arvojen neliö y²-sarakkeeseen. Esimerkiksi ensimmäisellä rivillä on: y 1 2 = 99 × 99 = 9801.

Vaihe 5: Hanki kaikkien sarakkeiden numeroiden summa ja sijoita tulos sarake-alatunnisteeseen. Esimerkiksi ikä X-sarakkeen summa on 43 + 21 + 25 + 42 + 57 + 59 = 247.

Vaihe 6: Käytä edellä olevaa kaavaa korrelaatiokertoimen saamiseksi:

Näin ollen meillä on:

Spearmanin korrelaatiokerroin

Spearmanin korrelaatiokertoimen laskenta on hieman erilainen. Tätä varten meidän on järjestettävä tiedot seuraavassa taulukossa:

1. Otettuaan käyttöön kaksi paria dataa, meidän on esitettävä ne taulukossa. Esimerkiksi:

2. Sarakkeessa "Ranking A" luokitellaan "Päivä A": ssa olevat havainnot kasvavalla tavalla, jolloin "1" on sarakkeen alin arvo, en (havaintojen kokonaismäärä), korkein arvo sarakkeessa "Päivä A" ". Esimerkissämme se on:

3. Teemme samoin saadaksesi sarakkeen "Ranking B", nyt käyttämällä sarakkeen "Data B" havaintoja:

4. Sarakkeessa "d" asetamme kahden sijoituksen (A - B) välisen eron. Tässä signaalissa ei ole merkitystä.

5. Nosta jokainen arvo sarakkeessa "d" ja tallenna sarakkeeseen d²:

6. Lisää kaikki sarakkeen "d²" tiedot. Tämä arvo on Σd². Esimerkissä Σd² = 0 + 1 + 0 + 1 = 2

7. Käytämme nyt Spearmanin kaavaa:

Meidän tapauksessamme n on 4, kun tarkastelemme datarivien lukumäärää (joka vastaa havaintojen määrää).

8. Lopuksi vaihdamme edellisen kaavan tiedot:

Lineaarinen regressio

Lineaarinen regressio on kaava, jota käytetään arvioimaan muuttujan (y) mahdollinen arvo, kun muiden muuttujien (x) arvot ovat tunnettuja. "X" -arvo on riippumaton tai selittävä muuttuja ja "y" on riippuva muuttuja tai vaste.

Lineaarista regressiota käytetään tarkistamaan, kuinka "y": n arvo voi vaihdella muuttujan "x" funktiona. Linjaa, joka sisältää varianssin tarkistuksen arvot, kutsutaan lineaariseksi regressiolinjaksi.

Jos selittävällä muuttujalla "x" on yksi arvo, regressiota kutsutaan yksinkertaiseksi lineaariseksi regressioksi .