Pearsonov koeficijent korelacije (formula, primjer) - Izračunajte Pearson R

Definicija Pearsonovog koeficijenta korelacije

Pearsonov koeficijent korelacije, poznat i kao Pearson R statistički test, mjeri snagu između različitih varijabli i njihovih odnosa. Kad god se provodi bilo koji statistički test između dvije varijable, tada je uvijek dobro da osoba koja radi analizu izračuna vrijednost koeficijenta korelacije kako bi znala koliko je jak odnos između dvije varijable.

Pearsonov koeficijent korelacije vraća vrijednost između -1 i 1. Interpretacija koeficijenta korelacije je kao pod:

  • Ako je koeficijent korelacije -1, to ukazuje na snažnu negativnu vezu. Podrazumijeva savršeni negativni odnos između varijabli.
  • Ako je koeficijent korelacije 0, to znači da nema povezanosti.
  • Ako je koeficijent korelacije 1, to ukazuje na snažnu pozitivnu vezu. Podrazumijeva savršen pozitivan odnos između varijabli.

Veća apsolutna vrijednost koeficijenta korelacije ukazuje na jači odnos između varijabli. Dakle, koeficijent korelacije od 0,78 ukazuje na jaču pozitivnu korelaciju u odnosu na vrijednost od recimo 0,36. Slično tome, koeficijent korelacije od -0,87 ukazuje na jaču negativnu korelaciju u odnosu na koeficijent korelacije od recimo -0,40.

Drugim riječima, ako je vrijednost u pozitivnom rasponu, to pokazuje da je odnos između varijabli pozitivno povezan i da se obje vrijednosti zajedno smanjuju ili povećavaju. S druge strane, ako je vrijednost u negativnom rasponu, to pokazuje da je odnos između varijabli u negativnoj korelaciji i da će obje vrijednosti ići u suprotnom smjeru.

Pearsonova formula koeficijenta korelacije

Pearsonova formula koeficijenta korelacije je kako slijedi,

Gdje,

  • r = Pearsonov koeficijent
  • n = broj parova dionice
  • ∑xy = zbroj proizvoda uparenih zaliha
  • ∑x = zbroj x rezultata
  • ∑y = zbroj y rezultata
  • ∑x 2 = zbroj x bodova na kvadrat
  • ∑y 2 = zbroj kvadratnih y rezultata

Obrazloženje

Korak 1: Otkrijte broj parova varijabli, koji je označen s n. Pretpostavimo da se x sastoji od 3 varijable - 6, 8, 10. Pretpostavimo da se y sastoji od odgovarajuće 3 varijable 12, 10, 20.

Korak 2: Navedite varijable u dva stupca.

Korak 3: Saznajte proizvod x i y u 3. stupcu.

Korak 4: Saznajte zbroj vrijednosti svih x varijabli i svih y varijabli. Napišite rezultate na dnu 1. st i 2 nd stupcu. U 3. stupac upišite zbroj x * y .

Korak 5: Saznajte x 2 i y 2 u 4 -og i 5 th stupce i njihova suma na dnu stupaca.

Korak 6: Umetnite gore pronađene vrijednosti u formulu i riješite je.

r = 3 * 352-24 * 42 / √ (3 * 200-24 2 ) * (3 * 644-42 2 )

= 0,7559

Primjer Pearsonovog koeficijenta korelacije R

Primjer 1

U ovom primjeru uz pomoć sljedećih detalja u tablici od 6 osoba različite dobi i različitih težina danih u nastavku za izračun vrijednosti Pearsona R

Sr br Dob (x) Težina (y)
1 40 78
2 21 70
3 25 60
4 31 55
5 38 80
6 47 66

Riješenje:

Za izračun Pearsonovog koeficijenta korelacije prvo ćemo izračunati sljedeće vrijednosti,

Ovdje je ukupan broj ljudi 6, dakle, n = 6

Sada je izračun Pearsona R sljedeći,

  • r = (n (∑xy) - (∑x) (∑y)) / (√ (n ∑x 2 - (∑x) 2 ) (n ∑y 2 - (∑y) 2 )
  • r = (6 * (13937) - (202) (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
  • r = (6 * (13937) - (202) * (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
  • r = (83622- 82618) / (√ (43680 -40804) * (170190- 167281)
  • r = 1004 / (√ (2876) * (2909)
  • r = 1004 / (√ 8366284)
  • r = 1004 / 2892,452938
  • r = 0,35

Tako je vrijednost Pearsonovog koeficijenta korelacije 0,35

Primjer # 2

Postoje dvije dionice - A i B. Njihove cijene dionica određenih dana su kako slijedi:

Dionica A (x) Stcok B (g)
45 9
50 8
53 8
58 7
60 5

Doznajte Pearsonov koeficijent korelacije iz gornjih podataka.

Riješenje:

Prvo ćemo izračunati sljedeće vrijednosti.

Izračun Pearsonovog koeficijenta je sljedeći,

  • r = (5 * 1935-266 * 37) / ((5 * 14298- (266) 2) * (5 * 283- (37) 2)) 0,5
  • = -0,9088

Stoga je Pearsonov koeficijent korelacije između dviju dionica -0,9088.

Prednosti

  • Pomaže u saznanju koliko je jak odnos između dvije varijable. Ne samo da se prisutnost ili odsutnost korelacije između dvije varijable pokazuje pomoću Pearsonovog koeficijenta korelacije, već također određuje točnu mjeru u kojoj su te varijable povezane.
  • Korištenjem ove metode može se utvrditi smjer korelacije, tj. Je li korelacija između dvije varijable negativna ili pozitivna.

Mane

  • Pearsonov koeficijent korelacije R nije dovoljan da utvrdi razliku između ovisnih varijabli i neovisnih varijabli jer je koeficijent korelacije između varijabli simetričan. Na primjer, ako osoba pokušava saznati povezanost između visokog stresa i krvnog tlaka, tada bi mogla naći visoku vrijednost korelacije koja pokazuje da visoki stres uzrokuje krvni tlak. Ako se varijabla promijeni, tada će i rezultat, u tom slučaju, biti isti, što pokazuje da stres uzrokuje krvni tlak, koji nema smisla. Dakle, istraživač bi trebao biti svjestan podataka koje koristi za provođenje analize.
  • Korištenjem ove metode ne može se dobiti informacija o nagibu crte jer se samo navodi postoji li veza između dviju varijabli ili ne.
  • Vjerojatno je da se Pearsonov koeficijent korelacije može pogrešno protumačiti, posebno u slučaju homogenih podataka.
  • U usporedbi s ostalim metodama izračunavanja, ovoj metodi treba puno vremena da dođe do rezultata.

Važne točke

  • Vrijednosti se mogu kretati od vrijednosti +1 do vrijednosti -1, gdje +1 označava savršeni pozitivni odnos između razmatranih varijabli, -1 označava savršeni negativni odnos između razmatranih varijabli, a vrijednost 0 ukazuje na to da nijedan odnos postoji između razmatranih varijabli.
  • Neovisan je o mjernoj jedinici varijabli. Primjerice, ako je mjerna jedinica jedne varijable u godinama, dok je mjerna jedinica druge varijable u kilogramima, ni tada se vrijednost ovog koeficijenta ne mijenja.
  • Koeficijent korelacije između varijabli simetričan je, što znači da će vrijednost koeficijenta korelacije između Y i X ili X i Y ostati ista.

Zaključak

Pearsonov koeficijent korelacije vrsta je koeficijenta korelacije koja predstavlja odnos između dvije varijable koje se mjere na istom intervalu ili istoj skali omjera. Mjeri snagu odnosa između dvije kontinuirane varijable.

Ne samo da navodi prisutnost ili odsutnost korelacije između dvije varijable, već također određuje točnu mjeru u kojoj su te varijable povezane. Neovisna je o mjernoj jedinici varijabli gdje se vrijednosti koeficijenta korelacije mogu kretati od vrijednosti +1 do vrijednosti -1. Međutim, nije dovoljno reći razliku između ovisnih varijabli i neovisnih varijabli.

Zanimljivi članci...