Formula korelacije - Kako izračunati? (Korak po korak)

Formula za izračunavanje korelacije

Korelacija je statistička mjera između dvije varijable i definira se kao promjena količine u jednoj varijabli koja odgovara promjeni u drugoj, a izračunava se zbrajanjem zbroja zbroja prve varijable minus srednje vrijednosti prve varijable u zbroju druge varijable minus srednja vrijednost druge varijable podijeljena s cjelinom pod korijenom proizvoda kvadrata prve varijable minus srednja vrijednost prve varijable u zbroj kvadrata druge varijable minus srednja vrijednost druge varijable.

Vrijednost korelacije ograničena je između -1 i +1 i može se protumačiti na sljedeći način:

  • -1: Ako je -1, tada su varijable poznate kao savršeno negativno povezane. To znači da ako se jedna varijabla kreće u jednom smjeru, onda se druga kreće u suprotnom smjeru.
  • 0: To znači da varijabla nema nikakve korelacije.
  • +1: Ako je +1, tada su varijable poznate kao savršeno pozitivno povezane. Obje se varijable kreću u pozitivnim smjerovima.

Ako imamo 2 varijable x i y, tada se koeficijent korelacije između 2 varijable može naći kao:

Koeficijent korelacije = ∑ (x (i) - srednja vrijednost (x)) * (y (i) -srednja (y)) / √ (∑ (x (i) -srednja (x)) 2 * ∑ (y (i) -znači (y)) 2 )

Gdje,

  • x (i) = vrijednost x u uzorku
  • Srednja vrijednost (x) = srednja vrijednost svih vrijednosti x
  • y (i) = vrijednost y u uzorku
  • Srednja vrijednost (y) = srednja vrijednost svih vrijednosti y

Primjeri

Izračun korelacije u Excelu nije lagan. Sintaksa korištene funkcije je sljedeća:

Koeficijent korelacije = CORREL (niz1, niz2)

Primjer # 1

Uzmimo isti primjer koji smo uzeli gore za izračunavanje korelacije pomoću excela.

Riješenje:

Ispod su vrijednosti x i y:

Izračun je sljedeći.

Osnova excel formule = CORREL (niz (x), niz (y))

Koeficijent = +0,95

Budući da je ovaj koeficijent blizu +1, stoga su x i y visoko pozitivno povezani.

Primjer # 2

Korelacija je uglavnom korisna za analizu cijene dionica tvrtki i stvaranje portfelja dionica na temelju toga.

Otkrijmo korelaciju Appleovih dionica s Nasdaq indeksom na temelju posljednjih jednogodišnjih performansi dionica. Apple je multinacionalna tvrtka sa sjedištem u SAD-u koja se specijalizirala za IT proizvode kao što su iPod, iPad, Mac itd.

Riješenje:

Ispod je mjesečni povrat dionica Applea i Nasdaq-a za posljednjih godinu dana:

Unesite sada vrijednosti -

Koeficijent korelacije = ∑ (x (i) - srednja vrijednost (x)). (Y (i) -srednja (y)) / √ ∑ (x (i) -srednja (x)) 2 ∑ (y (i) - znači (y)) 2

Korelacija između Apple-a i Nasdaq-a = 0,039 / (390,0039)

Koeficijent = 0,62

Budući da je korelacija između Apple-a i Nasdaq-a pozitivna, stoga je Apple pozitivno u korelaciji s Nasdaqom.

Primjer # 3

Pogledajmo sada korelaciju između Walmarta i Nasdaq indeksa na temelju posljednjih jednogodišnjih performansi dionica. Walmart je američka tvrtka sa maloprodajnim lancem supermarketa.

Riješenje:

Ispod je mjesečna izvedba između Walmarta i Nasdaq-a u posljednjih godinu dana-

Unesite sada vrijednosti u formulu -

Koeficijent korelacije = ∑ (x (i) - srednja vrijednost (x)). (Y (i) -srednja (y)) / √ ∑ (x (i) -srednja (x)) 2 ∑ (y (i) - znači (y)) 2

Stoga je izračun sljedeći,

Korelacija između Walmarta i Nasdaq-a = 0,0032 / (√0,0346 * 0,0219)

Koeficijent = 0,12

Možemo vidjeti da su Walmart i Nasdaq također pozitivno povezani, ali ne toliko u usporedbi s Appleovom korelacijom s Nasdaqom.

Relevantnost i upotreba

Koeficijent korelacije koristan je u uspostavljanju linearnog odnosa između dvije varijable. Mjeri kako će se varijabla kretati u usporedbi s kretanjem druge varijable. Praktična upotreba ovog koeficijenta je utvrditi vezu između kretanja cijena dionica i ukupnog kretanja na tržištu. Temelj ove analize, analitičar dionica, uključivat će udio dionica kako bi se stvorio optimalan portfelj s minimalnim rizikom. Također, korisno je u znanosti o podacima saznati odnos između 2 varijable.

Također, koeficijent korelacije koristi se vrlo visoko za proučavanje konstruktivne valjanosti podataka u faktorskoj analizi. Vrlo se koristi u regresijskoj analizi za predviđanje vrijednosti ovisnih varijabli na temelju odnosa između ovisnih i neovisnih varijabli. Ova je jednadžba vrlo korisna u kvantitativnoj analizi kako bi se dobila priroda odnosa između različitih varijabli. Osnova ovog odnosa, ako je varijabla nepovezana s drugim varijablama, tada se može eliminirati s popisa.

Zanimljivi članci...