Formula za izračunavanje korelacije
Korelacija je statistička mjera između dvije varijable i definira se kao promjena količine u jednoj varijabli koja odgovara promjeni u drugoj, a izračunava se zbrajanjem zbroja zbroja prve varijable minus srednje vrijednosti prve varijable u zbroju druge varijable minus srednja vrijednost druge varijable podijeljena s cjelinom pod korijenom proizvoda kvadrata prve varijable minus srednja vrijednost prve varijable u zbroj kvadrata druge varijable minus srednja vrijednost druge varijable.
Vrijednost korelacije ograničena je između -1 i +1 i može se protumačiti na sljedeći način:
- -1: Ako je -1, tada su varijable poznate kao savršeno negativno povezane. To znači da ako se jedna varijabla kreće u jednom smjeru, onda se druga kreće u suprotnom smjeru.
- 0: To znači da varijabla nema nikakve korelacije.
- +1: Ako je +1, tada su varijable poznate kao savršeno pozitivno povezane. Obje se varijable kreću u pozitivnim smjerovima.
Ako imamo 2 varijable x i y, tada se koeficijent korelacije između 2 varijable može naći kao:
Koeficijent korelacije = ∑ (x (i) - srednja vrijednost (x)) * (y (i) -srednja (y)) / √ (∑ (x (i) -srednja (x)) 2 * ∑ (y (i) -znači (y)) 2 )
Gdje,
- x (i) = vrijednost x u uzorku
- Srednja vrijednost (x) = srednja vrijednost svih vrijednosti x
- y (i) = vrijednost y u uzorku
- Srednja vrijednost (y) = srednja vrijednost svih vrijednosti y
Primjeri
Izračun korelacije u Excelu nije lagan. Sintaksa korištene funkcije je sljedeća:
Koeficijent korelacije = CORREL (niz1, niz2)
Primjer # 1
Uzmimo isti primjer koji smo uzeli gore za izračunavanje korelacije pomoću excela.
Riješenje:
Ispod su vrijednosti x i y:

Izračun je sljedeći.

Osnova excel formule = CORREL (niz (x), niz (y))

Koeficijent = +0,95
Budući da je ovaj koeficijent blizu +1, stoga su x i y visoko pozitivno povezani.
Primjer # 2
Korelacija je uglavnom korisna za analizu cijene dionica tvrtki i stvaranje portfelja dionica na temelju toga.
Otkrijmo korelaciju Appleovih dionica s Nasdaq indeksom na temelju posljednjih jednogodišnjih performansi dionica. Apple je multinacionalna tvrtka sa sjedištem u SAD-u koja se specijalizirala za IT proizvode kao što su iPod, iPad, Mac itd.
Riješenje:
Ispod je mjesečni povrat dionica Applea i Nasdaq-a za posljednjih godinu dana:

Unesite sada vrijednosti -
Koeficijent korelacije = ∑ (x (i) - srednja vrijednost (x)). (Y (i) -srednja (y)) / √ ∑ (x (i) -srednja (x)) 2 ∑ (y (i) - znači (y)) 2

Korelacija između Apple-a i Nasdaq-a = 0,039 / (390,0039)

Koeficijent = 0,62
Budući da je korelacija između Apple-a i Nasdaq-a pozitivna, stoga je Apple pozitivno u korelaciji s Nasdaqom.
Primjer # 3
Pogledajmo sada korelaciju između Walmarta i Nasdaq indeksa na temelju posljednjih jednogodišnjih performansi dionica. Walmart je američka tvrtka sa maloprodajnim lancem supermarketa.
Riješenje:
Ispod je mjesečna izvedba između Walmarta i Nasdaq-a u posljednjih godinu dana-

Unesite sada vrijednosti u formulu -
Koeficijent korelacije = ∑ (x (i) - srednja vrijednost (x)). (Y (i) -srednja (y)) / √ ∑ (x (i) -srednja (x)) 2 ∑ (y (i) - znači (y)) 2
Stoga je izračun sljedeći,

Korelacija između Walmarta i Nasdaq-a = 0,0032 / (√0,0346 * 0,0219)

Koeficijent = 0,12
Možemo vidjeti da su Walmart i Nasdaq također pozitivno povezani, ali ne toliko u usporedbi s Appleovom korelacijom s Nasdaqom.
Relevantnost i upotreba
Koeficijent korelacije koristan je u uspostavljanju linearnog odnosa između dvije varijable. Mjeri kako će se varijabla kretati u usporedbi s kretanjem druge varijable. Praktična upotreba ovog koeficijenta je utvrditi vezu između kretanja cijena dionica i ukupnog kretanja na tržištu. Temelj ove analize, analitičar dionica, uključivat će udio dionica kako bi se stvorio optimalan portfelj s minimalnim rizikom. Također, korisno je u znanosti o podacima saznati odnos između 2 varijable.
Također, koeficijent korelacije koristi se vrlo visoko za proučavanje konstruktivne valjanosti podataka u faktorskoj analizi. Vrlo se koristi u regresijskoj analizi za predviđanje vrijednosti ovisnih varijabli na temelju odnosa između ovisnih i neovisnih varijabli. Ova je jednadžba vrlo korisna u kvantitativnoj analizi kako bi se dobila priroda odnosa između različitih varijabli. Osnova ovog odnosa, ako je varijabla nepovezana s drugim varijablama, tada se može eliminirati s popisa.