R na kvadrat (R ^ 2) - Definicija, formula, izračunajte R na kvadrat

Što je R na kvadrat (R2) u regresiji?

R-kvadrat (R 2 ) važna je statistička mjera koja je regresijski model koji predstavlja udio razlike ili varijance u statističkim izrazima za ovisnu varijablu koja se može objasniti neovisnom varijablom ili varijablama. Ukratko, određuje koliko će podaci odgovarati modelu regresije.

R Formula u kvadratu

Za izračun R na kvadrat morate odrediti koeficijent korelacije, a zatim rezultat trebate kvadratiti.

R Formula u kvadratu = r 2

Gdje se r koeficijent korelacije može izračunati prema dolje:

r = n (∑xy) - ∑x ∑y / √ (n * (∑x 2 - (∑x) 2 )) * (n * (∑y 2 - (∑y) 2 ))

Gdje,

  • r = Koeficijent korelacije
  • n = broj u danom skupu podataka
  • x = prva varijabla u kontekstu
  • y = druga varijabla

Obrazloženje

Ako postoji bilo kakva veza ili korelacija koja može biti linearna ili nelinearna između te dvije varijable, tada će naznačiti postoji li promjena u neovisnoj varijabli u vrijednosti, tada će druga ovisna varijabla vjerojatno promijeniti vrijednost, recimo linearno ili nelinearno.

Numerički dio formule provodi test kreću li se zajedno i uklanja njihova pojedinačna kretanja i relativnu snagu obojice koji se kreću zajedno, a nazivnički dio formule skalira brojilac uzimajući kvadratni korijen iz umnoška razlika varijable iz njihovih kvadratnih varijabli. A kad na kvadrat dobijete ovaj rezultat, dobit ćemo na kvadrat R, što nije ništa drugo do koeficijent odlučnosti.

Primjeri

Primjer # 1

Uzmite u obzir sljedeće dvije varijable x i y, trebate izračunati R kvadrat u regresiji.

Riješenje:

Pomoću gore spomenute formule prvo moramo izračunati koeficijent korelacije.

Sve vrijednosti imamo u gornjoj tablici s n = 4.

Unesite sada vrijednosti u formulu da bismo došli do slike.

r = (4 * 26.046,25) - (265,18 * 326,89) / √ ((4 * 21,274.94) - (326,89) 2 ) * ((4 * 31.901,89) - (326,89) 2 )

r = 17.501,06 / 17.512,88

Koeficijent korelacije bit će

r = 0,99932480

Dakle, izračun će biti sljedeći,

r 2 = (0,99932480) 2

R Formula na kvadrat u regresiji

r 2 = 0,998650052

Primjer # 2

Indija, zemlja u razvoju, želi provesti neovisnu analizu jesu li promjene cijena sirove nafte utjecale na njezinu vrijednost rupije. Slijedi povijest cijene sirove nafte Brent i procjene rupije u odnosu na dolare koji su u prosjeku prevladavali tih godina po niže.

RBI, središnja banka Indije, obratila vam se kako biste na sljedećem sastanku održali prezentaciju o istoj. Utvrdite utječe li kretanje sirove nafte na kretanje rupija po dolaru?

Riješenje:

Koristeći gornju formulu za korelaciju, možemo prvo izračunati koeficijent korelacije. Tretiranje prosječne cijene sirove nafte kao jedne varijable, recimo x, i tretiranje rupije po dolaru kao druge varijable kao y.

Imamo sve vrijednosti u gornjoj tablici s n = 6.

Unesite sada vrijednosti u formulu da bismo došli do slike.

r = (6 * 23592,83) - (356,70 * 398,59) / √ ((6 * 22829,36) - (356,70) 2 ) * ((6 * 26529,38) - (398,59) 2 )

r = -620,06 / 1.715,95

Koeficijent korelacije bit će

r = -0,3614

Dakle, izračun će biti sljedeći,

r 2 = (-0,3614) 2

R Formula na kvadrat u regresiji

r 2 = 0,1306

Analiza: Čini se da postoji manja povezanost između promjena cijena sirove nafte i promjena cijene indijske rupije. Kako cijene sirove nafte rastu, promjene na indijskoj rupiji također utječu. No, budući da je R na kvadrat samo 13%, tada promjene cijene sirove nafte vrlo malo objašnjavaju promjene u indijskoj rupiji, a indijska rupija je podložna promjenama i u drugim varijablama, što treba uzeti u obzir.

Primjer # 3

Laboratorij XYZ provodi istraživanje visine i težine i zanima ga postoji li bilo kakva veza između ovih varijabli. Nakon prikupljanja uzorka od 5000 ljudi za svaku kategoriju i pronalaska prosječne težine i prosječne visine u toj određenoj skupini.

Ispod su detalji koje su prikupili.

Trebate izračunati R Squared i zaključiti ako ovaj model objašnjava varijance u visini utječe na varijacije u težini.

Riješenje:

Koristeći gornju formulu za korelaciju, možemo prvo izračunati koeficijent korelacije. Tretiranje visine kao jedne varijable, recimo x, a težine kao druge varijable kao y.

Imamo sve vrijednosti u gornjoj tablici s n = 6.

Unesite sada vrijednosti u formulu da bismo došli do slike.

r = (7 * 74.058,67) - (1031 * 496,44) / √ ((7 * 153595 - (1031) 2 ) * ((7 * 35793,59) - (496,44) 2 )

r = 6.581,05 / 7.075,77

Koeficijent korelacije bit će

Koeficijent korelacije (r) = 0,9301

Dakle, izračun će biti sljedeći,

r 2 = 0,8651

Analiza: Korelacija je pozitivna i čini se da postoji određena veza između visine i težine. Kako se visina povećava, čini se da se povećava i težina osobe. Iako R2 sugerira da se 86% promjena u visini pripisuje promjenama u težini, a 14% je neobjašnjivo.

Relevantnost i namjene

Relevantnost R kvadrata u regresiji je njegova sposobnost pronalaženja vjerojatnosti budućih događaja koji se mogu dogoditi unutar zadanih predviđenih rezultata ili ishoda. Ako se modelu doda više uzoraka, tada će koeficijent pokazati vjerojatnost ili vjerojatnost pada nove točke ili novog skupa podataka na liniju. Čak i ako obje varijable imaju jaku vezu, utvrđivanje ne dokazuje uzročnost.

Neki od prostora u kojima se R kvadrat najčešće koristi su za praćenje performansi uzajamnih fondova, za praćenje rizika u hedge fondovima, kako bi se utvrdilo koliko se dionice kreću s tržištem, gdje R2 sugerira koliko se kretanja dionica mogu objasniti kretanjima na tržištu.

Zanimljivi članci...