Regresija (značenje, vrste) - Što je regresijska analiza?

Što je regresija?

Regresijska analiza je mjerenje temeljeno na statistikama koje se koristi u financijama, ulaganju itd., A čiji je cilj uspostaviti odnos između ovisne varijable i ostalih nizova neovisnih varijabli, a glavni fokus je određivanje snage gornjeg odnosa.

Objašnjenja

  • Da bismo objasnili regresijsku analizu u laičkom terminu, pretpostavimo da šef prodaje tvrtke nastoji predvidjeti prodaju za sljedeći mjesec. Uključeni su brojni čimbenici koji pokreću prodaju proizvoda, počevši od vremenskih prilika do nove strategije, festivala i promjene u načinu života potrošača.
  • Ovo je metoda usklađivanja nekoliko faktora koji utječu na prodaju, a koji imaju najveći utjecaj. Može vam pomoći u odgovoru na mnoga pitanja poput što su najvažniji čimbenici, koji su manje važni, kakav je odnos između tih čimbenika i što je najvažnije, koja je sigurnost tih čimbenika.
  • Ti se čimbenici nazivaju varijablama. Glavni čimbenik koji pokušavamo prognozirati naziva se ovisna varijabla, a ostali čimbenici koji utječu na ovisnu varijablu nazivaju se neovisne varijable.

Formula

Jednostavna linearna regresijska analiza u Excelu može se izraziti kao donja formula, a ona mjeri odnos između ovisne varijable i jedne neovisne varijable.

Y = a + bX + ϵ

Ovdje:

  • Y - Ovisna varijabla
  • X - Neovisna (objašnjenja) varijabla
  • a - Presretanje
  • b - Nagib
  • ϵ - ostatak (pogreška)

Kako protumačiti regresijsku analizu?

To se može protumačiti pretpostavljajući jednostavan scenarij. Ovdje uzimamo odnos između cijena antikne kolekcije na aukciji i trajanja njezine starosti. Što više starina stari, to više dobiva cijenu. Pod pretpostavkom da smo postavili podatke za posljednjih 50 predmeta koji su bili na dražbi, možemo predvidjeti koje će biti buduće dražbene cijene na temelju starosti predmeta. Koristeći ove podatke možemo izgraditi regresijsku jednadžbu.

Formula regresije koja može uspostaviti vezu između dobi i cijene je sljedeća:

y = β0 + β1 x + pogreška
  • Ovdje je ovisni faktor Y. Y predstavlja cijenu svakog predmeta koji se prodaje na dražbi, dok je neovisni faktor X, koji određuje dob.
  • Parametri β0 i β1 su parametri koji nisu poznati i procijenit će se jednadžbom.
  • β0 je konstanta koja se koristi za definiranje linearne linije trenda koja presijeca Y-os.
  • β1 je konstanta koja pokazuje veličinu promjene vrijednosti ovisne varijable kao povezanu funkciju promjene koja se podrazumijeva na neovisne varijable.
  • To se u osnovi naziva nagib jednadžbe. Kada je nagib podloga, to znači da postoji proporcionalni odnos između starosti i cijene, a tamo gdje je nagib obrnut, znači da je odnos neizravno proporcionalan.
  • Greška se može definirati kao šum ili varijacije u ciljnoj varijabli i slučajnih u prirodi.

Primjeri regresijske analize u stvarnom životu

Pretpostavimo da trebamo uspostaviti odnos između prodaje koja se dogodila i iznosa utrošenog na oglašavanje u vezi s proizvodom.

Općenito možemo uočiti pozitivnu povezanost između prodane količine i količine potrošene na oglašavanje. Povezujući jednostavnu linearnu regresijsku jednadžbu, dobili smo:

Y = a + bX

Pretpostavimo da dobijemo vrijednost kao

Y = 500 + 30X

Tumačenje rezultata:

Predviđeni nagib od 30 pomaže nam izvući zaključak da prosječna prodaja raste 30 USD godišnje kako se povećava potrošnja na oglašavanje.

Vrste regresijske analize

# 1 - Linearno

To se može izraziti kao donja formula i mjeri odnos između ovisne varijable i jedne neovisne varijable.

# 2 - Polinom

U ovoj se metodi analiza koristi za mjerenje odnosa između pojedinačno ovisnih čimbenika i više neovisnih varijabli.

# 3 - Logistička

Ovdje je ovisni faktor ili varijabla binarne prirode. Nezavisne varijable mogu biti kontinuirane ili binarne. U multinomnoj logističkoj regresiji možemo si priuštiti više od dvije kategorije dok odabiremo našu neovisnu varijablu.

# 4 - Kvantil

Ovo je aditivni koncept linearne regresije i primarno se koristi kada su u podacima prisutni odstupanja i iskrivljenost.

# 5 - Elastična mreža

Ovo je korisno kada se radi s vrlo visokim koreliranim neovisnim varijablama.

# 6 - Regresija glavnih komponenata (PCR)

Ovo je tehnika koja je primjenjiva kada u podacima postoji previše neovisnih varijabli ili ako postoji multikolinearnost

# 7 - Djelomični najmanje kvadrati (PLS)

To je suprotna metoda glavne komponente gdje imamo neovisne varijable u visokoj korelaciji. Primjenjiv je i kada postoji mnogo neovisnih varijabli.

# 8 - Vektor podrške

To može pružiti rješenje za linearne i nelinearne modele. Koristi nelinearne funkcije jezgre za pronalaženje optimalnog rješenja za nelinearne modele.

# 9 - Redni

Primjenjiv je na predviđanje rangiranih vrijednosti. U osnovi je prikladno kada je zavisna varijabla redne naravi

# 10 - Poisson

To je primjenjivo kada ovisna varijabla ima podatke o broju.

# 11 - Negativni binom

Također je primjenjivo za upravljanje podacima o brojanju samo da negativna binomna regresija ne pretpostavlja raspodjelu broja koji ima varijancu jednaku njegovoj srednjoj vrijednosti, dok Poissonova regresija pretpostavlja varijansu jednaku njegovoj srednjoj vrijednosti.

# 12 - Kvazi Poisson

Zamjena je za negativnu binomnu regresiju. Primjenjiv je i na raspršene podatke o brojanju. Varijansa kvazi-Poissonovog modela linearna je funkcija srednje vrijednosti, dok je varijansa negativnog binomnog modela kvadratna funkcija srednje vrijednosti.

# 13 - Cox

Više se koristi za analizu podataka o vremenu do događaja.

Razlika između regresije i korelacije

  • Regresija uspostavlja odnos između neovisne varijance i ovisne varijable gdje su obje varijable različite, dok korelacija određuje povezanost ili ovisnost dviju varijabli tamo gdje nema razlike između obje varijable.
  • Glavni cilj regresije je stvoriti liniju koja najbolje odgovara i procjena jedne varijable vrši se na temelju drugih, dok u korelaciji pokazuje linearni odnos između dvije varijable.
  • U tome procjenjujemo veličinu određene promjene prepoznate varijable (X) na procijenjenoj varijabli (Y), dok se, u korelaciji, koeficijent koristi za mjerenje u kojoj se mjeri dvije varijable kreću zajedno.
  • To je postupak procjene veličine slučajnih neovisnih varijabli na temelju veličine statički ovisne varijable, dok nam korelacija pomaže da odredimo određenu vrijednost kako bismo izrazili međuovisnost između obje varijable.

Zaključak

  • Regresijska analiza primarno koristi podatke kako bi se uspostavila veza između dvije ili više varijabli. Ovdje se pretpostavlja da će se odnosi koji su postojali u prošlosti odražavati i u sadašnjosti ili budućnosti. Rijetki ovo smatraju vremenskim odmakom između prošlosti i sadašnjosti / budućnosti.
  • Međutim, to je široko korištena tehnika predviđanja i procjene. Iako uključuje matematiku, koja bi mnogim korisnicima mogla biti teška, tehnika se relativno lako koristi, pogotovo kad je model dostupan.

Zanimljivi članci...