Linearna regresija (definicija, primjeri) - Kako protumačiti?

Što je linearna regresija?

Linearna regresija u osnovi je tehnika statističkog modeliranja koja se koristi za prikaz odnosa između jedne ovisne varijable i jedne ili više neovisnih varijabli. To je jedna od najčešćih vrsta prediktivne analize. Ova vrsta raspodjele formira se u liniji, pa se to naziva linearnom regresijom. U ovom ćemo članku uzeti primjere Linearne regresijske analize u Excelu.

Da bismo prvo napravili linearnu regresijsku analizu, moramo dodati excel dodatke slijedeći korake.

Kliknite Datoteka - Mogućnosti (ovo će otvoriti Skočni izbornik programa Excel).

Kliknite Add-ins - Odaberite Excel Add-ins iz Manage Drop Down u Excelu, a zatim kliknite Go.

Ovo će otvoriti skočni prozor dodataka. Odaberite Analysis ToolPak, a zatim kliknite U redu.

Dodatak za analizu podataka pojavit će se na kartici Umetanje.

Razumijemo na sljedećim primjerima Primjeri linearne regresijske analize u Excelu.

Primjeri linearne regresijske analize

Primjer # 1

Pretpostavimo da imamo mjesečnu prodaju i trošimo na marketing za prošlu godinu, a sada moramo predvidjeti buduću prodaju na osnovu prošlogodišnje potrošnje i marketinga.

Mjesec Oglašavanje Prodajni
Siječnja 40937 502729
Veljače 42376 507553
Ožujka 43355 516885
Travanj 44126 528347
svibanj 45060 537298
Lipnja 49546 544066
Srpnja 56105 553664
Kolovoza 59322 563201
Rujna 59877 568657
Listopad 60481 569384
Stu 62356 573764
Prosinca 63246 582746

Kliknite karticu Analiza podataka na kartici Podaci i to će otvoriti skočni prozor za analizu podataka.

Sada s popisa odaberite Regresija i kliknite U redu.

Otvorit će se skočni prozor za regresiju.

Odaberite Raspon prodaje $ C $ 1: $ C $ 13 u okviru Y osi, jer je ovo ovisna varijabla, a $ B $ 1: $ B $ 14 u osi X, jer je potrošeno oglašavanje neovisna varijabla.

Označite okvir na naljepnicama ako ste u podacima odabrali zaglavlja, to će vam dati pogrešku.

Odaberite Raspon izlaza ako želite dobiti vrijednost za određeni raspon na radnom listu, inače odaberite Novi sloj radnog lista: i to će dodati novi radni list i dati vam rezultat.

Zatim označite okvir Rezidual i kliknite U redu.

Ovo će dodati radne listove i dati vam sljedeći rezultat.

Razumijemo rezultate.

Sažetak rezultata

Višestruko R: Ovo predstavlja koeficijent korelacije. Vrijednost 1 pokazuje pozitivan odnos, a vrijednost 0 ne pokazuje nikakav odnos.

R kvadrat: R kvadrat predstavlja koeficijent odlučnosti. To vam govori o postotku bodova koji pada na liniji regresije. 0,49 znači da 49% vrijednosti odgovara modelu

Prilagođeni R kvadrat : Ovo je prilagođeni R kvadrat, koji zahtijeva kada imate više od jedne X varijable.

Standardna pogreška: Ovo predstavlja procjenu standardnog odstupanja pogreške. To je preciznost mjerenja koeficijenta regresije.

Opažanja: Ovo je broj opažanja koja ste uzeli u uzorku.

ANOVA - Df: Stupnjevi slobode

SS: Zbroj kvadrata.

MS: imamo dvije MS

  • Regresija MS je Regresija SS / Regresija Df.
  • Rezidualna MS je srednja kvadratna pogreška (Residual SS / Residual Df).

F: F test za nultu hipotezu.

Značaj F: P-vrijednosti povezane sa značajnošću

Koeficijent: Koeficijent vam daje procjenu najmanjih kvadrata.

T statistika: T statistika za nultu hipotezu naspram alternativne hipoteze.

P-vrijednost: Ovo je p-vrijednost za test hipoteze.

Donja 95% i gornja 95%: To su donja i gornja granica intervala pouzdanosti

Rezidualni izlaz: Na temelju podataka imamo 12 opažanja. 2 nd stupac predstavlja predvidio prodaje i 3 rd ostataka stupaca. Ostaci su u osnovi razlika u predviđenoj prodaji od stvarne.

Primjer # 2

Odaberite stupac predviđene prodaje i marketinga

Idite na grupu grafikona ispod kartice za umetanje. Odaberite ikonu dijagrama raspršenja

Ovo će umetnuti dijagram raspršenja u Excel. Pogledajte sliku dolje

Desnom tipkom miša kliknite bilo koju točku, a zatim odaberite Dodaj liniju trenda u Excelu. To će vašem grafikonu dodati liniju trenda.

  • Možete oblikovati liniju trenda pritiskom desne tipke miša bilo gdje na liniji trenda, a zatim odaberite oblikovanje linije trenda.
  • Možete napraviti još poboljšanja na grafikonu. tj. oblikovanje linije trenda, boje i promjene naslova, itd
  • Formulu možete prikazati i na grafikonu tako što ćete provjeriti formulu Prikaz na grafikonu i prikazati R kvadratnu vrijednost na grafikonu.

Još nekoliko primjera analize linearne regresije:

  1. Predviđanje prodanih kišobrana na temelju kiše dogodilo se u području.
  2. Predviđanje prodane izmjenične vrijednosti na temelju temperature u ljeto.
  3. Tijekom ispitne sezone prodaja Stacionarnih proizvoda, prodaja vodiča za ispite porasla je.
  4. Predviđanje prodaje kada je Oglašavanje izvedeno na temelju serije High TRP u kojoj se oglašava, Popularnost marke ambasador i Footfalls na mjestu održavanja oglašavanja.
  5. Prodaja kuće na temelju mjesta, područja i cijene.

Primjer # 3

Pretpostavimo da imamo devet učenika s njihovim nivoom inteligencije i brojem bodova koje su postigli na testu.

Student Rezultat testa IQ
Radna memorija 100 145
Shyam 97 140
Kul 93 130
Kappu 91 125
Raju 89 115
Vishal 86 110
Vivek 82 100
Vinay 78 95
Kumar 75 90

Korak 1: Prvo saznajte ovisne i neovisne varijable. Ovdje je test ocjena ovisna varijabla, a IQ je neovisna varijabla jer se test rezultat mijenja kako se IQ mijenja.

Korak 2: Idite na karticu Podaci - kliknite Analiza podataka - Odaberite regresiju - kliknite U redu.

Ovo će otvoriti prozor Regresija za vas.

Korak 3. Raspon rezultata ispitivanja ulaza u polju za unos Y raspona i IQ u polju za unos X raspona. (Provjerite naljepnice ako imate zaglavlja u vašem rasponu podataka. Odaberite izlazne mogućnosti, a zatim provjerite željene rezidualne stavke. Kliknite U redu.

Dobit ćete sažeti izlaz prikazan na slici ispod.

Korak 4: Analiza regresije prema sažetom izlazu

Sažetak rezultata

Višestruko R: Ovdje je koeficijent korelacije 0,99, što je vrlo blizu 1, što znači da je Linearni odnos vrlo pozitivan.

R Square: R Square vrijednost je 0,983, što znači da 98,3% vrijednosti odgovara modelu.

P-vrijednost: Ovdje je P-vrijednost 1,86881E-07, što je vrlo manje od .1, što znači da IQ ima značajne prediktivne vrijednosti.

Pogledajte donji grafikon.

Možete vidjeti da gotovo sve točke padaju u liniju ili u obližnju liniju trenda.

Primjer # 4

Moramo predvidjeti prodaju izmjenične struje na temelju prodaje i temperature za drugi mjesec.

Mjesec Temp Prodajni
Siječnja 25 38893
Veljače 28 42254
Ožujka 31 42845
Travanj 33 47917
svibanj 37 51243
Lipnja 40 69588
Srpnja 38 56570
Kolovoza 37 50000

Slijedite korake u nastavku da biste dobili rezultat regresije.

Korak 1: Prvo saznajte ovisne i neovisne varijable. Ovdje je prodaja ovisna varijabla, a temperatura neovisna varijabla jer prodaja varira kako se temperatura mijenja.

Korak 2: Idite na karticu Podaci - kliknite Analiza podataka - Odaberite regresiju - kliknite U redu.

Ovo će otvoriti prozor Regresija za vas.

Korak 3. Unesite prodaju u okvir za unos Y Range i Temp u okvir za unos X Range. (Provjerite naljepnice ako imate zaglavlja u vašem rasponu podataka. Odaberite izlazne mogućnosti, a zatim provjerite željene rezidualne stavke. Kliknite U redu.

To će vam dati sažeti rezultat kao u nastavku.

Korak 4: Analizirajte rezultat.

Višestruko R: Ovdje je koeficijent korelacije 0,877, što je blizu 1, što znači da je Linearni odnos pozitivan.

R Square: R Square vrijednost je 0,770, što znači da 77% vrijednosti odgovara modelu

P-vrijednost: Ovdje je P-vrijednost 1,86881E-07, što je vrlo manje od .1, što znači da IQ ima značajne prediktivne vrijednosti.

Primjer # 5

Sada napravimo Regresijsku analizu za više neovisnih varijabli:

Morate predvidjeti prodaju mobitela koji će se predstaviti sljedeće godine. Imate cijenu i stanovništvo zemalja koje utječu na prodaju mobilnih telefona.

Mobilna verzija Prodajni Količina Stanovništvo
NAS 63860 858 823
UK 61841 877 660
KZ 60876 873 631
CH 58188 726 842
HN 52728 864 573
AU 52388 680 809
NZ 51075 728 661
RU 49019 689 778

Slijedite korake u nastavku da biste dobili rezultat regresije.

Korak 1. Prvo saznajte ovisne i neovisne varijable. Ovdje prodaja ovisi o varijabli, količini i populaciji. Obje su neovisne varijable jer prodaja ovisi o količini i broju stanovnika u zemlji.

Korak 2. Idite na karticu Podaci - kliknite Analiza podataka - Odaberite regresiju - kliknite U redu.

Ovo će otvoriti prozor Regresija za vas.

Korak 3. Unesite prodaju u okvir za unos Y Range i odaberite količinu i populaciju u polju za unos X Range. (Provjerite naljepnice ako imate zaglavlja u vašem rasponu podataka. Odaberite izlazne mogućnosti, a zatim provjerite željene rezidualne stavke. Kliknite U redu.

Sada pokrenite regresiju koristeći analizu podataka na kartici Podaci. To će vam dati sljedeći rezultat.

Sažetak rezultata

Višestruko R: Ovdje je koeficijent korelacije 0,93, što je vrlo blizu 1, što znači da je Linearni odnos vrlo pozitivan.

R kvadrat: Vrijednost R kvadrata je 0,866, što znači da 86,7% vrijednosti odgovara modelu.

Značaj F: Značaj F manji je od .1, što znači da regresijska jednadžba ima značajnu prediktivnu vrijednost.

P-vrijednost : Ako pogledate P-vrijednost za količinu i stanovništvo, možete vidjeti da su vrijednosti manje od .1, što znači da količina i populacija imaju značajnu prediktivnu vrijednost. Manje vrijednosti P znači da varijabla ima značajnije prediktivne vrijednosti.

Međutim, i količina i populacija imaju značajnu prediktivnu vrijednost, ali ako pogledate P-vrijednost za količinu i populaciju, tada možete vidjeti da ta količina ima manju P-vrijednost u excelu od populacije. To znači da količina ima značajniju prediktivnu vrijednost od stanovništva.

Stvari koje treba zapamtiti

  • Uvijek provjerite ovisne i neovisne varijable kad god odabirete bilo koji podatak.
  • Linearna regresijska analiza uzima u obzir odnos između sredine varijabli.
  • Ovaj jedini model odnosa između varijabli koje su linearne
  • Ponekad nije najbolje odgovara stvarnom problemu. Na primjer: (Dob i nadnice). Većinu vremena plaće se povećavaju kako se dob povećava. Međutim, nakon umirovljenja dob se povećava, ali plaće se smanjuju.

Zanimljivi članci...