Što je linearna regresija?
Linearna regresija u osnovi je tehnika statističkog modeliranja koja se koristi za prikaz odnosa između jedne ovisne varijable i jedne ili više neovisnih varijabli. To je jedna od najčešćih vrsta prediktivne analize. Ova vrsta raspodjele formira se u liniji, pa se to naziva linearnom regresijom. U ovom ćemo članku uzeti primjere Linearne regresijske analize u Excelu.
Da bismo prvo napravili linearnu regresijsku analizu, moramo dodati excel dodatke slijedeći korake.
Kliknite Datoteka - Mogućnosti (ovo će otvoriti Skočni izbornik programa Excel).

Kliknite Add-ins - Odaberite Excel Add-ins iz Manage Drop Down u Excelu, a zatim kliknite Go.

Ovo će otvoriti skočni prozor dodataka. Odaberite Analysis ToolPak, a zatim kliknite U redu.

Dodatak za analizu podataka pojavit će se na kartici Umetanje.

Razumijemo na sljedećim primjerima Primjeri linearne regresijske analize u Excelu.
Primjeri linearne regresijske analize
Primjer # 1
Pretpostavimo da imamo mjesečnu prodaju i trošimo na marketing za prošlu godinu, a sada moramo predvidjeti buduću prodaju na osnovu prošlogodišnje potrošnje i marketinga.
Mjesec | Oglašavanje | Prodajni |
Siječnja | 40937 | 502729 |
Veljače | 42376 | 507553 |
Ožujka | 43355 | 516885 |
Travanj | 44126 | 528347 |
svibanj | 45060 | 537298 |
Lipnja | 49546 | 544066 |
Srpnja | 56105 | 553664 |
Kolovoza | 59322 | 563201 |
Rujna | 59877 | 568657 |
Listopad | 60481 | 569384 |
Stu | 62356 | 573764 |
Prosinca | 63246 | 582746 |
Kliknite karticu Analiza podataka na kartici Podaci i to će otvoriti skočni prozor za analizu podataka.

Sada s popisa odaberite Regresija i kliknite U redu.

Otvorit će se skočni prozor za regresiju.

Odaberite Raspon prodaje $ C $ 1: $ C $ 13 u okviru Y osi, jer je ovo ovisna varijabla, a $ B $ 1: $ B $ 14 u osi X, jer je potrošeno oglašavanje neovisna varijabla.

Označite okvir na naljepnicama ako ste u podacima odabrali zaglavlja, to će vam dati pogrešku.

Odaberite Raspon izlaza ako želite dobiti vrijednost za određeni raspon na radnom listu, inače odaberite Novi sloj radnog lista: i to će dodati novi radni list i dati vam rezultat.

Zatim označite okvir Rezidual i kliknite U redu.

Ovo će dodati radne listove i dati vam sljedeći rezultat.

Razumijemo rezultate.
Sažetak rezultata
Višestruko R: Ovo predstavlja koeficijent korelacije. Vrijednost 1 pokazuje pozitivan odnos, a vrijednost 0 ne pokazuje nikakav odnos.
R kvadrat: R kvadrat predstavlja koeficijent odlučnosti. To vam govori o postotku bodova koji pada na liniji regresije. 0,49 znači da 49% vrijednosti odgovara modelu
Prilagođeni R kvadrat : Ovo je prilagođeni R kvadrat, koji zahtijeva kada imate više od jedne X varijable.
Standardna pogreška: Ovo predstavlja procjenu standardnog odstupanja pogreške. To je preciznost mjerenja koeficijenta regresije.
Opažanja: Ovo je broj opažanja koja ste uzeli u uzorku.
ANOVA - Df: Stupnjevi slobode
SS: Zbroj kvadrata.
MS: imamo dvije MS
- Regresija MS je Regresija SS / Regresija Df.
- Rezidualna MS je srednja kvadratna pogreška (Residual SS / Residual Df).
F: F test za nultu hipotezu.
Značaj F: P-vrijednosti povezane sa značajnošću
Koeficijent: Koeficijent vam daje procjenu najmanjih kvadrata.
T statistika: T statistika za nultu hipotezu naspram alternativne hipoteze.
P-vrijednost: Ovo je p-vrijednost za test hipoteze.
Donja 95% i gornja 95%: To su donja i gornja granica intervala pouzdanosti
Rezidualni izlaz: Na temelju podataka imamo 12 opažanja. 2 nd stupac predstavlja predvidio prodaje i 3 rd ostataka stupaca. Ostaci su u osnovi razlika u predviđenoj prodaji od stvarne.
Primjer # 2
Odaberite stupac predviđene prodaje i marketinga

Idite na grupu grafikona ispod kartice za umetanje. Odaberite ikonu dijagrama raspršenja

Ovo će umetnuti dijagram raspršenja u Excel. Pogledajte sliku dolje

Desnom tipkom miša kliknite bilo koju točku, a zatim odaberite Dodaj liniju trenda u Excelu. To će vašem grafikonu dodati liniju trenda.


- Možete oblikovati liniju trenda pritiskom desne tipke miša bilo gdje na liniji trenda, a zatim odaberite oblikovanje linije trenda.
- Možete napraviti još poboljšanja na grafikonu. tj. oblikovanje linije trenda, boje i promjene naslova, itd
- Formulu možete prikazati i na grafikonu tako što ćete provjeriti formulu Prikaz na grafikonu i prikazati R kvadratnu vrijednost na grafikonu.
Još nekoliko primjera analize linearne regresije:
- Predviđanje prodanih kišobrana na temelju kiše dogodilo se u području.
- Predviđanje prodane izmjenične vrijednosti na temelju temperature u ljeto.
- Tijekom ispitne sezone prodaja Stacionarnih proizvoda, prodaja vodiča za ispite porasla je.
- Predviđanje prodaje kada je Oglašavanje izvedeno na temelju serije High TRP u kojoj se oglašava, Popularnost marke ambasador i Footfalls na mjestu održavanja oglašavanja.
- Prodaja kuće na temelju mjesta, područja i cijene.
Primjer # 3
Pretpostavimo da imamo devet učenika s njihovim nivoom inteligencije i brojem bodova koje su postigli na testu.
Student | Rezultat testa | IQ |
Radna memorija | 100 | 145 |
Shyam | 97 | 140 |
Kul | 93 | 130 |
Kappu | 91 | 125 |
Raju | 89 | 115 |
Vishal | 86 | 110 |
Vivek | 82 | 100 |
Vinay | 78 | 95 |
Kumar | 75 | 90 |
Korak 1: Prvo saznajte ovisne i neovisne varijable. Ovdje je test ocjena ovisna varijabla, a IQ je neovisna varijabla jer se test rezultat mijenja kako se IQ mijenja.
Korak 2: Idite na karticu Podaci - kliknite Analiza podataka - Odaberite regresiju - kliknite U redu.

Ovo će otvoriti prozor Regresija za vas.

Korak 3. Raspon rezultata ispitivanja ulaza u polju za unos Y raspona i IQ u polju za unos X raspona. (Provjerite naljepnice ako imate zaglavlja u vašem rasponu podataka. Odaberite izlazne mogućnosti, a zatim provjerite željene rezidualne stavke. Kliknite U redu.

Dobit ćete sažeti izlaz prikazan na slici ispod.

Korak 4: Analiza regresije prema sažetom izlazu
Sažetak rezultata
Višestruko R: Ovdje je koeficijent korelacije 0,99, što je vrlo blizu 1, što znači da je Linearni odnos vrlo pozitivan.
R Square: R Square vrijednost je 0,983, što znači da 98,3% vrijednosti odgovara modelu.
P-vrijednost: Ovdje je P-vrijednost 1,86881E-07, što je vrlo manje od .1, što znači da IQ ima značajne prediktivne vrijednosti.
Pogledajte donji grafikon.

Možete vidjeti da gotovo sve točke padaju u liniju ili u obližnju liniju trenda.
Primjer # 4
Moramo predvidjeti prodaju izmjenične struje na temelju prodaje i temperature za drugi mjesec.
Mjesec | Temp | Prodajni |
Siječnja | 25 | 38893 |
Veljače | 28 | 42254 |
Ožujka | 31 | 42845 |
Travanj | 33 | 47917 |
svibanj | 37 | 51243 |
Lipnja | 40 | 69588 |
Srpnja | 38 | 56570 |
Kolovoza | 37 | 50000 |
Slijedite korake u nastavku da biste dobili rezultat regresije.
Korak 1: Prvo saznajte ovisne i neovisne varijable. Ovdje je prodaja ovisna varijabla, a temperatura neovisna varijabla jer prodaja varira kako se temperatura mijenja.
Korak 2: Idite na karticu Podaci - kliknite Analiza podataka - Odaberite regresiju - kliknite U redu.

Ovo će otvoriti prozor Regresija za vas.

Korak 3. Unesite prodaju u okvir za unos Y Range i Temp u okvir za unos X Range. (Provjerite naljepnice ako imate zaglavlja u vašem rasponu podataka. Odaberite izlazne mogućnosti, a zatim provjerite željene rezidualne stavke. Kliknite U redu.

To će vam dati sažeti rezultat kao u nastavku.

Korak 4: Analizirajte rezultat.
Višestruko R: Ovdje je koeficijent korelacije 0,877, što je blizu 1, što znači da je Linearni odnos pozitivan.
R Square: R Square vrijednost je 0,770, što znači da 77% vrijednosti odgovara modelu
P-vrijednost: Ovdje je P-vrijednost 1,86881E-07, što je vrlo manje od .1, što znači da IQ ima značajne prediktivne vrijednosti.
Primjer # 5
Sada napravimo Regresijsku analizu za više neovisnih varijabli:
Morate predvidjeti prodaju mobitela koji će se predstaviti sljedeće godine. Imate cijenu i stanovništvo zemalja koje utječu na prodaju mobilnih telefona.
Mobilna verzija | Prodajni | Količina | Stanovništvo |
NAS | 63860 | 858 | 823 |
UK | 61841 | 877 | 660 |
KZ | 60876 | 873 | 631 |
CH | 58188 | 726 | 842 |
HN | 52728 | 864 | 573 |
AU | 52388 | 680 | 809 |
NZ | 51075 | 728 | 661 |
RU | 49019 | 689 | 778 |
Slijedite korake u nastavku da biste dobili rezultat regresije.
Korak 1. Prvo saznajte ovisne i neovisne varijable. Ovdje prodaja ovisi o varijabli, količini i populaciji. Obje su neovisne varijable jer prodaja ovisi o količini i broju stanovnika u zemlji.
Korak 2. Idite na karticu Podaci - kliknite Analiza podataka - Odaberite regresiju - kliknite U redu.

Ovo će otvoriti prozor Regresija za vas.

Korak 3. Unesite prodaju u okvir za unos Y Range i odaberite količinu i populaciju u polju za unos X Range. (Provjerite naljepnice ako imate zaglavlja u vašem rasponu podataka. Odaberite izlazne mogućnosti, a zatim provjerite željene rezidualne stavke. Kliknite U redu.

Sada pokrenite regresiju koristeći analizu podataka na kartici Podaci. To će vam dati sljedeći rezultat.
Sažetak rezultata
Višestruko R: Ovdje je koeficijent korelacije 0,93, što je vrlo blizu 1, što znači da je Linearni odnos vrlo pozitivan.
R kvadrat: Vrijednost R kvadrata je 0,866, što znači da 86,7% vrijednosti odgovara modelu.
Značaj F: Značaj F manji je od .1, što znači da regresijska jednadžba ima značajnu prediktivnu vrijednost.
P-vrijednost : Ako pogledate P-vrijednost za količinu i stanovništvo, možete vidjeti da su vrijednosti manje od .1, što znači da količina i populacija imaju značajnu prediktivnu vrijednost. Manje vrijednosti P znači da varijabla ima značajnije prediktivne vrijednosti.
Međutim, i količina i populacija imaju značajnu prediktivnu vrijednost, ali ako pogledate P-vrijednost za količinu i populaciju, tada možete vidjeti da ta količina ima manju P-vrijednost u excelu od populacije. To znači da količina ima značajniju prediktivnu vrijednost od stanovništva.
Stvari koje treba zapamtiti
- Uvijek provjerite ovisne i neovisne varijable kad god odabirete bilo koji podatak.
- Linearna regresijska analiza uzima u obzir odnos između sredine varijabli.
- Ovaj jedini model odnosa između varijabli koje su linearne
- Ponekad nije najbolje odgovara stvarnom problemu. Na primjer: (Dob i nadnice). Većinu vremena plaće se povećavaju kako se dob povećava. Međutim, nakon umirovljenja dob se povećava, ali plaće se smanjuju.