Uobičajena raspodjela u statistici - definicija, primjer, tumačenje

Što je normalna raspodjela u statistici?

Normalna raspodjela je krivulja raspodjele frekvencije u obliku zvona koja pomaže u opisivanju svih mogućih vrijednosti koje slučajna varijabla može uzeti unutar određenog raspona, pri čemu je veći dio područja raspodjele u sredini, a malo ih je u repovima, u krajnjim krajevima. Ova raspodjela ima dva ključna parametra: srednju vrijednost (µ) i standardnu ​​devijaciju (σ) koja igra ključnu ulogu u izračunu povrata imovine i strategiji upravljanja rizikom.

Kako protumačiti normalnu distribuciju

Gornja slika pokazuje da je statistička normalna raspodjela zvonolika krivulja. Raspon mogućih ishoda ove raspodjele su cijeli stvarni brojevi koji leže između -∞ i + ∞. Repovi zvonaste krivulje protežu se s obje strane grafikona (+/-) bez ograničenja.

  • Otprilike 68% svih promatranja spada u +/- jedno standardno odstupanje (σ)
  • Otprilike 95% svih promatranja spada u +/- dvije standardne devijacije (σ)
  • Otprilike 99% svih promatranja spada u +/- tri standardna odstupanja (σ)

Ima iskrivljenost nule (simetrija raspodjele). Ako je raspodjela podataka asimetrična, tada je raspodjela neravnomjerna ako skup podataka ima iskrivljenost veću od nule ili pozitivnu iskrivljenost. Tada je desni rep raspodjele dulji od lijevog, a za negativni iskos (manji od nule) lijevi rep bit će duži od desnog repa.

Ima kurtozu od 3 (mjeri vršnost raspodjele), što ukazuje na to da raspodjela nije ni previše šiljasta ni pretanka repova. Ako je kurtoza veća od tri, tada je distribucija jača s masnijim repovima, a ako je kurtoza manja od tri, tada ima tanke repove, a vršna točka je niža od normalne raspodjele.

Karakteristike

  • Predstavljaju obitelj raspodjele gdje srednja vrijednost i odstupanje određuju oblik raspodjele.
  • Srednja vrijednost, medijan i način ove raspodjele jednaki su.
  • Polovica vrijednosti nalazi se lijevo od središta, a druga polovica desno.
  • Ukupna vrijednost ispod standardne krivulje uvijek će biti jedna.
  • Najvjerojatnije je distribucija u središtu, a manje vrijednosti leži na repu.

Transformacija (Z)

Funkcija gustoće vjerojatnosti (PDF) slučajne varijable (X) koja slijedi raspodjelu dana je:

gdje je -∞ <x <∞; -∞ <µ 0

Gdje,

  • F (x) = Normalna vjerojatnost Funkcija
  • x = slučajna varijabla
  • µ = Srednja vrijednost raspodjele
  • σ = Standardna devijacija raspodjele
  • π = 3,14159
  • e = 2,71828

Formula transformacije

Gdje,

  • X = Slučajna varijabla

Primjeri normalne raspodjele u statistici

Razmotrimo sljedeće primjere.

Primjer # 1

Pretpostavimo da tvrtka ima 10000 zaposlenika i višestruku strukturu plaća prema ulozi posla u kojem zaposlenik radi. Plaće su općenito raspodijeljene sa prosjekom stanovništva od µ = 60 000 USD, a standardno odstupanje stanovništva σ = 15 000 USD. Kolika će biti vjerojatnost da nasumično odabrani zaposlenik ima plaću manju od 45000 USD godišnje.

Riješenje

Kao što je prikazano na gornjoj slici, da bismo odgovorili na ovo pitanje, moramo saznati područje ispod normalne krivulje od 45 do lijevog bočnog repa. Također, trebamo koristiti vrijednost Z-tablice da bismo dobili pravi odgovor.

Prvo, moramo pretvoriti zadanu srednju vrijednost i standardnu ​​devijaciju u standardnu ​​normalnu raspodjelu sa srednjom vrijednosti (µ) = 0 i standardnom devijacijom (σ) = 1 pomoću formule transformacije.

Nakon pretvorbe moramo potražiti Z-tablicu kako bismo saznali odgovarajuću vrijednost koja će nam dati točan odgovor.

S obzirom,

  • Prosjek (µ) = 60.000 USD
  • Standardno odstupanje (σ) = 15000 USD
  • Slučajna varijabla (x) = 45000 USD

Transformacija (z) = (45000 - 60000/15000)

Transformacija (z) = -1

Sada je vrijednost koja je ekvivalentna -1 u Z-tablici 0,1587, što predstavlja područje ispod krivulje od 45 prema putu lijevo. Naznačilo je da kada slučajnim odabirom zaposlenika vjerojatnost zarade manje od 45000 USD godišnje iznosi 15,87%.

Primjer # 2

Sada držeći isti scenarij kao gore, saznajte vjerojatnost da nasumično odabrani zaposlenik zarađuje više od 80 000 USD godišnje koristeći uobičajenu raspodjelu.

Riješenje

Dakle, u ovom pitanju moramo saznati zasjenjeno područje od 80 do desnog repa koristeći istu formulu.

S obzirom,

  • Prosjek (µ) = 60.000 USD
  • Standardno odstupanje (σ) = 15000 USD
  • Slučajna varijabla (X) = 80.000 USD

Transformacija (z) = (80000 - 60000/15000)

Transformacija (z) = 1,33

Prema Z-tablici, ekvivalentna vrijednost 1,33 iznosi 0,9082 ili 90,82%, što pokazuje da vjerojatnost slučajnog odabira zaposlenika koji zarađuju manje od 80 000 USD godišnje iznosi 90,82%.

No, prema pitanju, moramo odrediti vjerojatnost slučajnih zaposlenika da zarade više od 80 000 USD godišnje, pa vrijednost moramo oduzeti od 100.

  • Slučajna varijabla (X) = 100% - 90,82%
  • Slučajna varijabla (X) = 9,18%

Dakle, vjerojatnost da zaposlenici zarađuju više od 80 000 USD godišnje iznosi 9,18%.

Koristi

  • Tehnička karta burze često je zvonasta krivulja koja analitičarima i investitorima omogućuje statističko zaključivanje o očekivanom prinosu i riziku od dionica.
  • Koristi se u stvarnom svijetu, poput određivanja najvjerojatnijeg najboljeg vremena koje su pizza kompanijama trebale za isporuku pizze i mnogih drugih stvarnih aplikacija.
  • Koristi se za usporedbu visina određenog skupa populacije u kojem će većina ljudi imati prosječnu veličinu, a vrlo malo ljudi će imati iznadprosječnu ili ispodprosječnu visinu.
  • Koriste se u određivanju prosječnog akademskog uspjeha učenika, što pomaže u usporedbi ranga studenata.

Zaključak

Uobičajena distribucija pronalazi primjenu u znanosti podataka i analitici podataka. Napredne tehnologije poput umjetne inteligencije i strojnog učenja koje se koriste zajedno s ovom distribucijom mogu dati bolju kvalitetu podataka, što će pomoći pojedincima i tvrtkama u učinkovitom donošenju odluka.

Zanimljivi članci...