Empirijsko pravilo - definicija, formula, kako koristiti u statistici?

Što je empirijsko pravilo u statistici?

Empirijsko pravilo u statistici navodi da se gotovo sva (95%) opažanja u normalnoj raspodjeli nalaze unutar 3 standardne devijacije od srednje vrijednosti. Ovo je vrlo važno pravilo i pomaže u predviđanju.

Formula

Formula pokazuje predviđeni postotak opažanja koja će se nalaziti unutar svakog standardnog odstupanja od srednje vrijednosti.

Pravilo kaže da:

  • 68% promatranja nalazit će se unutar +/- 1 standardnog odstupanja od srednje vrijednosti
  • 95% promatranja nalazit će se unutar +/- 2 standardnih odstupanja od srednje vrijednosti
  • 7% opažanja nalazit će se unutar +/- 3 standardnih odstupanja od srednje vrijednosti

Kako koristiti?

To se koristi u trendu predviđanja skupa podataka. Kada je skup podataka opsežan i postane izazovno proučiti cijelu populaciju, tada se na uzorak može primijeniti empirijsko pravilo kako bi se dobila procjena kako će podaci u populaciji reagirati ako se od vas zatraži da pronađete prosječnu plaću svih računovođe u SAD-u. Tada je to težak zadatak, jer je populacija ogromna. Dakle, u tom slučaju možete slučajno odabrati, recimo, 90 promatranja iz cijele populacije.

Tako ćete sada imati 90 plaća. Morate pronaći srednje i standardno odstupanje opažanja. Ako opažanje slijedi normalnu raspodjelu, tada se to može primijeniti i može se izvršiti procjena plaće svih računovođa u SAD-u.

Recimo da prosječna plaća uzorka iznosi 90.000 USD. A standardno odstupanje je 5000 USD. Dakle, od cjelokupne populacije, 68% računovođa prima plaću u rasponu od +/- 1 Standardna odstupanja od prosjeka. Kako je prosjek 90.000 USD, a standardno odstupanje 5.000 USD. Dakle, 68% svih računovođa u SAD-u plaća se u rasponu od 90.000 USD +/- (1 * 5.000 USD). To je između 85.000 i 95.000 USD

Ako se malo više širimo, tada 95% svih računovođa u SAD-u plaća u rasponu od Prosječna +/- 2 standardna odstupanja. 90.000 USD +/- (2 * 5000). Dakle, raspon je od 80.000 do 100.000 dolara.

U širem rasponu, 99,7% svih računovođa prima plaće u rasponu od Prosječnih +/- 3 Standardna odstupanja. To je 90.000 +/- (3 * 5000). Raspon je od 75 000 do 105 000 USD

Jasno možete vidjeti da bi se bez proučavanja cjelokupne populacije mogla procijeniti populacija. Ako netko planira raditi kao knjigovođa u SAD-u, onda može lako očekivati ​​da će mu se plaća kretati od 75.000 do 105.000 američkih dolara

Ovakva procjena pomaže olakšati rad i napraviti prognoze u vezi s budućnošću.

Primjeri empirijskih pravila

Gospodin X pokušava pronaći prosječni broj godina koje osoba preživi nakon umirovljenja, uzimajući u obzir dob umirovljenja od 60 godina. Ako su srednje godine preživljavanja od 50 slučajnih promatranja 20 godina, a SD 3, tada će otkriti vjerojatnost da osoba će primati mirovinu dulje od 23 godine

Riješenje

Empirijsko pravilo navodi da će se 68% promatranja nalaziti unutar 1 standardnog odstupanja od srednje vrijednosti. Ovdje je sredina opažanja 20.

68% promatranja nalazit će se unutar 20 +/- 1 (standardno odstupanje), što je 20 +/- 3. Dakle, raspon je od 17 do 23.

Postoji 68% šanse da minimalna godina koju osoba preživi nakon umirovljenja iznosi između 17 i 23. Sada je postotak koji leži izvan tog raspona (100 - 68) = 32%. 32 je jednako raspoređen na obje strane, što znači 16% šanse da će minimalne godine biti ispod 17 i 16% šanse da će minimalne godine biti veće od 23.

Dakle, vjerojatnost da će osoba povući više od 23 godine mirovine iznosi 16%.

Empirijsko pravilo nasuprot Chebyshev-ovom teoremu

Empirijsko pravilo primjenjuje se na skupove podataka koji slijede normalnu raspodjelu koja znači u obliku zvona. U normalnoj raspodjeli, obje strane raspodjele imaju po 50% vjerojatnosti.

Ako se skup podataka normalno ne distribuira, tada postoji još jedna aproksimacija ili pravilo koje se odnosi na sve vrste skupova podataka, a to je Chebyshev-ov teorem. Kaže tri stvari:

  • Najmanje 3/4 og svih zapažanja će se nalaziti unutar 2Standard odstupanja od srednje vrijednosti. To je snažna aproksimacija. To znači da ako postoji 100 zapažanja, zatim 3/4 og od zapažanja koja su 75 primjedbe će se nalaziti unutar +/- 2 standardne devijacije od srednje.
  • Najmanje 8/9 og svih promatranja će se nalaziti unutar 3Standard odstupanja od srednje vrijednosti.
  • Najmanje 1 - 1 / k 2 svih opažanja leži unutar K Standardnih odstupanja od srednje vrijednosti. Ovdje se K naziva bilo kojim cijelim brojem.

Kada koristiti?

Podaci su poput zlata u modernom svijetu. Ogromni su podaci koji dolaze iz različitih izvora i koriste se za različite aproksimacije ili prognoze. Ako skup podataka slijedi normalnu distribuciju, prikazuje krivulju u obliku zvona; tada se može koristiti empirijsko pravilo. Primjenjuje se na promatranja kako bi se stvorila aproksimacija za populaciju.

Jednom kad se vidi da promatranja pokazuju strukturu normalne raspodjele, slijedi se empirijsko pravilo kako bi se pronašlo nekoliko vjerojatnosti opažanja. Pravilo je izuzetno korisno za mnoge statističke prognoze.

Zaključak

Empirijsko pravilo statistički je koncept koji pomaže prikazati vjerojatnost opažanja i vrlo je koristan pri pronalaženju aproksimacije velike populacije. Uvijek treba napomenuti da su to aproksimacije. Uvijek postoje šanse za outliers koji ne padnu u distribuciji. Dakle, nalazi nisu točni i treba poduzeti mjere predostrožnosti kad se postupa prema prognozi.

Zanimljivi članci...