Formula Outlier pruža grafički alat za izračunavanje podataka koji se nalaze izvan zadanog skupa raspodjele, koji može biti unutarnja ili vanjska strana, ovisno o varijablama.
Što je Outlier Formula?
Izuzetak je točka podataka datog uzorka ili datog promatranja ili u raspodjeli koja će ležati izvan ukupnog uzorka. Uobičajeno pravilo koje kaže da će se podatkovna točka smatrati otklonom ako ima više od 1,5 IQR ispod prvog kvartila ili iznad trećeg kvartila.
Rečeno drugačije, niski outlieri ležat će ispod Q1-1,5 IQR, a visoki outliers Q3 + 1,5IQR
Treba izračunati medijan, kvartile, uključujući IQR, Q1 i Q3.
Formula odstupanja predstavljena je na sljedeći način,
Formula za Q1 = ¼ (n + 1) th pojam Formula za Q3 = ¾ (n + 1) th pojam Formula za Q2 = Q3 - Q1

Korak po korak izračun outliera
Da bi se izračunao Outlier potrebno je slijediti korake u nastavku.
- Korak 1: Prvo izračunajte kvartile, tj. Q1, Q2 i interkvartil
- Korak 2: Sada izračunajte vrijednost Q2 * 1,5
- Korak 3: Sada od vrijednosti izračunate u koraku 2 oduzmite vrijednost Q1
- Korak 4: Ovdje dodajte Q3 s vrijednošću izračunatom u koraku 2
- Korak 5: Stvorite raspon vrijednosti izračunatih u Korak 3 i Korak 4
- Korak 6: Poredajte podatke u rastućem redoslijedu
- Korak 7: Provjerite postoje li vrijednosti koje su ispod ili veće od raspona stvorenog u koraku 5.
Primjer
Razmotrite niz podataka sljedećih brojeva: 10, 2, 4, 7, 8, 5, 11, 3, 12. Morate izračunati sve izvanredne vrijednosti.
Riješenje:
Prvo, podatke moramo poredati uzlazno kako bismo pronašli medijan, koji će za nas biti Q2.
2, 3, 4, 5, 7, 8, 10, 11, 12

Sada budući da je broj opažanja neparan, što je 9, medijan će ležati na 5 -om mjestu, što je 7, a isto će biti Q2 za ovaj primjer.
Stoga je izračun Q1 sljedeći -
Q1 = ¼ (9 + 1)
= ¼ (10)
Q1 će biti -

Q1 = 2,5 člana
To znači da je Q1 prosjek 2. i 3. položaja promatranja, što je ovdje 3 i 4, a prosjek istog je (3 + 4) / 2 = 3,5
Stoga je izračun Q3 sljedeći -

Q3 = ¾ (9 + 1)
= ¾ (10)
K3 će biti -

Q3 = 7,5 člana
To znači da je Q3 je prosjek 7 th i 8 -og položaj promatranja, što je 10 i 11 mjesta, a prosječno isti je (10 + 11) / 2 = 105
Sada će niži odstupanja ležati ispod Q1-1,5IQR, a odstupanja od Q3 + 1,5IQR
Dakle, vrijednosti su 3,5 - (1,5 * 7) = -7, a veći raspon je 10,5 + (1,5 * 7) = 110,25.
Budući da nema opažanja koja su iznad ili ispod 110,25 i -7, u ovom uzorku nemamo nikakvih odstupanja.
Primjer neobične formule u Excelu (s Excel predloškom)
Predavanja kreativnog treniranja razmatraju mogućnost nagrađivanja učenika koji su u top 25%. Međutim, žele izbjeći bilo kakve iznimke. Podaci su za 25 učenika. Pomoću jednadžbe Outlier utvrdite postoji li outlier?
Riješenje:
Ispod su dati podaci za izračunavanje odstupanja.

Ovdje je broj opažanja 25, a naš bi prvi korak bio pretvaranje gore navedenih sirovih podataka u rastućem redoslijedu.
Medijan će biti -

Medijan vrijednosti = ½ (n + 1)
= ½ = ½ (26)
= 13 th pojam
Q2 ili medijan je 68,00
Što je 50% stanovništva.
Q1 će biti -

Q1 = ¼ (n + 1) th član
= ¼ (25 + 1)
= ¼ (26)
= 6,5- ti pojam, što je ekvivalent 7. -om članu
Q1 je 56,00, što je najnižih 25%
K3 će biti -

Konačno, Q3 = ¾ (n + 1) th član
= ¾ (26)
= 19,50 pojam
Ovdje su prosječne potrebe koje treba poduzeti, koji je od 19 -og i 20 -og uvjete koji su 77 i 77, a prosjek isti je (77 + 77) / 2 = 77,00
Q3 je 77, što je top 25%
Niski domet
Sada će niži odstupanja ležati ispod Q1-1,5IQR, a odstupanja od Q3 + 1,5IQR

Veliki domet -

Dakle, vrijednosti su 56 - (1,5 * 68) = -46, a veći raspon je 77 + (1,5 * 68) = 179.
Nema izvanrednih rezultata.
Relevantnost i namjene
Formulu outliersa vrlo je važno znati jer mogu postojati podaci koji bi se iskrivili zbog takve vrijednosti. Uzmimo primjer promatranja 2, 4, 6, 101, i ako netko uzme prosjek tih vrijednosti, to će biti 28,25, ali 75% promatranja leži ispod 7, pa bi stoga bila netočna odluka u vezi s promatranjima ovaj uzorak.
Ovdje se može primijetiti da se čini da se 101 jasno ocrtava, a ako se to ukloni, tada bi prosjek bio 4, što govori o vrijednostima ili zapažanjima da leže u rasponu od 4. Stoga je vrlo važno to provesti proračun kako bi se izbjegla zlouporaba vodećih podataka. Njih naširoko koriste statističari širom svijeta kad god provode bilo kakvo istraživanje.