Chi Square test u Excelu - Kako napraviti test na kvadrat kvadrat s primjerom

Hi-kvadrat test s Excelom

Chi-Square test u Excelu najčešće se koristi neparametarski test koji se koristi za usporedbu dvije ili više varijabli za slučajno odabrane podatke. To je vrsta testa koja se koristi za utvrđivanje odnosa između dvije ili više varijabli, to se koristi u statistici koja je poznata i kao P-vrijednost Chi-Square, u Excelu nemamo ugrađenu funkciju, ali možemo je koristiti formule za izvođenje hi-kvadrat testa u excelu pomoću matematičke formule za hi-kvadrat test.

Vrste

  1. Chi-Square test dobrobiti
  2. Chi-Square test neovisnosti dviju varijabli.

# 1 - Chi-Square test za dobro oblikovanje

Koristi se za uočavanje blizine uzorka koji odgovara stanovništvu. Simbol Chi-Square testa je (2). To je zbroj svih ( Promatrano brojanje - Očekivano brojanje) 2 / Očekivano brojanje.

  • Gdje je k-1 stupnja slobode ili DF.
  • Gdje je Oi promatrana frekvencija, k je kategorija, a Ei očekivana frekvencija.

Napomena: - Dobra prilagodba statističkog modela odnosi se na razumijevanje koliko dobro uzorkovani podaci odgovaraju skupu opažanja.

Koristi

  • Kreditna sposobnost zajmoprimaca na temelju njihovih dobnih skupina i osobnih zajmova
  • Odnos između učinka prodavača i dobivene obuke
  • Povrat na jednu dionicu i na dionice sektora poput farmaceutskog ili bankarskog
  • Kategorija gledatelja i utjecaj TV kampanje.

# 2 - Chi-Square test neovisnosti dviju varijabli

Koristi se za provjeru jesu li varijable autonomne jedna od druge ili ne. Sa (r-1) (c-1) stupnjevima slobode

Gdje je Oi promatrana učestalost, r broj redova, c broj stupaca, a Ei očekivana frekvencija

Napomena: - Dvije slučajne varijable nazivaju se neovisnim ako druga ne utječe na raspodjelu vjerojatnosti jedne varijable.

Koristi

Test neovisnosti pogodan je za sljedeće situacije:

  • Postoji jedna kategorijska varijabla.
  • Postoje dvije kategorijalne varijable i morat ćete utvrditi odnos između njih.
  • Postoje unakrsne tablice i treba pronaći vezu između dvije kategorijalne varijable.
  • Postoje varijable koje se ne mogu mjeriti (na primjer, odgovori na pitanja poput, odabiru li zaposlenici u različitim dobnim skupinama različite vrste zdravstvenih planova?)

Kako napraviti test hi-kvadrata u Excelu? (s primjerom)

Voditelj restorana želi pronaći vezu između zadovoljstva kupaca i plaća ljudi koji čekaju stolove. U ovome ćemo postaviti hipotezu za testiranje hi-kvadrata

  • Uzima nasumični uzorak od 100 kupaca koji pitaju je li usluga izvrsna, dobra ili loša.
  • Zatim kategorizira plaće ljudi koji čekaju kao niske, srednje i visoke.
  • Pretpostavimo da je razina značajnosti 0,05. Ovdje H0 i H1 označavaju neovisnost i ovisnost kvalitete usluge o plaćama ljudi koji čekaju.
  • H 0 - kvaliteta usluge ne ovisi o plaćama ljudi koji čekaju stolove.
  • H 1 - kvaliteta usluge ovisi o plaćama ljudi koji čekaju stolove.
  • Njezini nalazi prikazani su u donjoj tablici:

U ovom slučaju imamo 9 podatkovnih točaka, imamo 3 skupine, od kojih je svaka dobila drugačiju poruku o plaći, a ishod je dan u nastavku.

Sada ćemo izbrojati zbroj svih redaka i stupaca. To ćemo učiniti uz pomoć formule, tj. SUM. Da bismo zbrojili izvrsno u stupcu Ukupno, napisali smo = SUM (B4: D4), a zatim pritisnite tipku enter.

Ovo će nam dati 26 . Izvest ćemo isto sa svim redovima i stupcima.

Za izračunavanje stupnja slobode (DF) koristimo (r-1) (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

  • Postoje 3 kategorije usluga i 3 kategorije plaće.
  • Imamo 27 ispitanika sa srednjom plaćom (donji red, sredina)
  • Imamo 51 ispitanika s dobrom uslugom (zadnja kolona, ​​srednja)

Sada moramo izračunati očekivane frekvencije: -

Očekivane frekvencije mogu se izračunati pomoću formule: -

  • Da bismo izračunali Izvrsnu, upotrijebit ćemo množenje zbroja Niskih sa zbrojem Odličnih podijeljenih s N.

Pretpostavimo da moramo izračunati za 1. red i 1. stupac (= B7 * E4 / B9 ) . To će dati očekivani broj kupaca koji su glasali za izvrsnu uslugu za plaće ljudi koji čekaju kao niske, tj. 8,32 .

  • E 11 = - (32 * 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
  • E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
  • E 31 = 7,36 , E 32 = 6,21 , E 33 = 9,41

Slično tome, za sve moramo učiniti isto, a formula je primijenjena u donjem dijagramu.

Dobivamo tablicu očekivane frekvencije kako je dano dolje: -

Napomena: - Pretpostavimo da je razina značajnosti 0,05. Ovdje H0 i H1 označavaju neovisnost i ovisnost kvalitete usluge o plaćama ljudi koji čekaju.

Nakon izračuna očekivane frekvencije, izračunati ćemo hi-kvadrat podatkovne točke pomoću formule.

Hi-kvadrat bodovi = (promatrano-očekivano) 2 / očekivano

Da bismo izračunali prvu točku, zapisujemo = (B4-B14) 2 / B14.

Kopirat ćemo i zalijepiti formulu u druge ćelije kako bismo automatski popunili vrijednost.

Nakon toga izračunat ćemo chi-vrijednost (Izračunata vrijednost) dodavanjem svih vrijednosti danih iznad tablice.

Chi-vrijednost dobili smo kao 18.65823 .

Da bismo izračunali kritičnu vrijednost za to, koristimo tablicu kritičnih vrijednosti hi-kvadrat, a možemo se poslužiti formulom danom u nastavku.

Ova formula sadrži 2 parametra CHISQ.INV.RT (vjerojatnost, stupanj slobode).

Vjerojatnost je 0,05 i to je značajna vrijednost koja će nam pomoći da utvrdimo da li prihvatiti Nultu hipotezu (H 0 ) ili ne.

Kritična vrijednost hi-kvadrata je 9,487729037.

Sada ćemo pronaći vrijednost hi-kvadrata ili (P-vrijednost) = CHITEST (stvarni_opseg, očekivani_opseg)

Raspon od = CHITEST (B4: D6, B14: D16) .

Kao što smo vidjeli, vrijednost chi-testa ili P-vrijednosti je = 0,00091723.

Izračunali smo sve vrijednosti. Vrijednosti hi-kvadrata (izračunate vrijednosti) značajne su samo kada je njegova vrijednost jednaka ili veća od kritične vrijednosti 9,48, tj. Kritična vrijednost (tablična vrijednost) mora biti viša od 18,65 da bi se prihvatila nulska hipoteza (H 0 ) .

Ali ovdje Izračunata vrijednost > Tablična vrijednost

X 2 (izračunato)> X 2 (tablično)

18,65> 9,48

U ovom ćemo slučaju odbaciti Nulti hipotezu (H 0 ) i prihvatit će se zamjenska (H 1 ) .

  • Također možemo koristiti P-vrijednost za predviđanje istog, tj. Ako je P-vrijednost <= α (značajna vrijednost 0,05), Nultova hipoteza će biti odbačena.
  • Ako je P-vrijednost> α , ne odbacujte nultu hipotezu .

Ovdje je P-vrijednost (0,0009172) < α (0,05), odbiti H 0 , prihvatiti H 1

Iz gornjeg primjera zaključujemo da kvaliteta usluge ovisi o plaćama ljudi koji čekaju.

Stvari koje treba zapamtiti

  • Razmatra kvadrat standardne normalne varijable.
  • Procjenjuje razlikuju li se frekvencije uočene u različitim kategorijama od frekvencija koje se očekuju prema određenom skupu pretpostavki.
  • Određuje koliko pretpostavljena distribucija odgovara podacima.
  • Koristi tablice nepredviđenih slučajeva (u istraživanjima tržišta ove se tablice nazivaju unakrsnim karticama).
  • Podržava mjerenja na nominalnoj razini.

Zanimljivi članci...