Statystycznie rzecz biorąc - profesjonalna analiza danych

Test chi2

Test chi2 jest generalnie wykorzystywany do badania współzależności dwóch zmiennych.

Poròwnuje dwie zmienne w tabeli kontyngencji, aby sprawdzić czy różnią się od siebie.

Kiedy stosować test chi2 ?

Test chi2 nie wymaga założeń o normalności rozkładu czy jednorodności wariancji. Można za jego pomocą analizować zmienne nominalne i porządkowe.

Testujemy, czy liczebności empiryczne (obserwowane), czyli otrzymane z badania, różnią się istotnie od oczekiwanych czyli teoretycznych. Liczebności oczekiwane powinny być większe od 5.

Hipoteza zerowa H0 mówi, że badane zmienne są niezależne.

Hipoteza alternatywna H1 mówi, że istnieje związek między badanymi zmiennymi.

Dla zmiennych powinno się zbudować tabelę dwudzielczą.

Tabela dwudzielcza jest zbudowana z dwóch zmiennych, które mają po dwie wartości, np. zmienna płeć ma dwie wartości: mężczyzna i kobieta.

Najpierw należy postawić sobie pytanie badawcze i hipotezę badawczą.

My zbadamy sobie związek między płcią a stosowaniem kremu na zmarszczki.

Pytanie badawcze, które sobie postawimy, jest następujące: Czy mężczyźni różnią się od kobiet w stosowaniu kremu na zmarszczki.

Tabela zawierająca liczebności empiryczne, czyli te, które pochodzą z badań, wygląda następująco:

Liczebności empiryczne

PłećStosowanie kremu na zmarszczkiOgółem
NieTak
Mężczyzna3680116
Kobieta16110126
Ogółem52190242

Następnie wylicza się wartości oczekiwane dla każdej komórki tabeli dwudzielczej wg wzoru:

f=\frac{(suma w wierszu)*(suma w kolumnie)}{n}

Po podstawieniu danych:

f=\frac{126*52}{242}=27,1

f=\frac{116*52}{242}=24,9

f=\frac{126*190}{242}=98,9

f=\frac{116*190}{242}=91,1

 

Tabela zawierająca liczebności oczekiwane:

Obliczanie wartości oczekiwanych

PłećStosowanie kremu na zmarszczkiOgółem
NieTak
Mężczyzna24,991,1116
Kobieta27,198,9126
Ogółem52190242

Czym jest liczebność oczekiwana?

Mówi ona ilu mężczyzn i ile kobiet powinno opowiedzieć się za, a ile przeciw stosowaniu kremu na zmarszczki.

Gdy już mamy liczebności empiryczne i oczekiwane, czas na wyliczenie chi 2.

Wzór na chi 2 jest następujący:

{X}^2=\sum \frac{(f{o}-f_{e})^2 }{f_{e}}

Z wzoru wynika, że aby obliczyć chi 2 potrzebujemy najpierw obliczyć różnice między liczebnościami empirycznymi i oczekiwanymi dla każdej komórki tabeli, będzie to nasze {f}_o-{f}_e

Różnica liczebności empirycznych i oczekiwanych między mężczyznami stosującymi krem na zmarszczki wynosi 36-24,9=11,1

W poniższej tabeli znajduje się wyliczenie różnic między wartościami  oczekiwanymi a empirycznie uzyskanymi.

Zestawienie liczebności empirycznych i oczekiwanych i różnic między nimi

PłećStosowanie kremu na zmarszczkiOgółem
Nief0-feTakf0-fe
Mężczyzna - liczebności empiryczne (f0)3611,180-11,1116
Mężczyzna - liczebnosci oczekiwane (fe)24,991,1
Kobieta - liczebnosci empiryczne (f0)16-11,111011,1126
Kobieta - liczebności oczekiwane (fe)27,198,9
Ogółem52190242

 

Widzimy, że różnice między liczebnościami oczekiwanymi, a empirycznymi są równe 11,1.

Wartość chi2 wynosi

 

X^{2}=\frac{11,1^{2}}{24,9}+\frac{(-11,1)^{2}}{27,1}+\frac{(-11,1)^{2}}{91,1}+\frac{11,1^{2}}{98,9}

X^{2}=12,093

 

Jak rozumieć test chi2 ?

Gdy rośnie różnica między liczebnościami empirycznymi i oczekiwanymi, wzrasta też wartość chi2, co oznacza, że im wyższa jest wartość statystyki chi2, tym większe jest prawdopodobieństwo istnienia zależności między zmiennymi.

Przypomnijmy, że testujemy H0, która mówi, że nie ma istotnych różnic w stosowaniu kremu na zmarszczki między kobietami a mężczyznami.

Chi 2 wynosi 12,093. Musimy jeszcze wskazać poziom istotności oraz obliczyć liczbę stopni swobody .

Poziom istotności przyjmiemy 0,01.

Stopnie swobody wyliczamy ze wzoru df = (r-1)(c-1)

gdzie „r” to liczba wierszy, a „c” to liczba kolumn.

Liczba stopni swobody wynosi więc df=(2-1)(2-1)=1

Gdy mamy poziom istotności oraz wyliczone stopnie swobody, możemy porównać chi 2 uzyskane z obliczeń i chi 2 z rozkładu.

Wartość chi 2, przy poziomie istotności 0,01 i liczbie stopni swobody 1 wynosi 6,635. Tablice rozkładu wartości krytycznych rozkładu chi 2 można znaleźć tutaj

Uzyskana przez nas wartość chi 2 12,093 jest większa od teoretycznego 6,635, co stanowi podstawę do odrzucenia hipotezy zerowej.

Jak zapisać wynik?

X2 (1, N=242) = 12,093; p<0,01

Jak wynik wyglądałby w programie komputerowym SPSS?

Jak widać, nie potrzebujesz niczego wyliczać. Program sam podaje statystykę chi2 oraz poziom istotności. Aby stwierdzić czy istnieje związek między dwiema zmiennymi wystarczy spojrzeć na powyższą tabelę, a dokładniej, na kolumnę „istotność asymptotyczna (dwustronna)”. Jeżeli wartość p jest mniejsza lub równa niż przyjęty przez nas poziom istotności, oznacza to, że istnieje zależność między zmiennymi.

W naszym przypadku test niezależności dwóch zmiennych chi2 jest istotny statystycznie, co oznacza, że hipotezę zerową, o braku związku między zmiennymi, należy odrzucić. Przyjmujemy hipotezę alternatywną, która mówi, że występuje istotny związek między analizowanymi zmiennymi.