Statystycznie rzecz biorąc - profesjonalna analiza danych

Test t-Studenta i testy nieparametryczne (U Manna–Whitneya, Wilcoxona)

Analiza statystyczna często sprowadza się do porównywania dwóch grup danych. Możemy chcieć sprawdzić, czy nowa metoda nauczania przynosi lepsze wyniki niż stara, albo czy średnie wydatki dwóch różnych grup klientów w sklepie istotnie się różnią. W takich przypadkach zwykle myślimy o teście t-Studenta – jednym z najpopularniejszych testów statystycznych.

Jednak co zrobić, gdy dane nie spełniają wymaganych założeń (np. nie mają rozkładu normalnego)? Wtedy z pomocą przychodzą testy nieparametryczne, takie jak test U Manna–Whitneya czy test Wilcoxona. W tym artykule przyjrzymy się zarówno testowi t, jak i jego nieparametrycznym alternatywom, abyś mógł/mogła swobodnie zdecydować, który test wybrać w swojej analizie.


1. Test t-Studenta: co to takiego?

Test t-Studenta (ang. Student’s t-test) służy do porównywania średnich w dwóch grupach. Najczęściej stosuje się go w badaniach, w których interesuje nas odpowiedź na pytanie: „Czy dwie grupy różnią się istotnie pod względem pewnej cechy ilościowej (np. oceny testowe, wzrost, wynagrodzenie)?”.

1.1. Rodzaje testu t-Studenta

Istnieją trzy główne warianty testu t-Studenta:

  1. Test t dla jednej próby (one-sample t-test)
    • Porównujemy średnią z próby do pewnej wartości teoretycznej lub oczekiwanej (np. średniej w populacji).
  2. Test t dla dwóch prób niezależnych (independent two-sample t-test)
    • Porównujemy dwie niezależne grupy (np. grupę A i grupę B), by stwierdzić, czy mają różne średnie.
  3. Test t dla prób zależnych (paired t-test)
    • Porównujemy tę samą grupę przed i po pewnej interwencji (np. wyniki testu tej samej klasy przed i po zastosowaniu nowej metody nauczania).

1.2. Założenia testu t-Studenta

Aby wynik testu t-Studenta był miarodajny, powinny być spełnione pewne warunki:

  1. Rozkład normalny: Próbki pochodzą z populacji o rozkładzie normalnym (lub przynajmniej zbliżonym).
  2. Jednorodność wariancji (homoscedastyczność): W przypadku testu dla dwóch prób niezależnych zakładamy, że wariancja w obu grupach jest zbliżona.
  3. Niezależność obserwacji: Dane w jednej grupie nie powinny wpływać na dane w drugiej grupie (w przypadku testu dla dwóch prób niezależnych).

Jeśli któreś z tych założeń nie jest spełnione, możemy mieć problem z poprawną interpretacją testu t. Z pomocą przychodzą wtedy testy nieparametryczne.

1.3. Przykład zastosowania

Załóżmy, że chcemy porównać średni czas reakcji dwóch grup kierowców:

  • Grupa A: kierowcy, którzy przeszli specjalne szkolenie z jazdy defensywnej.
  • Grupa B: kierowcy bez dodatkowego szkolenia.

Mamy dane o czasie reakcji (w sekundach) 30 osób z każdej grupy.

  1. Sprawdzamy, czy dane z obu grup są w przybliżeniu normalnie rozłożone i czy wariancja w obu grupach nie różni się drastycznie.
  2. Jeśli tak – stosujemy test t dla dwóch prób niezależnych.
  3. Otrzymujemy wartość statystyki t oraz wartość p. Jeżeli p < 0,05 (przy przyjętym poziomie istotności α = 0,05), wnioskujemy, że średni czas reakcji w grupie A jest statystycznie różny od średniego czasu reakcji w grupie B (np. krótszy).

2. Test U Manna–Whitneya: alternatywa dla testu t dla prób niezależnych

2.1. Kiedy stosować?

Test U Manna–Whitneya (ang. Mann–Whitney U test), nazywany też często testem Manna–Whitneya–Wilcoxona, stosujemy w sytuacjach, gdy chcemy porównać dwie niezależne grupy, ale:

  • Nie mamy pewności co do rozkładu danych (np. nie jest normalny).
  • Dysponujemy skalą porządkową lub dane mają wiele odstających wartości (outliers).

Zamiast porównywać bezpośrednio średnie, test U Manna–Whitneya porównuje pozycje (rangi) pomiarów w obu grupach.

2.2. Przykładowy scenariusz

Załóżmy, że badamy poziom odczuwanego stresu (skala 1–10) w dwóch zespołach pracowników: Zespole A i Zespole B. Dane mogą być:

  • Nienormalnie rozłożone (np. większość pracowników deklaruje stres między 7 a 9).
  • Na granicy skal porządkowych (ocena „5” niekoniecznie oznacza, że jest to punkt środkowy w odczuciu stresu).

W takiej sytuacji test t-Studenta może dać mylące wyniki, a bardziej odpowiedni będzie test U Manna–Whitneya.

2.3. Interpretacja wyników

Podobnie jak w teście t, po obliczeniach otrzymujemy statystykę testu oraz wartość p. Jeśli p < 0,05, uznajemy, że istnieje istotna różnica między medianami (lub ogólnie „poziomami”) stresu w obu zespołach.


3. Test Wilcoxona: alternatywa dla testu t dla prób zależnych

3.1. Kiedy stosować?

Test Wilcoxona (ang. Wilcoxon signed-rank test) jest nieparametrycznym odpowiednikiem testu t-Studenta dla prób zależnych. Używamy go, gdy:

  • Porównujemy te same osoby przed i po pewnej interwencji (np. przed i po terapii).
  • Dane nie spełniają założenia normalności lub występują silne wartości odstające.

Test Wilcoxona, podobnie jak test U Manna–Whitneya, opiera się na rangach różnic między parami obserwacji (np. wynik przed – wynik po).

3.2. Przykład użycia

Wyobraźmy sobie, że testujemy efektywność nowego programu ćwiczeń na poziom cholesterolu we krwi. Pomiary dokonujemy u tych samych osób przed rozpoczęciem programu i po jego zakończeniu.

  1. Ponieważ jest to ta sama grupa mierzona dwukrotnie, mamy próby zależne.
  2. Jeśli rozkład jest w przybliżeniu normalny, stosujemy test t-Studenta dla prób zależnych .
  3. Jeśli jednak wstępna analiza (np. test Shapiro-Wilka) sugeruje, że rozkład daleki jest od normalnego lub występuje dużo wartości odstających, lepiej użyć testu Wilcoxona.
  4. Podobnie, otrzymujemy statystykę testu i wartość p; jeśli p < 0,05 – różnica między wynikami przed i po jest statystycznie istotna.

4. Który test wybrać?

Dla ułatwienia przedstawiamy prostą tabelkę podsumowującą:

Sytuacja Dane Test parametryczny Test nieparametryczny
Porównanie 2 niezależnych grup Dane o rozkładzie normalnym (zwykle n>30, brak outlierów) Test t-Studenta dla prób niezależnych Test U Manna–Whitneya
Porównanie 2 niezależnych grup Dane bez rozkładu normalnego, skala porządkowa, outliery (niezalecane) Test U Manna–Whitneya
Porównanie tej samej grupy przed i po interwencji Dane o rozkładzie normalnym Test t-Studenta dla prób zależnych Test Wilcoxona (jeżeli rozkład nie jest normalny)
Porównanie tej samej grupy przed i po interwencji Dane bez rozkładu normalnego, duże odstępstwa (niezalecane) Test Wilcoxona

5. Jak obliczyć testy w praktyce?

5.1. Excel lub Google Sheets

  • Możesz skorzystać z wbudowanych funkcji statystycznych lub tzw. pakietu narzędzi analizy (Analysis ToolPak w Excelu).
  • Excel oferuje gotowe funkcje T.TEST (dla testu t-Studenta), ale aby wykonać test U Manna–Whitneya czy test Wilcoxona, potrzebne są niestety dodatki, makra lub formuły pisane ręcznie.

5.2. SPSS, Statistica, Jamovi

  • Wszystkie te programy umożliwiają obliczenie zarówno testu t, jak i testów nieparametrycznych po kilku kliknięciach w interfejsie graficznym.
  • Wystarczy wczytać dane, wybrać odpowiedni test z menu, ustawić poziom istotności i gotowe.

5.3. R i Python

  • W R możesz użyć funkcji t.test() do testu t-Studenta, wilcox.test() do testu Wilcoxona i Manna–Whitneya.
  • W Pythonie (pakiet SciPy) mamy scipy.stats.ttest_1samp(), scipy.stats.ttest_ind(), scipy.stats.ttest_rel() (testy t) oraz scipy.stats.mannwhitneyu() czy scipy.stats.wilcoxon().

6. Najczęstsze błędy i pułapki

  1. Nierespektowanie założeń testu t-Studenta
    • Jeśli dane nie są normalne, a mimo to uparcie stosujemy test t, możemy otrzymać błędne wnioski.
  2. Zbyt mała próba
    • Testy statystyczne tracą moc przy bardzo małych liczebnościach (np. n < 10 na grupę). Wówczas trudniej o miarodajną interpretację.
  3. Interpretacja p-value w oderwaniu od kontekstu
    • Pamiętaj, że niskie p nie zawsze oznacza ogromną różnicę praktyczną, a wysokie p niekoniecznie znaczy, że różnic w ogóle nie ma.
  4. Mylenie testu Wilcoxona z testem U Manna–Whitneya
    • Wilcoxona używamy w przypadku zależnych prób (te same osoby), a Manna–Whitneya – w przypadku niezależnych prób (dwie różne grupy).

7. Podsumowanie

  • Test t-Studenta to podstawowe narzędzie do porównywania średnich w dwóch grupach, gdy dane są normalnie rozłożone.
  • Test U Manna–Whitneya i test Wilcoxona przychodzą z pomocą, gdy rozkład danych odbiega od normy, mamy wiele wartości odstających lub dane są w skali porządkowej.
  • Najważniejsze jest świadome sprawdzenie, czy założenia testu zostały spełnione, zanim wyciągniesz wnioski z analizy.

Dzięki znajomości tych trzech testów zyskujesz solidną bazę do przeprowadzania prostych porównań między grupami i masz pewność, że Twoje wnioski statystyczne będą bardziej rzetelne. W kolejnych krokach możesz zgłębiać bardziej zaawansowane metody (np. analiza wariancji – ANOVA) i inne testy nieparametryczne, by radzić sobie z jeszcze bardziej skomplikowanymi zestawieniami danych.


Zachęcamy do dyskusji!

Masz pytania na temat testu t-Studenta, testu U Manna–Whitneya czy Wilcoxona? Podziel się nimi w komentarzu! Postaramy się rozwiać Twoje wątpliwości i pomóc w doborze odpowiedniej metody analizy.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.