Test chi-kwadrat jest powszechnie stosowaną metodą statystyczną służącą do porównywania częstości występowania zjawisk w populacji.
Działanie testu chi-kwadrat polega na porównaniu obserwowanych częstości występowania danego zjawiska z wartościami oczekiwanymi, określonymi na podstawie założonych hipotez.
Test chi-kwadrat umożliwia testowanie różnych hipotez, np.:
W medycynie test chi-kwadrat może być stosowany do porównywania skuteczności dwóch różnych metod leczenia. Załóżmy, że badamy skuteczność dwóch różnych leków na chorobę X. Chcemy sprawdzić, czy którakolwiek z metod jest lepsza od drugiej. Losujemy dwie grupy pacjentów: grupa A otrzymuje lek nr 1, grupa B otrzymuje lek nr 2. Po zakończeniu badania porównujemy liczbę wyleczonych pacjentów w każdej z grup.
Załóżmy, że w grupie A wyleczono 60 pacjentów, a w grupie B 40 pacjentów. Czy możemy stwierdzić, że lek nr 1 jest skuteczniejszy niż lek nr 2? Aby to sprawdzić, obliczamy wartości oczekiwane dla każdej z grup przy założeniu, że leki są równie skuteczne. Zakładając, że ogólnie wyleczalność pacjentów z chorobą X wynosi 50%, otrzymujemy:
Następnie obliczamy wartość statystyki testowej chi-kwadrat. W tym przypadku wynosi ona 4, co oznacza, że różnice między obserwowanymi a oczekiwanymi wartościami nie są duże. Na tej podstawie nie możemy stwierdzić, że którykolwiek z leków jest skuteczniejszy.
Wynik testu chi-kwadrat ma związek z prawdopodobieństwem błędu popełnienia 1. rodzaju (związanego z odrzuceniem prawidłowej hipotezy) przy założeniu, że hipoteza jest prawdziwa. Im mniejsza wartość statystyki testowej, tym mniejsze prawdopodobieństwo błędu i większa pewność, że badana hipoteza jest prawdziwa.
Przykładowo, wartość statystyki testowej równa 0 wskazywałaby na dokładne pokrycie się obserwowanych i oczekiwanych wartości, a wartość statystyki wynosząca 100 oznaczałaby, że różnice między obserwowanymi a oczekiwanymi wartościami są bardzo duże.
Test chi-kwadrat jest narzędziem stosowanym w statystyce do porównywania częstości występowania zjawisk w populacji. Może być używany do testowania różnych hipotez, np. o równości częstości, niezależności zjawisk czy odpowiedniości rozkładu zmiennej. Interpretacja wyników testu chi-kwadrat opiera się na wartości statystyki testowej i jej związku z prawdopodobieństwem błędu popełnienia przy odrzuceniu prawidłowej hipotezy.