W tym artykule omówiono temat Weryfikacja hipotez statystycznych z szerokiej i zróżnicowanej perspektywy, badając różne aspekty i punkty widzenia związane z tym tematem. Od jego powstania do dzisiejszego znaczenia, poprzez jego implikacje w różnych obszarach, ten artykuł będzie miał na celu przedstawienie pełnej i szczegółowej wizji Weryfikacja hipotez statystycznych. Poprzez dogłębną i rygorystyczną analizę ma zaoferować czytelnikowi pełny przegląd, który pozwoli mu zrozumieć znaczenie i zakres Weryfikacja hipotez statystycznych w dzisiejszym społeczeństwie. Ponadto zostaną omówione możliwe wyzwania i możliwości związane z tym tematem, a także rekomendacje i perspektywy na przyszłość.
Weryfikacja hipotez statystycznych – sprawdzanie sądów o populacji przez badanie jej wycinka (próby statystycznej). Wyróżnia się kilka podejść do problemu weryfikacji hipotez, między innymi:
Ze względów historycznych w naukach empirycznych najczęściej spotyka się obecnie metody częstościowe. Wiążą się one z szeregiem specyficznych problemów interpretacyjnych, jednak każde z podejść charakteryzują swoiste problemy i ryzyko niezrozumienia oraz nadużyć.
Niech
będzie rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby indeksowaną parametrem (w szczególności może to być wektor parametrów rzeczywistych). opisuje wielowymiarowy łączny rozkład wszystkich obserwacji w próbie
Hipotezą statystyczną jest zdanie postaci gdzie koduje własność rozkładu, którą chcemy testować.
Problem weryfikacji hipotezy statystycznej polega na takim podziale przestrzeni próby na rozłączne zbiory i żeby prawdopodobieństwo warunkowe hipotezy było możliwie małe (w pewnym ustalonym sensie) dla i możliwie duże dla
Zwykle wybiera się pewną statystykę i buduje zbiór
gdzie:
Jednostronny obszar krytyczny to obszar postaci gdzie
Dwustronny obszar krytyczny to obszar postaci gdzie
Hipoteza zerowa – jest to hipoteza poddana procedurze weryfikacyjnej, w której zakładamy, że różnica między analizowanymi parametrami lub rozkładami wynosi zero. Przykładowo wnioskując o parametrach hipotezę zerową zapiszemy jako:
Hipoteza alternatywna – hipoteza przeciwstawna do weryfikowanej. Możemy ją zapisać na trzy sposoby w zależności od sformułowania badanego problemu:
Budujemy pewną statystykę W, która jest funkcją wyników z próby losowej i wyznaczamy jej rozkład przy założeniu, że hipoteza zerowa jest prawdziwa. Funkcję W nazywa się statystyką testową lub funkcją testową.
Na tym etapie procedury weryfikacyjnej przyjmujemy maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju, który polega na odrzuceniu hipotezy zerowej wtedy, gdy jest ona prawdziwa. Prawdopodobieństwo to jest oznaczane symbolem i nazywane poziomem istotności. Na ogół przyjmujemy prawdopodobieństwo bliskie zeru, ponieważ chcemy, aby ryzyko popełnienia błędu było jak najmniejsze. Najczęściej zakładamy poziom istotności czasem przyjmuje się np.
Obszar krytyczny – obszar znajdujący się zawsze na krańcach rozkładu. Jeżeli obliczona przez nas wartość statystyki testowej znajdzie się w tym obszarze, to weryfikowaną przez nas hipotezę odrzucamy. Wielkość obszaru krytycznego wyznacza dowolnie mały poziom istotności natomiast jego położenie określane jest przez hipotezę alternatywną.
Obszar krytyczny od pozostałej części rozkładu statystyki oddzielony jest przez tzw. wartości krytyczne testu , czyli wartości odczytane z rozkładu statystyki przy danym tak aby spełniona była relacja zależna od sposobu sformułowania
Wyniki próby opracowujemy w odpowiedni sposób, zgodnie z procedurą wybranego testu i są one podstawą do obliczenia statystyki testowej. Większość statystyk testowych, mających dokładny rozkład normalny, -Studenta lub graniczny rozkład normalny, obliczamy w następujący sposób:
gdzie:
Wyznaczoną na podstawie próby wartość statystyki (P-wartość) porównujemy z wartością krytyczną testu.
Reguły postępowania przy weryfikacji hipotez są określane mianem testów statystycznych.
Zgodnie ze stanowiskiem Amerykańskiego Towarzystwa Statystycznego z 2016 r. P-wartość badania sama w sobie nie niesie informacji o prawdziwości hipotezy badawczej, wartości dowodowej danych czy znaczenia oraz wielkości efektu i nie powinna być traktowana jako samodzielne kryterium poznawcze. Statystycy rekomendują, aby w interpretacji wyników badań uwzględniać ich kontekst i transparentność. Wynik pojedynczego badania ani nawet grupy badań nie uprawniają same przez siebie do uznania żadnej hipotezy, stanowią jedynie słabsze lub mocniejsze ku temu dowody. Dopiero badanie, które jest intersubiektywnie i systematycznie powtarzalne, daje prawo do silniejszych wniosków.
Powyższa standardowa procedura wymaga przyjęcia arbitralnego poziomu istotności a wynikiem weryfikacji jest odpowiedź binarna – albo statystyka testowa mieści się w przedziale ufności, albo nie.
Alternatywnym i nowocześniejszym, choć mniej popularnym podejściem jest obliczenie zamiast tego surowej p-wartości (prawdopodobieństwa popełnienia błędu I rodzaju) i podawanie jej jako wyników weryfikacji. Dzięki temu nie ma potrzeby przyjmowania a priori żadnych wartości pozwala to również na porównywanie istotności różnych konkurencyjnych hipotez statystycznych.