Test Wilcoxona dla par obserwacji

Test Wilcoxona dla par obserwacji – nieparametryczna alternatywa dla testu t-Studenta dla przypadku dwóch równolicznych prób dających się połączyć w pary. Często używa się tego testu do porównywania danych zebranych przed i po eksperymencie w celu zbadania, czy nastąpiła istotna statystycznie zmiana.

Porównanie z testem t-Studenta

O ile test t-Studenta sprawdza hipotezę zerową o równości średnich arytmetycznych w odpowiadających im populacjach, test Wilcoxona weryfikuje równość median.

Jak test t-Studenta, test Wilcoxona bazuje na różnicach między wartościami cech z porównywanych zbiorów, stąd również wymaga zmiennych na skali interwałowej. W przeciwieństwie jednak do testu t-Studenta nie posiada założeń dotyczących rozkładu próby. Może zatem być używany w sytuacjach, gdy założenia testu t-Studenta nie są spełnione.

Dane

Załóżmy, że zebraliśmy $2n$ obserwacji, po dwie dla każdego z n przypadków. Niech $i$ będzie indeksem danego przypadku, $x_{i}$ będzie pierwszą, a $y_{i}$ drugą obserwacją przypadku $i.$

Założenia

Niech $d_{i}=y_{i}-x_{i}$ dla $i=1\dots n.$ Zakłada się, że różnice $d_{i}$ są niezależne.
Każda różnica $d_{i}$ pochodzi z populacji o identycznym ciągłym rozkładzie, symetryczny względem wspólnej mediany $\theta$

Wyliczanie statystyki Wilcoxona

Testowaną hipotezą zerową jest:

H_{0}:\theta =0

Algorytm wyliczania statystyki testu Wilcoxona:

wyliczenie różnic $d_{i}$
uporządkowanie wartości bezwzględnych $|d_{1}|,\dots |d_{n}|$
zrangowanie tak otrzymanego zbioru i oznaczenie rang przez $R_{i}.$ Rangi związane uzyskują wartość średnią.
zdefiniowanie statystyki $W^{+}$ jako sumy rang $R_{i},$ dla których $d_{i}>0.$

Niekiedy wykonuje się dalsze kroki:

Analogicznie obliczana jest statystyka $W^{-},$ czyli suma rang, dla których $d_{i}<0.$
Statystyka $S$ jest obliczana jako:

S=min(W^{+},W^{-}).

Właściwości statystyki Wilcoxona

Właściwości statystyki $W^{+}{:}$

wartość oczekiwana:

\mathbb {E} W^{+}={\frac {n(n+1)}{4}}

wariancja:

\operatorname {Var} \ W^{+}={\frac {n(n+1)(2n+1)}{24}}

Dla dowolnej liczby $t{:}$

\operatorname {P} \left({\frac {W^{+}-\mathbb {E} W^{+}}{\sqrt {Var\ W^{+}}}}\leqslant t\right)\to \Phi (t)\quad {}

gdy

{}\,n\to \infty

Zobacz w Wikiźródłach tablicę rozkładu normalnego

Do obliczenia wartości p dla prób o małej liczności (zwykle przyjmuje się $n\leqslant 20$ ) korzysta się z tablic statystycznych. Dla dużych prób używa się przybliżenia rozkładem normalnym, z parametrami podanymi wyżej.

Historia

Twórcą testu był Frank Wilcoxon (1892–1965), który zaproponował go w jednym artykule (Wilcoxon, 1945) z innym testem, zwanym obecnie testem Manna-Whitneya (lub testem Wilcoxona dla dwóch prób).

Test Wilcoxona był spopularyzowany przez Siegla (1956) w jego wpływowym podręczniku statystyki nieparametrycznej. Siegel używał symbolu $T$ dla wielkości oznaczanej powyżej przez $S.$ W konsekwencji test czasami jest nazywany testem T Wilcoxona, a statystyka testowa jest podawana jako wartość $T.$

Bibliografia

Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2001, s. 467–471. ISBN 83-204-2684-7.
Sidney Siegel: Non-parametric statistics for the behavioral sciences. Nowy York: McGraw-Hill, 1956.
Frank Wilcoxon: Individual comparisons by ranking methods. Biometrics, 1945, s. 1, 80-83.

Linki zewnętrzne

Metoda wyliczania p dla testu Wilcoxona (ang.)
Przykład zastosowania testu Wilcoxona. faculty.vassar.edu. [zarchiwizowane z tego adresu (2017-06-04)]. (ang.)
Wersja testu online. faculty.vassar.edu. [zarchiwizowane z tego adresu (2008-02-18)]. (ang.)