Test Wilcoxona dla par obserwacji

Test Wilcoxona dla par obserwacji – nieparametryczna alternatywa dla testu t-Studenta dla przypadku dwóch równolicznych prób dających się połączyć w pary. Często używa się tego testu do porównywania danych zebranych przed i po eksperymencie w celu zbadania, czy nastąpiła istotna statystycznie zmiana.

Porównanie z testem t-Studenta

O ile test t-Studenta sprawdza hipotezę zerową o równości średnich arytmetycznych w odpowiadających im populacjach, test Wilcoxona weryfikuje równość median.

Jak test t-Studenta, test Wilcoxona bazuje na różnicach między wartościami cech z porównywanych zbiorów, stąd również wymaga zmiennych na skali interwałowej. W przeciwieństwie jednak do testu t-Studenta nie posiada założeń dotyczących rozkładu próby. Może zatem być używany w sytuacjach, gdy założenia testu t-Studenta nie są spełnione.

Dane

Załóżmy, że zebraliśmy 2 n {\displaystyle 2n} obserwacji, po dwie dla każdego z n przypadków. Niech i {\displaystyle i} będzie indeksem danego przypadku, x i {\displaystyle x_{i}} będzie pierwszą, a y i {\displaystyle y_{i}} drugą obserwacją przypadku i . {\displaystyle i.}

Założenia

  1. Niech d i = y i x i {\displaystyle d_{i}=y_{i}-x_{i}} dla i = 1 n . {\displaystyle i=1\dots n.} Zakłada się, że różnice d i {\displaystyle d_{i}} niezależne.
  2. Każda różnica d i {\displaystyle d_{i}} pochodzi z populacji o identycznym ciągłym rozkładzie, symetryczny względem wspólnej mediany θ {\displaystyle \theta }

Wyliczanie statystyki Wilcoxona

Testowaną hipotezą zerową jest:

H 0 : θ = 0 {\displaystyle H_{0}:\theta =0}

Algorytm wyliczania statystyki testu Wilcoxona:

  • wyliczenie różnic d i {\displaystyle d_{i}}
  • uporządkowanie wartości bezwzględnych | d 1 | , | d n | {\displaystyle |d_{1}|,\dots |d_{n}|}
  • zrangowanie tak otrzymanego zbioru i oznaczenie rang przez R i . {\displaystyle R_{i}.} Rangi związane uzyskują wartość średnią.
  • zdefiniowanie statystyki W + {\displaystyle W^{+}} jako sumy rang R i , {\displaystyle R_{i},} dla których d i > 0. {\displaystyle d_{i}>0.}

Niekiedy wykonuje się dalsze kroki:

  • Analogicznie obliczana jest statystyka W , {\displaystyle W^{-},} czyli suma rang, dla których d i < 0. {\displaystyle d_{i}<0.}
  • Statystyka S {\displaystyle S} jest obliczana jako:
S = m i n ( W + , W ) . {\displaystyle S=min(W^{+},W^{-}).}

Właściwości statystyki Wilcoxona

Właściwości statystyki W + : {\displaystyle W^{+}{:}}

E W + = n ( n + 1 ) 4 {\displaystyle \mathbb {E} W^{+}={\frac {n(n+1)}{4}}}
  • wariancja:
Var   W + = n ( n + 1 ) ( 2 n + 1 ) 24 {\displaystyle \operatorname {Var} \ W^{+}={\frac {n(n+1)(2n+1)}{24}}}
  • Dla dowolnej liczby t : {\displaystyle t{:}}
P ( W + E W + V a r   W + t ) Φ ( t ) {\displaystyle \operatorname {P} \left({\frac {W^{+}-\mathbb {E} W^{+}}{\sqrt {Var\ W^{+}}}}\leqslant t\right)\to \Phi (t)\quad {}} gdy n {\displaystyle {}\,n\to \infty }
Zobacz w Wikiźródłach tablicę rozkładu normalnego

Do obliczenia wartości p dla prób o małej liczności (zwykle przyjmuje się n 20 {\displaystyle n\leqslant 20} ) korzysta się z tablic statystycznych. Dla dużych prób używa się przybliżenia rozkładem normalnym, z parametrami podanymi wyżej.

Historia

Twórcą testu był Frank Wilcoxon (1892–1965), który zaproponował go w jednym artykule (Wilcoxon, 1945) z innym testem, zwanym obecnie testem Manna-Whitneya (lub testem Wilcoxona dla dwóch prób).

Test Wilcoxona był spopularyzowany przez Siegla (1956) w jego wpływowym podręczniku statystyki nieparametrycznej. Siegel używał symbolu T {\displaystyle T} dla wielkości oznaczanej powyżej przez S . {\displaystyle S.} W konsekwencji test czasami jest nazywany testem T Wilcoxona, a statystyka testowa jest podawana jako wartość T . {\displaystyle T.}

Bibliografia

  • Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2001, s. 467–471. ISBN 83-204-2684-7.
  • Sidney Siegel: Non-parametric statistics for the behavioral sciences. Nowy York: McGraw-Hill, 1956.
  • Frank Wilcoxon: Individual comparisons by ranking methods. Biometrics, 1945, s. 1, 80-83.

Linki zewnętrzne

  • Metoda wyliczania p dla testu Wilcoxona (ang.)
  • Przykład zastosowania testu Wilcoxona. faculty.vassar.edu. [zarchiwizowane z tego adresu (2017-06-04)]. (ang.)
  • Wersja testu online. faculty.vassar.edu. [zarchiwizowane z tego adresu (2008-02-18)]. (ang.)

Implementacje