Wilcoxonův test

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 25. října 2022; kontroly vyžadují 12 úprav .

Wilcoxonův t-test  – (také nazývaný Wilcoxonův t-test, Wilcoxonův test, Wilcoxonův znaménkový rank test, Wilcoxonův rank sum test) je neparametrický statistický test ( test ) používaný k testování rozdílů mezi dvěma vzorky párových nebo nezávislých měření. podle úrovně jakéhokoli kvantitativního znaku měřeného na spojité nebo ordinální stupnici. Poprvé navrhl Frank Wilcoxon [1] . Dalšími názvy jsou Wilcoxonův W-test [2] , Wilcoxonův podepsaný rank test , Wilcoxonův spojený-vzorkový test [3] . Wilcoxonův test pro nezávislé vzorky se také nazývá Mann-Whitney test [4] .

Podstatou metody je, že se porovnávají absolutní hodnoty závažnosti posunů v jednom nebo druhém směru. K tomu se nejprve seřadí všechny absolutní hodnoty posunů a poté se sečtou pořadí. Pokud k posunu jedním nebo druhým směrem dojde náhodou, pak budou součty jejich pořadí přibližně stejné. Pokud je intenzita posunů v jednom směru větší, pak součet pořadí absolutních hodnot posunů v opačném směru bude výrazně nižší, než by mohl být při náhodných změnách.

Účel kritéria

Kritérium je navrženo pro porovnání ukazatelů naměřených za dvou různých podmínek na stejném vzorku subjektů. Umožňuje vám určit nejen směr změn, ale také jejich závažnost, to znamená, že je schopen určit, zda je posun ukazatelů v jednom směru intenzivnější než ve druhém.

Popis kritérií

Kritérium je použitelné, pokud jsou atributy měřeny alespoň na ordinální stupnici. Toto kritérium je vhodné použít, když se velikost samotných posunů pohybuje v určitém rozmezí (10–15 % jejich velikosti). To je vysvětleno skutečností, že rozložení hodnot posunu by mělo být takové, aby bylo možné je seřadit. Pokud se posuny od sebe mírně liší a nabývají určitých konečných hodnot (například +1, -1 a 0), neexistují žádné formální překážky pro použití kritéria, ale vzhledem k velkému počtu stejných hodností , žebříček ztrácí smysl a stejné výsledky by bylo snazší získat pomocí znaménkového kritéria.

Podstatou metody je, že se porovnávají absolutní hodnoty závažnosti posunů v jednom nebo druhém směru. K tomu se nejprve seřadí všechny absolutní hodnoty posunů a poté se sečtou pořadí. Pokud k posunu jedním nebo druhým směrem dojde náhodou, pak budou součty jejich pořadí přibližně stejné. Pokud je intenzita posunů v jednom směru větší, pak součet pořadí absolutních hodnot posunů v opačném směru bude výrazně nižší, než by mohl být při náhodných změnách.

Minimální hodnota veličiny: , kde n je objem druhého vzorku. Maximální hodnota , kde n je objem druhého vzorku, m je objem prvního vzorku.

Omezení kritérií

S jistotou lze Wilcoxonův test použít s velikostí vzorku až 25 položek [5] . To je vysvětleno skutečností, že s větším počtem pozorování se distribuce hodnot tohoto kritéria rychle blíží normálu. Proto se v případě velkých vzorků uchýlí k převodu Wilcoxonova testu na hodnotu z (z-skóre) [5] . Je pozoruhodné, že program SPSS převádí Wilcosonův test na hodnotu z vždy bez ohledu na velikost vzorku [5] .

Nulové směny jsou vyloučeny. (Tento požadavek lze obejít přeformulováním typu hypotézy. Například: posun k rostoucím hodnotám převyšuje posun k jejich poklesu a tendenci zůstat na stejné úrovni.)

Posun běžnějším směrem je považován za „typický“ a naopak.

Existuje také zkratka pro porovnání jednoho vzorku se známou střední hodnotou .

Algoritmus

  1. Udělejte si seznam předmětů v libovolném pořadí, například abecedně.
  2. Vypočítejte rozdíl mezi jednotlivými hodnotami ve druhém a prvním měření. Určete, co bude považováno za typický posun.
  3. Podle algoritmu hodnocení seřaďte absolutní hodnoty rozdílů, přiřaďte nižší pořadí menší hodnotě a zkontrolujte shodu výsledného součtu pořadí s vypočítaným.
  4. Označte nějakým způsobem pořadí odpovídající posunům v atypickém směru. Vypočítejte jejich součet T.
  5. Určete kritické hodnoty T pro danou velikost vzorku. Pokud T-emp. menší nebo rovno T-cr. – spolehlivě převládá posun do „typického“ směru.

Ve skutečnosti se vyhodnocují znaménka hodnot získaných odečtením řady hodnot jedné dimenze od druhé. Pokud se v důsledku toho počet snížených hodnot přibližně rovná počtu zvýšených hodnot, hypotéza nulového mediánu je potvrzena.

Příklad algoritmu pro sérii dvou experimentů

Nechť existují dvě série experimentů, v jejichž důsledku byly získány dva vzorky o velikosti n a m. Nechť platí nulová hypotéza H 0 : Obecné průměry obou vzorků jsou stejné. K testování hypotézy H 0 je nutné:

  1. Sečtěte prvky druhého vzorku (vypočítejte W)
  2. Vypočítejte matematické očekávání náhodné veličiny W.
  3. Pokud platí H 0 , matematické očekávání náhodné veličiny W se blíží statistice W.
  4. Testování hypotéz začíná volbou hladiny významnosti - a
  5. Vypočítejte meze významnosti (ze symetrie stačí jedna mez) a hranici kritické oblasti W(a)
  6. Platnost nerovnosti W > W(a) udává platnost nulové hypotézy. H 0 se bere na hladině významnosti = a

Poznámky

  1. Wilcoxon, F. (1945). Individuální srovnání podle klasifikačních metod. Biometrie, 1, 80-83.
  2. W Wilcoxonův test . Získáno 10. prosince 2013. Archivováno z originálu 8. prosince 2013.
  3. Wilcoxonův test pro připojené vzorky . Získáno 28. března 2011. Archivováno z originálu dne 26. května 2012.
  4. Chris Wild. Wilcoxonův rank-sum test . NÁHODNÁ SETKÁVÁNÍ: První kurz analýzy a vyvozování dat . John Wiley & Sons, New York (1999). Získáno 7. září 2018. Archivováno z originálu 27. ledna 2019.
  5. 1 2 3 Graham Hole. Neparametrické testy s velkými velikostmi vzorků . Získáno 21. 4. 2017. Archivováno z originálu 12. 7. 2017.