Kruskal-Wallisův test je určen k testování rovnosti mediánů více vzorků . Tento test je vícerozměrným zobecněním Wilcoxon-Mann-Whitneyho testu . Kruskal-Wallisovo kritérium je hodnostní , takže je invariantní s ohledem na jakoukoli monotónní transformaci měřítka .
Také známý jako: Kruskal-Wallisův H-test, Kruskal - Wallisův jednosměrná analýza rozptylu , Kruskal -Wallisův test . Pojmenována po amerických matematicích Williamu Kruskalovi a Allenu Wallisovi .
Probíhá mistrovství světa. První vzorek je průzkum fanoušků s otázkou „Jaké jsou šance ukrajinského týmu na vítězství?“ před začátkem šampionátu. Druhý vzorek je po první hře, třetí je po druhém zápase atd. Hodnoty ve vzorcích jsou šance Ukrajiny na výhru na desetibodové škále (1 — „žádné vyhlídky“, 10 — „vzít pohár na Ukrajinu je otázkou času“). Je třeba zkontrolovat, zda výsledky anket závisí na průběhu mistrovství.
Ukázky jsou uvedeny:
.Kombinovaný výběr bude vypadat takto:
Další odhady:
Nulová hypotéza je testována s alternativou .
Seřaďme všechny prvky vzorků vzestupně a označme pořadí -tého prvku -tého vzorku ve výsledné variační řadě .
Statistika Kruskal-Wallisova testu pro testování hypotézy posunu polohových parametrů dvou porovnávaných vzorků má podobu:
,kde
; .Hypotéza posunu je zamítnuta na hladině významnosti if , kde je kritická hodnota, at a vypočítá se z tabulek. Pro větší hodnoty jsou použitelné různé aproximace.
Nechat
; ; ; .Pak , pokud nedojde k posunu, bude mít statistika -distribuci s a stupni volnosti. Nulová hypotéza je tedy zamítnuta na hladině významnosti, jestliže .
Podle ní je hypotéza nulového posunu s jistotou zamítnuta , jestliže , kde ; a jsou to kritické hodnoty Fisherovy a chí-kvadrát statistiky s odpovídajícími stupni volnosti.
To je lepší aproximace než Kruskal-Wallisova aproximace. V případě souvisejících pořadí (to znamená, že se hodnoty hodnot z různých vzorků shodují a jsou jim přiřazeny stejné průměrné úrovně), je nutné použít upravenou statistiku , kde ; je velikost té skupiny identických prvků; je počet skupin identických prvků. V , platí aproximace rozdělení statistik ; -rozdělení se stupni volnosti, to znamená, že nulová hypotéza je zamítnuta, pokud .