Pearsonův test dobré shody nebo test dobré shody (chí-kvadrát) je neparametrická metoda, která umožňuje posoudit významnost rozdílů mezi skutečným (odhaleným jako výsledek studie) počtem výsledků resp. kvalitativní charakteristiky vzorku, které spadají do každé kategorie, a teoretický počet, který lze ve studovaných skupinách očekávat, pokud platí nulová hypotéza. Jednodušeji řečeno, metoda umožňuje vyhodnotit statistickou významnost rozdílů mezi dvěma nebo více relativními ukazateli (četnosti, podíly).
Je to nejčastěji používané kritérium pro testování hypotézy , že pozorovaná velikost vzorku patří k nějakému teoretickému zákonu rozdělení .
Kritérium chí-kvadrát pro analýzu kontingenčních tabulek bylo vyvinuto a navrženo v roce 1900 zakladatelem matematické statistiky , anglickým vědcem Karlem Pearsonem .
Kritérium lze použít k testování jednoduchých hypotéz formuláře
kde je známý vektor parametrů teoretického zákona a při testování složitých hypotéz tvaru
když se odhad skalárního nebo vektorového distribučního parametru vypočítá ze stejného vzorku.
Postup testování hypotéz pomocí typových kritérií zahrnuje seskupování pozorování. Oblast definice náhodné veličiny je rozdělena do neprotínajících se intervalů hraničními body
kde je dolní mez definičního oboru náhodné proměnné; - horní okraj.
V souladu s daným oddílem se vypočítá počet vzorových hodnot, které spadají do tého intervalu, a pravděpodobnosti spadnutí do intervalu
odpovídající teoretickému zákonu s distribuční funkcí
V čem
aPři testování jednoduché hypotézy je známa jak forma zákona, tak všechny jeho parametry (známý je skalární nebo vektorový parametr ).
Statistiky používané v testech dobré shody tohoto typu jsou založeny na měření odchylek od .
Pearsonova statistika dobré shody je určena vztahem
V případě testování jednoduché hypotézy, v limitě at , se tato statistika řídí -rozdělením se stupni volnosti, pokud je testovaná hypotéza pravdivá . Hustota -distribuce, což je speciální případ gama distribuce , je popsána vzorcem
Testovaná hypotéza je zamítnuta pro velké hodnoty statistiky, kdy hodnota statistiky vypočítaná ze vzorku je větší než kritická hodnota
nebo dosažená hladina významnosti ( p - hodnota ) je nižší než daná hladina významnosti (daná pravděpodobnost chyby 1. druhu ) .
Při testování složitých hypotéz, pokud jsou parametry zákona pro stejný vzorek odhadnuty jako výsledek minimalizace statistiky nebo pro seskupený vzorek pomocí metody maximální věrohodnosti , pak se statistika , pokud je testovaná hypotéza pravdivá, řídí rozdělením s stupně volnosti, kde je počet parametrů odhadnutých ze vzorku.
Pokud jsou parametry odhadnuty z původního neseskupeného vzorku, pak rozdělení statistiky nebude -distribuce [ 1] . Navíc distribuce statistik, pokud je hypotéza pravdivá , bude záviset na metodě seskupování, tedy na tom, jak je doména definice rozdělena do intervalů [2] .
Při odhadování metody maximální věrohodnosti parametrů pro neseskupený vzorek můžete použít upravená kritéria jako [3] [4] [5] [6] .
Při použití kritérií dobré shody se zpravidla nestanovují žádné konkurenční hypotézy: vzorek patří k určitému zákonu a jako konkurenční hypotéza se považuje jakýkoli jiný zákon. Kritérium bude přirozeně schopno odlišit se od odpovídajícího zákona různými způsoby, zákony mu blízké nebo vzdálené. Pokud specifikujeme konkurenční hypotézu a nějaký konkurenční zákon jí odpovídající , pak již můžeme hovořit o chybách dvou typů: nejen o chybě 1. druhu (zamítnutí testované hypotézy, když je pravdivá) a pravděpodobnosti tuto chybu , ale také o chybu 2. druhu (neodmítnutí pod spravedlností ) a pravděpodobnost této chyby .
Sílu kritéria ve vztahu ke konkurenční hypotéze charakterizuje hodnota . Čím lépe kritérium rozpozná dvojici konkurenčních hypotéz a tím vyšší je jeho síla.
Síla Pearsonova testu dobré shody významně závisí na způsobu seskupování [7] [8] a na zvoleném počtu intervalů [8] [9] .
Při asymptoticky optimálním seskupování, které maximalizuje různé funkcionality Fisherovy informační matice nad seskupenými daty (minimalizuje ztráty spojené se seskupováním), má Pearsonův test dobré shody maximální sílu vzhledem k „(velmi) blízkým“ konkurenčním hypotézám [ 10] [8] [9] .
Při testování jednoduchých hypotéz a použití asymptoticky optimálního seskupování má Pearsonův test dobré shody výhodu oproti neparametrickým testům dobré shody. Při testování komplexních hypotéz se síla neparametrických kritérií zvyšuje a žádná taková výhoda neexistuje [11] [12] . Pro libovolnou dvojici konkurenčních hypotéz (konkurujících zákonů) je však možné volbou počtu intervalů a způsobu rozdělení definičního oboru náhodné veličiny na intervaly maximalizovat sílu kritéria [13] .