Pearsonův test dobré shody

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 9. listopadu 2021; ověření vyžaduje 1 úpravu .

Pearsonův test dobré shody nebo test dobré shody (chí-kvadrát)  je neparametrická metoda, která umožňuje posoudit významnost rozdílů mezi skutečným (odhaleným jako výsledek studie) počtem výsledků resp. kvalitativní charakteristiky vzorku, které spadají do každé kategorie, a teoretický počet, který lze ve studovaných skupinách očekávat, pokud platí nulová hypotéza. Jednodušeji řečeno, metoda umožňuje vyhodnotit statistickou významnost rozdílů mezi dvěma nebo více relativními ukazateli (četnosti, podíly).

Je to nejčastěji používané kritérium pro testování hypotézy , že pozorovaná velikost vzorku patří k nějakému teoretickému zákonu rozdělení .

Kritérium chí-kvadrát pro analýzu kontingenčních tabulek bylo vyvinuto a navrženo v roce 1900 zakladatelem matematické statistiky , anglickým vědcem Karlem Pearsonem .

Kritérium lze použít k testování jednoduchých hypotéz formuláře

kde  je známý vektor parametrů teoretického zákona a při testování složitých hypotéz tvaru

když se odhad skalárního nebo vektorového distribučního parametru vypočítá ze stejného vzorku.

Statistika kritérií

Postup testování hypotéz pomocí typových kritérií zahrnuje seskupování pozorování. Oblast definice náhodné veličiny je rozdělena do neprotínajících se intervalů hraničními body

kde  je dolní mez definičního oboru náhodné proměnné;  - horní okraj.

V souladu s daným oddílem se vypočítá počet vzorových hodnot, které spadají do tého intervalu, a pravděpodobnosti spadnutí do intervalu

odpovídající teoretickému zákonu s distribuční funkcí

V čem

a

Při testování jednoduché hypotézy je známa jak forma zákona, tak všechny jeho parametry (známý je skalární nebo vektorový parametr ).

Statistiky používané v testech dobré shody tohoto typu jsou založeny na měření odchylek od .

Pearsonova statistika dobré shody je určena vztahem

V případě testování jednoduché hypotézy, v limitě at , se tato statistika řídí -rozdělením se stupni volnosti, pokud je testovaná hypotéza pravdivá . Hustota -distribuce, což je speciální případ gama distribuce , je popsána vzorcem

Testovaná hypotéza je zamítnuta pro velké hodnoty statistiky, kdy hodnota statistiky vypočítaná ze vzorku je větší než kritická hodnota

nebo dosažená hladina významnosti ( p - hodnota ) je nižší než daná hladina významnosti (daná pravděpodobnost chyby 1. druhu ) .

Testování komplexních hypotéz

Při testování složitých hypotéz, pokud jsou parametry zákona pro stejný vzorek odhadnuty jako výsledek minimalizace statistiky nebo pro seskupený vzorek pomocí metody maximální věrohodnosti , pak se statistika , pokud je testovaná hypotéza pravdivá, řídí rozdělením s stupně volnosti, kde  je počet parametrů odhadnutých ze vzorku.

Pokud jsou parametry odhadnuty z původního neseskupeného vzorku, pak rozdělení statistiky nebude -distribuce [ 1] . Navíc distribuce statistik, pokud je hypotéza pravdivá , bude záviset na metodě seskupování, tedy na tom, jak je doména definice rozdělena do intervalů [2] .

Při odhadování metody maximální věrohodnosti parametrů pro neseskupený vzorek můžete použít upravená kritéria jako [3] [4] [5] [6] .

O síle kritéria

Při použití kritérií dobré shody se zpravidla nestanovují žádné konkurenční hypotézy: vzorek patří k určitému zákonu a jako konkurenční hypotéza se považuje jakýkoli jiný zákon. Kritérium bude přirozeně schopno odlišit se od odpovídajícího zákona různými způsoby, zákony mu blízké nebo vzdálené. Pokud specifikujeme konkurenční hypotézu a nějaký konkurenční zákon jí odpovídající , pak již můžeme hovořit o chybách dvou typů: nejen o chybě 1. druhu (zamítnutí testované hypotézy, když je pravdivá) a pravděpodobnosti tuto chybu , ale také o chybu 2. druhu (neodmítnutí pod spravedlností ) a pravděpodobnost této chyby .

Sílu kritéria ve vztahu ke konkurenční hypotéze charakterizuje hodnota . Čím lépe kritérium rozpozná dvojici konkurenčních hypotéz a tím vyšší je jeho síla.

Síla Pearsonova testu dobré shody významně závisí na způsobu seskupování [7] [8] a na zvoleném počtu intervalů [8] [9] .

Při asymptoticky optimálním seskupování, které maximalizuje různé funkcionality Fisherovy informační matice nad seskupenými daty (minimalizuje ztráty spojené se seskupováním), má Pearsonův test dobré shody maximální sílu vzhledem k „(velmi) blízkým“ konkurenčním hypotézám [ 10] [8] [9] .

Při testování jednoduchých hypotéz a použití asymptoticky optimálního seskupování má Pearsonův test dobré shody výhodu oproti neparametrickým testům dobré shody. Při testování komplexních hypotéz se síla neparametrických kritérií zvyšuje a žádná taková výhoda neexistuje [11] [12] . Pro libovolnou dvojici konkurenčních hypotéz (konkurujících zákonů) je však možné volbou počtu intervalů a způsobu rozdělení definičního oboru náhodné veličiny na intervaly maximalizovat sílu kritéria [13] .

Viz také

Poznámky

  1. Chernoff H., Lehmann EL Použití odhadů maximální věrohodnosti v testu dobré shody  //  The Annals of Mathematical Statistics. - 1954. - Sv. 25 . - str. 579-586 .
  2. Lemeshko B. Yu., Postovalov S. N. O závislosti limitních rozdělení Pearsonovy statistiky a pravděpodobnostního poměru na metodě seskupování dat  // Industrial Laboratory. - 1998. - T. 64 , no. 5 . - S. 56-63 .
  3. Nikulin M.S. Chí-kvadrát test pro spojitá rozdělení s parametry posunu a měřítka  // Teorie pravděpodobnosti a její aplikace. - 1973. - T. XVIII , no. 3 . - S. 583-591 .
  4. Nikulin M.S. O kritériu chí-kvadrát pro spojitá rozdělení  // Teorie pravděpodobnosti a její aplikace. - 1973. - T. XVIII , no. 3 . - S. 675-676 .
  5. Rao KC, Robson DS Statistika chí-kvadrát pro testy dobré shody v rámci exponenciální rodiny  //  Commun. statista. - 1974. - Sv. 3 . - S. 1139-1153 .
  6. Greenwood PE, Nikulin MS Průvodce testováním chí-kvadrát  . — New York: John Wiley & Sons, 1996. — 280 s.
  7. Lemeshko B. Yu : Asymptoticky optimální seskupení pozorování v kritériích dobré shody  // Tovární laboratoř. - 1998. - T. 64 , no. 1 . - S. 56-64 .
  8. 1 2 3 R 50.1.033-2001. Doporučení pro standardizaci. Aplikovaná statistika. Pravidla pro kontrolu shody mezi experimentálním rozdělením a teoretickým. Část I. Chí-kvadrát testy . - M . : Nakladatelství norem, 2006. - 87 s.
  9. 1 2 Lemeshko B. Yu., Chimitova E. V. O volbě počtu intervalů v kritériích typové shody  // Tovární laboratoř. materiálová diagnostika. - 2003. - T. 69 , no. 1 . - S. 61-67 .
  10. Denisov V. I., Lemeshko B. Yu. Optimální seskupování při zpracování experimentálních dat // Měřící informační systémy. - Novosibirsk, 1979. - S. 5-14.
  11. Lemeshko B. Yu., Lemeshko S. B., Postovalov S. N. Srovnávací analýza síly testů dobré shody za blízkých konkurenčních hypotéz. I. Testování jednoduchých hypotéz  // Siberian Journal of Industrial Mathematics. - 2008. - T. 11 , no. 2(34) . - S. 96-111 .
  12. Lemeshko B. Yu., Lemeshko S. B., Postovalov S. N. Srovnávací analýza síly testů dobré shody s blízkými alternativami. II. Testování komplexních hypotéz  // Siberian Journal of Industrial Mathematics. - 2008. - T. 11 , no. 4(36) . - S. 78-93 .
  13. Lemeshko B. Yu., Lemeshko S. B., Postovalov S. N., Chimitova E. V. Statistická analýza dat, modelování a studium pravděpodobnostních vzorů. Počítačový přístup . - Novosibirsk: Nakladatelství NSTU, 2011. - 888 s. — (Monografie NSTU). — ISBN 978-5-7782-1590-0 . — Oddíl 4.9.

Literatura

Viz také

Odkazy