Fisherův přesný test

Fisherův exaktní test  je test statistické významnosti používaný při analýze křížových tabulek pro malé velikosti vzorků . Týká se přesných testů významnosti, protože nepoužívá velké aproximace vzorku (asymptotika, když velikost vzorku má tendenci k nekonečnu).

Pojmenována po vynálezci - Ronaldu Fisherovi , k vytvoření autora podnítila výpověď Muriel Bristol ( ang.  Muriel Bristol ), která tvrdila, že dokázala odhalit, v jakém pořadí se čaj a mléko nalévaly do jejího šálku.

Schůzka

Test se běžně používá ke zkoumání významnosti vztahu mezi dvěma proměnnými ve faktoriální tabulce dimenzí ( kontingenční tabulka ). Hodnota pravděpodobnosti testu se vypočítá, jako kdyby byly známy hodnoty na hranicích tabulky. Například v případě degustace čaje zná paní Bristolová počet šálků s každou přípravou (mléko nebo čaj jako první), takže údajně poskytuje správný počet odhadů v každé kategorii. Jak poukázal Fisher, za předpokladu nulové hypotézy nezávislosti testu to vede k použití hypergeometrického rozdělení pro dané skóre v tabulce.

U velkých vzorků lze v této situaci použít chí-kvadrát test . Tento test však není vhodný, pokud je průměr hodnot v kterékoli z buněk tabulky s danými hranicemi nižší než 10: vypočítané výběrové rozdělení testované statistiky je pouze přibližně rovné teoretickému rozdělení chí-kvadrát. a aproximace je za těchto podmínek nedostatečná (které vznikají, když jsou velikosti vzorků malé nebo jsou data velmi nerovnoměrně rozložena mezi buňkami tabulky). Fisherův test, jak jeho název napovídá, je přesný a lze jej tedy použít bez ohledu na charakteristiky vzorku. Test se stává obtížně vypočítatelným pro velké vzorky nebo dobře vyvážené tabulky, ale naštěstí právě pro tyto podmínky je dobře použitelné Pearsonovo kritérium ( ).

Pro ruční výpočty lze test provést pouze v případě dimenze faktorových tabulek . Princip testu však lze rozšířit na obecný případ tabulek a některé statistické balíčky takové výpočty poskytují (někdy k získání aproximace používají metodu Monte Carlo ).

Příklad

Přesné testy vám umožní získat přesnější analýzu pro malé vzorky nebo data, která jsou řídká. Přesné testy neparametrických studií jsou vhodným statistickým nástrojem pro řešení nevyvážených dat. Nevyvážená data analyzovaná asymptotickými metodami vedou k nespolehlivým výsledkům. Pro velké a dobře vyvážené datové soubory jsou přesné a asymptotické odhady pravděpodobnosti velmi podobné. Ale pro malá, řídká nebo nevyvážená data mohou být přesné a asymptotické odhady zcela odlišné a dokonce vést k opačným závěrům o vyvíjené hypotéze [1] [2] [3] .

Potřeba Fisherova testu vyvstává, když máme data rozdělena do dvou kategorií dvěma samostatnými způsoby. Vzorek adolescentů lze například rozdělit do kategorií na jedné straně podle pohlaví (chlapci a dívky) a na druhé straně podle toho, zda drží či nedrží dietu. Lze předpokládat, že podíl lidí na dietě je vyšší u dívek než u chlapců a chceme zjistit, zda je nějaký pozorovaný rozdíl v podílech statisticky významný.

Data mohou vypadat následovně:

mladí muži dívky Celkový
diety jeden 9 deset
ne na dietě jedenáct 3 čtrnáct
Celkový 12 12 24

Taková data nejsou vhodná pro analýzu chí-kvadrát, protože očekávané hodnoty v tabulce jsou vždy nižší než 10 a počet stupňů volnosti ve faktoriálové tabulce velikostí je vždy jeden.

Otázka, kterou si v souvislosti s těmito údaji klademe, zní: vzhledem k tomu, že 10 z 24 teenagerů drží dietu a že 12 z těchto 24 jsou dívky, jaká je pravděpodobnost, že 10 dietářů je tak nerovnoměrně rozděleno mezi pohlaví? Pokud bychom náhodně vybrali 10 teenagerů, jaká je pravděpodobnost, že 9 z nich bylo vylosováno ze souboru 12 žen a pouze 1 ze souboru 12 chlapců?

Než budeme pokračovat ve studiu Fisherova testu, uveďme si potřebnou notaci. Označme čísla v buňkách písmeny , , a podle toho nazveme součty součtu po řádcích a sloupcích mezní (hraniční) součty a celkový součet znázorníme písmenem .

Nyní tabulka vypadá takto:

Mládež dívky Celkový
Dieta
Ne na dietě
Celkový

Fisher ukázal, že pravděpodobnost získání jakékoli takové množiny veličin je dána hypergeometrickým rozdělením:

kde sloupce v závorkách jsou binomické koeficienty a symbol " " je faktoriálový operátor .

Tento vzorec udává přesnou pravděpodobnost pozorování jakéhokoli konkrétního souboru dat vzhledem k mezním výsledkům, celkovému součtu a nulové hypotéze o stejném sklonu k dietě bez ohledu na pohlaví (poměr mezi těmi, kdo drží dietu a bez diety, je stejný pro chlapce jako pro dívky).

Fisher ukázal, že se můžeme zabývat pouze případy, kdy jsou mezní  součty stejné jako v tabulce výše. Ve výše uvedeném příkladu je takových případů 11. Z nich pouze jeden je tak „vychýlený“ (ve směru ženského sklonu k dietě) jako ukázka:

Mládež dívky Celkový
Dieta 0 deset deset
Ne na dietě 12 2 čtrnáct
Celkový 12 12 24

Abychom mohli posoudit statistickou významnost pozorovaných dat, tedy celkovou pravděpodobnost stejného nebo výraznějšího „vychýlení“ vůči dívkám na dietě, za předpokladu nulové hypotézy , musíme vypočítat pravděpodobnosti hodnot pro obě tyto tabulky a přidat je. To dává tzv. jednostranný test; pro oboustranný test musíme vzít v úvahu i tabulky, které jsou podobně zkreslené, ale v opačném směru (tedy uvažovat případ převážně mužské diety).

Problematické je ale klasifikovat tabulky podle toho, zda nejsou „extrémně zkreslené“. Přístup používaný programovacím jazykem R navrhuje vypočítat hodnotu kritéria sečtením pravděpodobností pro všechny tabulky s pravděpodobnostmi menšími nebo rovnými pravděpodobnostem pozorované tabulky. U tabulek s malým počtem buněk se skóre dvoustranného testu může výrazně lišit od dvojnásobku jednostranného skóre, na rozdíl od případu statistik, které mají symetrickou distribuci vzorku.

Většina moderních statistických balíčků počítá hodnotu Fisherových testů, v některých případech dokonce i tam, kde by byla přijatelná i aproximace chí-kvadrát. Skutečné výpočty provedené statistickými softwarovými balíčky se budou obecně lišit od popsaných. Zejména numerické potíže mohou vyplývat z velkých faktoriálů. Jednoduché, ale o to efektivnější výpočetní přístupy jsou založeny na použití funkce gama nebo logaritmické funkce gama, ale přesný výpočet hypergeometrických a binomických pravděpodobností je oblastí současného výzkumu.

Poznámky

  1. Mehta, ČR 1995. SPSS 6.1 Přesný test pro Windows. Englewood Cliffs, NJ: Prentice Hall
  2. Mehta, ČR, Patel, NR, & Tsiatis, AA 1984. Přesné testování významnosti pro stanovení ekvivalence léčby s uspořádanými kategorickými daty. Biometrie, 40(3), 819-825
  3. Mehta, ČR, Patel, NR 1997. Přesná inference v kategoriálních datech. Biometrie, 53(1), 112-117

Literatura

Odkazy