F-test

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 26. října 2017; kontroly vyžadují 8 úprav .

F-test neboli Fisherův test (F-test, φ*-test) je statistický test , jehož testová statistika má při splnění nulové hypotézy Fisherovo rozdělení (F-rozdělení).

Tak či onak, statistiky testu se snižují na poměr odchylek vzorku (součty čtverců dělené „stupněmi volnosti“). Aby statistika měla Fisherovo rozdělení, čitatel a jmenovatel musí být nezávislé náhodné proměnné a odpovídající součty čtverců musí mít chí-kvadrát rozdělení . To vyžaduje, aby data měla normální rozložení. Kromě toho se předpokládá, že rozptyl náhodných proměnných, jejichž druhé mocniny se sečtou, je stejný.

Test se provádí porovnáním hodnoty statistiky s kritickou hodnotou odpovídajícího Fisherova rozdělení na dané hladině významnosti. Je známo, že pokud , pak . Navíc mají kvantily Fisherova rozdělení vlastnost . Obvykle je tedy v praxi zahrnuta potenciálně velká hodnota v čitateli, menší hodnota ve jmenovateli a porovnání se provádí se „správným“ kvantilem rozdělení. Test však může být jak oboustranný, tak i jednostranný. V prvním případě se pro hladinu významnosti použije kvantil a pro jednostranný test se použije [1] .

Pohodlnějším způsobem testování hypotéz je p-hodnota  , pravděpodobnost, že náhodná veličina s daným Fisherovým rozdělením překročí danou hodnotu statistiky. Pokud je (pro dvoustranný test - )) nižší než hladina významnosti , pak je nulová hypotéza zamítnuta, jinak je přijata.

Příklady F-testů

F-test pro rovnost rozptylů

Dva výběry

Nechť existují dva vzorky o velikosti m a n náhodných veličin X a Y s normálním rozdělením. Je nutné zkontrolovat rovnost jejich rozptylů. Testovací statistiky

kde  je výběrový rozptyl .

Pokud je statistika větší než kritická hodnota odpovídající zvolené hladině významnosti , pak jsou rozptyly náhodných veličin považovány za nestejné.

Vícenásobné výběry

Nechť je vzorek velikosti N náhodné veličiny X rozdělen do k skupin s počtem pozorování v i -té skupině.

Meziskupinová (“vysvětlená”) odchylka:

Rozptyl v rámci skupiny („nevysvětlený“):

Tento test lze zredukovat na testování významnosti regrese proměnné X na fiktivní proměnné - indikátory skupin. Pokud statistika překročí kritickou hodnotu, pak je hypotéza o rovnosti průměrů ve vzorcích zamítnuta, jinak lze průměr považovat za stejný.

Kontrola omezení regresních parametrů

Testovací statistika pro testování lineárních omezení na parametrech klasické normální lineární regrese je určena vzorcem:

kde je počet omezení, n je velikost vzorku, k je počet parametrů modelu, RSS je součet čtverců reziduí modelu, je koeficient determinace, indexy S a L se vztahují ke krátkým a dlouhým modelům , respektive (modely s omezením a modely bez omezení).

Poznámka

Výše popsaný F-test je přesný v případě normálního rozdělení náhodných chyb modelu. F-test lze ale aplikovat i v obecnějším případě. V tomto případě je asymptotická. Odpovídající F-statistiku lze vypočítat ze statistik ostatních asymptotických testů – Waldova (W) testu, Lagrangeova multiplikačního testu (LM) a testu poměru pravděpodobnosti (LR) – takto:

Všechny tyto statistiky mají asymptoticky rozdělení F(q, nk), přestože se jejich hodnoty mohou na malých vzorcích lišit.

Testování významnosti lineární regrese

Tento test je velmi důležitý v regresní analýze a je v podstatě speciálním případem testování omezení. V tomto případě je nulová hypotéza o současné rovnosti nule všech koeficientů pod faktory regresního modelu (tj. celkových omezení k-1). V tomto případě je krátký model pouze konstantou jako faktor, to znamená, že koeficient determinace krátkého modelu je nulový. Statistika testu je:

Pokud je tedy hodnota této statistiky vyšší než kritická hodnota na dané hladině významnosti, pak je nulová hypotéza zamítnuta, což znamená, že regrese je statisticky významná. V opačném případě je model považován za bezvýznamný.

Příklad

Nechť odhadneme lineární regresi podílu výdajů na potraviny na celkových výdajích pro konstantu, logaritmus celkových výdajů, počet dospělých členů rodiny a počet dětí do 11 let. To znamená, že v modelu jsou 4 odhadované parametry (k=4). Nechť koeficient determinace získáme na základě výsledků regresního posouzení . Pomocí výše uvedeného vzorce vypočítáme hodnotu F-statistiky, pokud je regrese odhadnuta z dat 34 pozorování a z dat 64 pozorování:

Kritická hodnota statistiky na 1% hladině významnosti (v Excelu funkce FDISP) je v prvním případě a ve druhém případě . V obou případech je regrese považována za významnou na dané hladině významnosti. V prvním případě je P-hodnota 0,1 % a ve druhém 0,00005 %. Ve druhém případě je tedy důvěra ve významnost regrese výrazně vyšší (pravděpodobnost chyby je mnohem menší, pokud je model rozpoznán jako významný).

Testování heteroskedasticity

Viz Goldfeld-Quandtův test

Viz také

Poznámky

  1. F-Test pro rovnost dvou  rozptylů . NIST . Datum přístupu: 29. března 2017. Archivováno z originálu 9. března 2017.