F-test neboli Fisherův test (F-test, φ*-test) je statistický test , jehož testová statistika má při splnění nulové hypotézy Fisherovo rozdělení (F-rozdělení).
Tak či onak, statistiky testu se snižují na poměr odchylek vzorku (součty čtverců dělené „stupněmi volnosti“). Aby statistika měla Fisherovo rozdělení, čitatel a jmenovatel musí být nezávislé náhodné proměnné a odpovídající součty čtverců musí mít chí-kvadrát rozdělení . To vyžaduje, aby data měla normální rozložení. Kromě toho se předpokládá, že rozptyl náhodných proměnných, jejichž druhé mocniny se sečtou, je stejný.
Test se provádí porovnáním hodnoty statistiky s kritickou hodnotou odpovídajícího Fisherova rozdělení na dané hladině významnosti. Je známo, že pokud , pak . Navíc mají kvantily Fisherova rozdělení vlastnost . Obvykle je tedy v praxi zahrnuta potenciálně velká hodnota v čitateli, menší hodnota ve jmenovateli a porovnání se provádí se „správným“ kvantilem rozdělení. Test však může být jak oboustranný, tak i jednostranný. V prvním případě se pro hladinu významnosti použije kvantil a pro jednostranný test se použije [1] .
Pohodlnějším způsobem testování hypotéz je p-hodnota , pravděpodobnost, že náhodná veličina s daným Fisherovým rozdělením překročí danou hodnotu statistiky. Pokud je (pro dvoustranný test - )) nižší než hladina významnosti , pak je nulová hypotéza zamítnuta, jinak je přijata.
Nechť existují dva vzorky o velikosti m a n náhodných veličin X a Y s normálním rozdělením. Je nutné zkontrolovat rovnost jejich rozptylů. Testovací statistiky
kde je výběrový rozptyl .
Pokud je statistika větší než kritická hodnota odpovídající zvolené hladině významnosti , pak jsou rozptyly náhodných veličin považovány za nestejné.
Vícenásobné výběryNechť je vzorek velikosti N náhodné veličiny X rozdělen do k skupin s počtem pozorování v i -té skupině.
Meziskupinová (“vysvětlená”) odchylka:
Rozptyl v rámci skupiny („nevysvětlený“):
Tento test lze zredukovat na testování významnosti regrese proměnné X na fiktivní proměnné - indikátory skupin. Pokud statistika překročí kritickou hodnotu, pak je hypotéza o rovnosti průměrů ve vzorcích zamítnuta, jinak lze průměr považovat za stejný.
Testovací statistika pro testování lineárních omezení na parametrech klasické normální lineární regrese je určena vzorcem:
kde je počet omezení, n je velikost vzorku, k je počet parametrů modelu, RSS je součet čtverců reziduí modelu, je koeficient determinace, indexy S a L se vztahují ke krátkým a dlouhým modelům , respektive (modely s omezením a modely bez omezení).
PoznámkaVýše popsaný F-test je přesný v případě normálního rozdělení náhodných chyb modelu. F-test lze ale aplikovat i v obecnějším případě. V tomto případě je asymptotická. Odpovídající F-statistiku lze vypočítat ze statistik ostatních asymptotických testů – Waldova (W) testu, Lagrangeova multiplikačního testu (LM) a testu poměru pravděpodobnosti (LR) – takto:
Všechny tyto statistiky mají asymptoticky rozdělení F(q, nk), přestože se jejich hodnoty mohou na malých vzorcích lišit.
Tento test je velmi důležitý v regresní analýze a je v podstatě speciálním případem testování omezení. V tomto případě je nulová hypotéza o současné rovnosti nule všech koeficientů pod faktory regresního modelu (tj. celkových omezení k-1). V tomto případě je krátký model pouze konstantou jako faktor, to znamená, že koeficient determinace krátkého modelu je nulový. Statistika testu je:
Pokud je tedy hodnota této statistiky vyšší než kritická hodnota na dané hladině významnosti, pak je nulová hypotéza zamítnuta, což znamená, že regrese je statisticky významná. V opačném případě je model považován za bezvýznamný.
PříkladNechť odhadneme lineární regresi podílu výdajů na potraviny na celkových výdajích pro konstantu, logaritmus celkových výdajů, počet dospělých členů rodiny a počet dětí do 11 let. To znamená, že v modelu jsou 4 odhadované parametry (k=4). Nechť koeficient determinace získáme na základě výsledků regresního posouzení . Pomocí výše uvedeného vzorce vypočítáme hodnotu F-statistiky, pokud je regrese odhadnuta z dat 34 pozorování a z dat 64 pozorování:
Kritická hodnota statistiky na 1% hladině významnosti (v Excelu funkce FDISP) je v prvním případě a ve druhém případě . V obou případech je regrese považována za významnou na dané hladině významnosti. V prvním případě je P-hodnota 0,1 % a ve druhém 0,00005 %. Ve druhém případě je tedy důvěra ve významnost regrese výrazně vyšší (pravděpodobnost chyby je mnohem menší, pokud je model rozpoznán jako významný).