F-test

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 26. října 2017; kontroly vyžadují 8 úprav .

F-test neboli Fisherův test (F-test, φ*-test) je statistický test , jehož testová statistika má při splnění nulové hypotézy Fisherovo rozdělení (F-rozdělení).

Tak či onak, statistiky testu se snižují na poměr odchylek vzorku (součty čtverců dělené „stupněmi volnosti“). Aby statistika měla Fisherovo rozdělení, čitatel a jmenovatel musí být nezávislé náhodné proměnné a odpovídající součty čtverců musí mít chí-kvadrát rozdělení . To vyžaduje, aby data měla normální rozložení. Kromě toho se předpokládá, že rozptyl náhodných proměnných, jejichž druhé mocniny se sečtou, je stejný.

Test se provádí porovnáním hodnoty statistiky s kritickou hodnotou odpovídajícího Fisherova rozdělení na dané hladině významnosti. Je známo, že pokud , pak . Navíc mají kvantily Fisherova rozdělení vlastnost . Obvykle je tedy v praxi zahrnuta potenciálně velká hodnota v čitateli, menší hodnota ve jmenovateli a porovnání se provádí se „správným“ kvantilem rozdělení. Test však může být jak oboustranný, tak i jednostranný. V prvním případě se pro hladinu významnosti použije kvantil a pro jednostranný test se použije [1] . $F \sim F(m,n)$ $1/F \sim F(n,m)$ $F_{1-\alpha}=1/F_{\alpha}$ $\alpha$ $F_{\alpha/2}$ $F_{\alpha}$

Pohodlnějším způsobem testování hypotéz je p-hodnota , pravděpodobnost, že náhodná veličina s daným Fisherovým rozdělením překročí danou hodnotu statistiky. Pokud je (pro dvoustranný test - )) nižší než hladina významnosti , pak je nulová hypotéza zamítnuta, jinak je přijata. $p(F)$ $p(F)$ $2p (F$ $\alpha$

Příklady F-testů

F-test pro rovnost rozptylů

Dva výběry

Nechť existují dva vzorky o velikosti m a n náhodných veličin X a Y s normálním rozdělením. Je nutné zkontrolovat rovnost jejich rozptylů. Testovací statistiky

$F=\frac {\hat{\sigma}^2_X}{\hat{\sigma}^2_Y}~ \sim ~F(m-1,n-1)$

kde je výběrový rozptyl . ${\klobouk{\sigma}^2}$

Pokud je statistika větší než kritická hodnota odpovídající zvolené hladině významnosti , pak jsou rozptyly náhodných veličin považovány za nestejné.

Vícenásobné výběry

Nechť je vzorek velikosti N náhodné veličiny X rozdělen do k skupin s počtem pozorování v i -té skupině. $n_{i}$

Meziskupinová (“vysvětlená”) odchylka: $\hat{\sigma}^2_{BG}=\sum^k_{i=1} n_i (\overline {x_i}-\overline {x})^2/(k-1)$

Rozptyl v rámci skupiny („nevysvětlený“): $\hat{\sigma}^2_{WG}=\sum^k_{i=1}\sum^{n_i}_{j=1} (x_{ij}-\overline {x}_i)^2/( Nk)$

$F=\frac {\hat{\sigma}^2_{BG}}{\hat{\sigma}^2_{WG}}~\sim~F(k-1,Nk)$

Tento test lze zredukovat na testování významnosti regrese proměnné X na fiktivní proměnné - indikátory skupin. Pokud statistika překročí kritickou hodnotu, pak je hypotéza o rovnosti průměrů ve vzorcích zamítnuta, jinak lze průměr považovat za stejný.

Kontrola omezení regresních parametrů

Testovací statistika pro testování lineárních omezení na parametrech klasické normální lineární regrese je určena vzorcem:

$F={\frac {(RSS_{S}-RSS_{L})/q}{RSS_{L}/(n-k_{L})))={\frac {(R_{L}^ {2}-R_{S}^{2})/q}{(1-R_{L}^{2})/(n-k_{L})}}~\sim ~F(q,n- k_{L})$

kde je počet omezení, n je velikost vzorku, k je počet parametrů modelu, RSS je součet čtverců reziduí modelu, je koeficient determinace, indexy S a L se vztahují ke krátkým a dlouhým modelům , respektive (modely s omezením a modely bez omezení). $q=k_L-k_S$ $R^2$

Poznámka

Výše popsaný F-test je přesný v případě normálního rozdělení náhodných chyb modelu. F-test lze ale aplikovat i v obecnějším případě. V tomto případě je asymptotická. Odpovídající F-statistiku lze vypočítat ze statistik ostatních asymptotických testů – Waldova (W) testu, Lagrangeova multiplikačního testu (LM) a testu poměru pravděpodobnosti (LR) – takto:

$F=\frac {nk}{q} W/n ~,~ F=\frac {nk}{q} \frac {LM} {n-LM} ~,~F=\frac {nk}{q}( e^{LR/n}-1)$ Všechny tyto statistiky mají asymptoticky rozdělení F(q, nk), přestože se jejich hodnoty mohou na malých vzorcích lišit.

Testování významnosti lineární regrese

Tento test je velmi důležitý v regresní analýze a je v podstatě speciálním případem testování omezení. V tomto případě je nulová hypotéza o současné rovnosti nule všech koeficientů pod faktory regresního modelu (tj. celkových omezení k-1). V tomto případě je krátký model pouze konstantou jako faktor, to znamená, že koeficient determinace krátkého modelu je nulový. Statistika testu je:

$F=\frac {R^2/(k-1)}{(1-R^2)/(nk)}~\sim ~F(k-1,nk)$

Pokud je tedy hodnota této statistiky vyšší než kritická hodnota na dané hladině významnosti, pak je nulová hypotéza zamítnuta, což znamená, že regrese je statisticky významná. V opačném případě je model považován za bezvýznamný.

Příklad

Nechť odhadneme lineární regresi podílu výdajů na potraviny na celkových výdajích pro konstantu, logaritmus celkových výdajů, počet dospělých členů rodiny a počet dětí do 11 let. To znamená, že v modelu jsou 4 odhadované parametry (k=4). Nechť koeficient determinace získáme na základě výsledků regresního posouzení . Pomocí výše uvedeného vzorce vypočítáme hodnotu F-statistiky, pokud je regrese odhadnuta z dat 34 pozorování a z dat 64 pozorování: $R^{2}=41,2366\%$ $F_1=\frac {0,412366/(4-1)}{(1-0,412366)/(34-4)}=0,70174*10=7,02$

$F_2=\frac {0,412366/(4-1)}{(1-0,412366)/(64-4)}=0,70174*20=14,04$

Kritická hodnota statistiky na 1% hladině významnosti (v Excelu funkce FDISP) je v prvním případě a ve druhém případě . V obou případech je regrese považována za významnou na dané hladině významnosti. V prvním případě je P-hodnota 0,1 % a ve druhém 0,00005 %. Ve druhém případě je tedy důvěra ve významnost regrese výrazně vyšší (pravděpodobnost chyby je mnohem menší, pokud je model rozpoznán jako významný). $F_{1\%}(3,30)=4,51$ $F_{1\%}(3,60)=4,13$

Testování heteroskedasticity

Viz Goldfeld-Quandtův test

Viz také

Poznámky

↑ F-Test pro rovnost dvou rozptylů . NIST . Datum přístupu: 29. března 2017. Archivováno z originálu 9. března 2017.