Studentův t-test

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 4. listopadu 2020; kontroly vyžadují 3 úpravy .

Studentův t-test  je obecný název pro třídu metod statistického testování hypotéz ( statistické testy ) na základě Studentova rozdělení . Nejběžnější případy aplikace t-testu se týkají kontroly rovnosti průměrů ve dvou vzorcích .

t -statistika je obvykle sestavena podle následujícího obecného principu: v čitateli - náhodná veličina s nulovým matematickým očekáváním (při splnění nulové hypotézy ) a ve jmenovateli - výběrová směrodatná odchylka této náhodné veličiny, získaná jako druhá odmocnina nestranného odhadu rozptylu .

Historie

Toto kritérium bylo vyvinuto Williamem Gossetem pro hodnocení kvality piva v Guinness . V souvislosti se závazky vůči společnosti za nezveřejňování obchodního tajemství (guinnessovo vedení zvažovalo takové využití statistického aparátu při své práci) byl Gossetův článek publikován v roce 1908 v časopise „Biometrics“ pod pseudonymem „Student“ ( Student).

Požadavky na údaje

Pro uplatnění tohoto kritéria je nutné, aby původní data měla normální rozdělení . V případě aplikace dvouvýběrového testu pro nezávislé výběry je také nutné dodržet podmínku rovnosti rozptylů . Existují však alternativy ke Studentovu t-testu pro situace s nestejnými rozptyly.

Požadavek, aby rozložení dat bylo normální, je nezbytný pro exaktní -test. I u jiných distribucí dat je však možné použít -statistics. V mnoha případech mají tyto statistiky asymptoticky standardní normální rozdělení - , takže můžete použít kvantily tohoto rozdělení. Často však i v tomto případě nejsou použity kvantily standardního normálního rozdělení, ale odpovídajícího Studentova rozdělení, jako v přesném testu. Jsou asymptoticky ekvivalentní, nicméně na malých vzorcích jsou intervaly spolehlivosti Studentova rozdělení širší a spolehlivější.

Nejsou-li tyto podmínky splněny, měly by být při porovnávání výběrových průměrů použity obdobné metody neparametrické statistiky , z nichž nejznámější jsou Mann-Whitney U-test (jako dvouvýběrový test pro nezávislé výběry) a dále tzv . znakový test a Wilcoxonův test (používaný v případech závislých vzorků) .

Jednovzorkový t-test

Používá se k testování nulové hypotézy o rovnosti matematického očekávání k nějaké známé hodnotě .

Je zřejmé, že když je splněna nulová hypotéza . S přihlédnutím k předpokládané nezávislosti pozorování . Pomocí nezkresleného odhadu rozptylu získáme následující t-statistiku:

Podle nulové hypotézy je rozdělení této statistiky . Pokud tedy statistická hodnota překročí (absolutně) kritickou hodnotu tohoto rozdělení (na dané hladině významnosti), nulová hypotéza se zamítá.

Dvouvýběrový t-test pro nezávislé vzorky

Nechť existují dva nezávislé vzorky s objemy normálně rozdělených náhodných veličin . Je nutné testovat nulovou hypotézu rovnosti matematických očekávání těchto náhodných veličin pomocí výběrových dat .

Zvažte rozdíl mezi průměrem vzorku . Je zřejmé, že pokud je splněna nulová hypotéza, . Na základě nezávislosti vzorků je rozptyl tohoto rozdílu roven: . Potom pomocí nezkresleného odhadu rozptylu získáme nezkreslený odhad rozptylu rozdílu mezi výběrovými průměry: . Proto t-statistika pro testování nulové hypotézy je

Tato statistika má při platnosti nulové hypotézy rozdělení , kde .

Případ se stejným rozptylem

Pokud se předpokládá, že výběrové rozptyly jsou stejné, pak

Pak je t-statistika:

Tato statistika má rozdělení .

Dvouvýběrový t-test pro závislé vzorky

Pro výpočet empirické hodnoty -kritéria v situaci testování hypotézy o rozdílech mezi dvěma závislými vzorky (například dvěma vzorky stejného testu s časovým odstupem) se používá následující vzorec:

kde  je střední rozdíl hodnot,  je standardní odchylka rozdílů a n je počet pozorování.

Tato statistika má rozdělení .

Lineární omezovací test na parametrech lineární regrese

Pomocí t-testu můžete také testovat libovolné (jediné) lineární omezení na parametrech lineární regrese odhadované běžnou metodou nejmenších čtverců . Nechť je třeba hypotézu otestovat . Je zřejmé, že když je splněna nulová hypotéza . Zde je použita vlastnost nezkreslených LSM-odhadů parametrů modelu . Kromě toho . Použitím jeho nezkresleného odhadu namísto neznámého rozptylu získáme následující t-statistiku:

Tato statistika, když je splněna nulová hypotéza, má rozdělení , takže pokud je hodnota statistiky vyšší než kritická hodnota, pak je nulová hypotéza lineárního omezení zamítnuta.

Testování hypotéz koeficientu lineární regrese

Speciálním případem lineárního omezení je testování hypotézy, že regresní koeficient je roven určité hodnotě . V tomto případě je odpovídající t-statistika:

kde  je standardní chyba odhadu koeficientu a je druhá odmocnina odpovídajícího diagonálního prvku kovarianční matice odhadů koeficientů.

Pokud je nulová hypotéza pravdivá, je rozdělení této statistiky . Pokud je absolutní hodnota statistiky vyšší než kritická hodnota, pak je rozdíl mezi koeficientem od statisticky významný (nenáhodný), jinak je nevýznamný (náhodný, to znamená, že skutečný koeficient je pravděpodobně roven nebo velmi blízko na očekávanou hodnotu ).

Poznámka

Jednovýběrový test pro matematická očekávání lze zredukovat na testování lineárního omezení parametrů lineární regrese. V jednovýběrovém testu se jedná o „regresi“ na konstantu. Proto je regrese vzorový odhad rozptylu zkoumané náhodné proměnné, matice je a odhad „koeficientu“ modelu se rovná průměru vzorku. Z toho získáme výraz pro t-statistiku uvedenou výše pro obecný případ.

Podobně lze ukázat, že dvouvýběrový test se stejnými výběrovými rozptyly se také redukuje na testování lineárních omezení. Ve dvouvýběrovém testu se jedná o "regresi" na konstantu a fiktivní proměnnou, která identifikuje dílčí vzorek v závislosti na hodnotě (0 nebo 1): . Hypotézu o rovnosti matematických očekávání vzorků lze formulovat jako hypotézu o rovnosti koeficientu b tohoto modelu k nule. Lze ukázat, že odpovídající t-statistika pro testování této hypotézy je rovna t-statistice uvedené pro dvouvýběrový test.

Může být také redukován na kontrolu lineárního omezení v případě různých odchylek. V tomto případě má rozptyl chyb modelu dvě hodnoty. Na základě toho lze také získat t-statistiky podobné těm, které jsou uvedeny pro dvouvýběrový test.

Neparametrické analogy

Obdobou dvouvzorkového testu pro nezávislé vzorky je Mann-Whitney U-test . Pro situaci se závislými vzorky jsou analogy znaménkový test a Wilcoxonův T-test .

Literatura

student. Pravděpodobná chyba průměru. // Biometrika. 1908. č. 6 (1). S. 1-25.

Odkazy

O kritériích pro testování hypotéz o homogenitě prostředků na webových stránkách Státní technické univerzity v Novosibirsku