Welchův t-test

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 19. května 2022; ověření vyžaduje 1 úpravu .

Welchův t-test je test založený na Studentově rozdělení a určený k testování statistické hypotézy o rovnosti matematických očekávání náhodných veličin, které nemusí mít nutně stejné známé rozptyly. Jedná se o modifikaci Studentova t-testu . Pojmenováno po britském statistikovi Bernardu Lewisovi Welchovi.

Pozadí

Pro aplikaci dvouvýběrového Studentova t-testu je nutné, aby dva nezávislé výběry měly normální rozdělení středních hodnot a skutečné rozptyly byly stejné. V případě Welchova t-testu už nemusí být skutečné rozptyly stejné, ale předpoklad, že data jsou normálně rozdělena, zůstává.

Výpočetní statistika

Nechť jsou dány dva nezávislé vzorky normálně rozdělených náhodných veličin:

$X_{1},...,X_{n_{x}}\sim {\mathcal {N}}(\mu _{x},\sigma _{x}^{2})$

$Y_{1},...,Y_{n_{y))\sim {\mathcal {N))(\mu _{y},\sigma _{y}^{2})$

Testujeme následující nulovou hypotézu o rovnosti matematických očekávání:

${\displaystyle H_{0}:\mu _{x}=\mu _{y))$

Nechť je pravdivá nulová hypotéza. Potom a . Nechť a být nezkreslené odhady rozptylů , resp. Spočítejme si následující statistiky: $E({\overline {X}}-{\overline {Y}})=0$ $Var({\overline {X}}-{\overline {Y)))={\dfrac {\sigma _{x}^{2}}{n_{x}}}+{\dfrac {\ sigma _{y}^{2}}{n_{y}}}$ ${\hat {\sigma }}_{x}^{2}=\sum _{i=1}^{n_{x}}{\dfrac {(X_{i}-{\overline {X }})^{2}}{n_{x}-1}}$ ${\hat {\sigma }}_{y}^{2}=\sum _{i=1}^{n_{y}}{\dfrac {(Y_{i}-{\overline {Y }})^{2}}{n_{y}-1}}$ ${\displaystyle \sigma _{x}^{2))$ ${\displaystyle \sigma _{y}^{2))$

$t={\dfrac ({\bar {X}}-{\bar {Y}}}}{\sqrt ({\widehat {Var}} ({\bar {X}}-{\bar {Y ))))))={\dfrac {{\bar {X}}-{\bar {Y}}}{\sqrt ({\widehat {Var}}({\bar {X}})+{\ widehat {Var}}({\bar {Y}})))}={\dfrac {{\bar {X}}-{\bar {Y}}}{\sqrt ({\dfrac {{\hat { \sigma }}_{x}^{2}}{n_{x}}}+{\dfrac ({\hat {\sigma }}_{y}^{2}}{n_{y}}}} }}$

Udělejme následující transformaci:

$t={\dfrac ({\bar {X))-{\bar {Y))}{\sqrt ({\dfrac ({\hat {\sigma ))_{x}^{2)) {n_{x}}}+{\dfrac {{\hat {\sigma }}_{y}^{2}}{n_{y}}}}}}={\dfrac {{\bar {X} }-{\bar {Y}}}{\sqrt {{\dfrac {\sigma _{x}^{2}}{n_{x}}}+{\dfrac {\sigma _{y}^{2 }}{n_{y}}}}}}\cdot {\dfrac {\sqrt {{\dfrac {\sigma _{x}^{2}}{n_{x}}}+{\dfrac {\sigma _{y}^{2}}{n_{y}}}}}{\sqrt {{\dfrac {{\hat {\sigma }}_{x}^{2}}{n_{x}}} +{\dfrac {{\hat {\sigma }}_{y}^{2}}{n_{y}}}}}}$

Rozdělení první statistiky je standardní normální rozdělení:

${\dfrac {{\bar {X}}-{\bar {Y}}}{\sqrt ({\dfrac {\sigma _{x}^{2}}{n_{x}}}+ {\dfrac {\sigma _{y}^{2}}{n_{y}}}}}}\sim {\mathcal {N}}(0,1)$

Zvažte druhou statistiku a zavolejte ji pro další výpočty : $S$

$S={\dfrac {{\dfrac {\sigma _{x}^{2}}{n_{x}}}+{\dfrac {\sigma _{y}^{2}}{n_{ y)))){{\dfrac {{\hat {\sigma }}_{x}^{2}}{n_{x}}}}+{\dfrac {{\hat {\sigma }}_{y }^{2}}{n_{y}}}}}$

Statistika připomíná chí-kvadrát náhodnou proměnnou dělenou stupni volnosti, ale není. Nechť je náhodná veličina s rozdělením chí-kvadrát se stupni volnosti. Pak , stejně jako . Nyní si všimněte, že (protože používáme nestranné odhady rozptylů) a . $S$ ${\displaystyle Z\sim \chi _{d}^{2))$ $d$ ${\dfrac {Z}{d}}\geqslant 0$ $S\geqslant 0$ $E(S)=1$ $E\left({\dfrac {Z}{d}}\right)={\dfrac {E(Z)}{d}}={\dfrac {d}{d}}=1$

Protože chceme, aby to bylo co nejpodobnější , pak srovnáme rozptyly těchto náhodných proměnných: $S$ ${\dfrac {Z}{d}}\sim {\dfrac {\chi _{d}^{2}}{d}}$

$Var(S)=Var\left({\dfrac {Z}{d}}\right)={\dfrac {2}{d}}$

Vypočítejte rozptyl náhodné veličiny : $S$

$Var(S)={\dfrac {1}{\left({\dfrac {\sigma _{x}^{2}}{n_{x}}}+{\dfrac {\sigma _{y }^{2}}{n_{y}}}\right)^{2}}}\left({\dfrac {1}{n_{x}^{2}}}Var({\hat {\sigma }}_{x}^{2})+{\dfrac {1}{n_{y}^{2}}}Var({\hat {\sigma }}_{y}^{2})\right )={\dfrac {1}{\left({\dfrac {\sigma _{x}^{2}}{n_{x}}}+{\dfrac {\sigma _{y}^{2}} {n_{y}}}\right)^{2}}}\left({\dfrac {2(\sigma _{x}^{2})^{2}}{n_{x}^{2} (n_{x}-1)}}+{\dfrac {2(\sigma _{y}^{2})^{2}}{n_{y}^{2}(n_{y}-1) }}\right)={\dfrac {2}{d}}$

Odtud:

$d={\dfrac {\left({\dfrac {\sigma _{x}^{2}}{n_{x}}}+{\dfrac {\sigma _{y}^{2}} {n_{y}}}\right)^{2}}{{\dfrac {\sigma _{x}^{4}}{n_{x}^{2}(n_{x}-1))) +{\dfrac {\sigma _{y}^{4}}{n_{y}^{2}(n_{y}-1)))}}$

Nakonec máme, za platnosti nulové hypotézy:

$t{\stackrel {cca}{\sim }}t_{d}$ ,

kde se nachází jako: $d$

$d={\dfrac {\left({\dfrac {\sigma _{x}^{2}}{n_{x}}}+{\dfrac {\sigma _{y}^{2}} {n_{y}}}\right)^{2}}{{\dfrac {\sigma _{x}^{4}}{n_{x}^{2}(n_{x}-1))) +{\dfrac {\sigma _{y}^{4}}{n_{y}^{2}(n_{y}-1)))}}$

S dostatečně velkými velikostmi vzorků můžeme použít normální aproximaci:

$t={\dfrac ({\bar {X))-{\bar {Y))}{\sqrt ({\dfrac ({\hat {\sigma ))_{x}^{2)) {n_{x}}}+{\dfrac {{\hat {\sigma }}_{y}^{2}}{n_{y}}}}}}}{\xrightarrow[{n_{x},n_ {y}\rightarrow \infty }]{}}{\mathcal {N}}(0,1)$

Welchův dvouvýběrový t-test pro nezávislé vzorky

Nechť jsou dány dva nezávislé vzorky normálně rozdělených náhodných veličin:

$X_{1},...,X_{n_{x}}\sim {\mathcal {N}}(\mu _{x},\sigma _{x}^{2})$

$Y_{1},...,Y_{n_{y))\sim {\mathcal {N))(\mu _{y},\sigma _{y}^{2})$

V rámci nulové hypotézy vypočítáme následující statistiky: ${\displaystyle H_{0}:\mu _{x}=\mu _{y))$

$t={\dfrac ({\bar {X))-{\bar {Y))}{\sqrt ({\dfrac ({\hat {\sigma ))_{x}^{2)) {n_{x}}}+{\dfrac {{\hat {\sigma }}_{y}^{2}}{n_{y}}}}}}$

Nechť je alternativní hypotéza . ${\displaystyle H_{1}:\mu _{x}\neq \mu _{y))$

Pokud je nulová hypotéza pravdivá, rozdělení bude přibližně Studentovo rozdělení se stupni volnosti: $t$ $d$

$t{\stackrel {cca}{\sim }}t_{d}$ ,

kde se nachází jako: $d$

$d={\dfrac {\left({\dfrac {\sigma _{x}^{2}}{n_{x}}}+{\dfrac {\sigma _{y}^{2}} {n_{y}}}\right)^{2}}{{\dfrac {\sigma _{x}^{4}}{n_{x}^{2}(n_{x}-1))) +{\dfrac {\sigma _{y}^{4}}{n_{y}^{2}(n_{y}-1)))}}$

Pokud tedy hodnota sledované statistiky v absolutní hodnotě překročí kritickou hodnotu tohoto rozdělení (na dané hladině významnosti), je nulová hypotéza zamítnuta.

Příklad

V následujících příkladech porovnáme Studentův t-test a Welchův t-test. Ukázky generuje modul numpy.random pro programovací jazyk Python .

U všech tří příkladů budou matematická očekávání stejná , resp. $\mu _{x}=20$ $\mu _{y}=22$

V prvním příkladu jsou skutečné odchylky ( ) a velikosti vzorků jsou ( ). Označte pomocí a jako odpovídající náhodné vzorky: $\sigma _{x}^{2}=\sigma _{y}^{2}=4$ $n_{x}=n_{y}=15$ $S_{X}$ $S_{Y}$

{\displaystyle {\begin{aligned}S_{X}&=\{19.17,21.41,23.83,15.72,21.44,20.93,21.53,21.76,21.62,18.11,19.74,18.29,23\17.\17. S_{Y}&=\{19.71,22.77,22.85,26.21,21.60,21.50,25.43,21.45,24.69,22.69,20.21,26.24,21.43}22.49,20.7.

Ve druhém příkladu jsou skutečné rozptyly nestejné ( , ) a velikosti vzorků jsou nestejné ( , ). Menší vzorek má větší rozptyl: $\sigma _{x}^{2}=16$ $\sigma _{y}^{2}=1$ $n_{x}=10$ $n_{y}=20$

{\displaystyle {\begin{aligned}S_{X}&=\{18.33,22.82,27.66,11.43,22.88,21.87,23.07,23.53,23.24,16.21\}\\S_{Y}&=7,\{21. 21.37,20.56,22.65,22.98,20.86,22.39,22.43,24.11,21.80,21.75,23.71,21.73,23.35,22.34,21.10\21.28}}.

Ve třetím příkladu jsou skutečné rozptyly nestejné ( , ) a velikosti vzorků jsou nestejné ( , ). Větší vzorek má větší rozptyl: $\sigma _{x}^{2}=1$ $\sigma _{y}^{2}=16$ $n_{x}=10$ $n_{y}=20$

{\displaystyle {\begin{aligned}S_{X}&=\{19.58,20.71,21.92,17.86,20.72,20.47,20.77,20.88,20.81,19.05\}\\S_{Y}&=8,\{21. 19.48,16.25,24.61,25.94,17.42,23.55,23.71,30.43,21.21,21.01,28.86,20.91,27.39,23.37,18.42,30.297,710.297

	Vzorek $S_{X}$			Vzorek $S_{Y}$			Studentův t-test				Welchův t-test
Příklad	${\displaystyle n_{x))$	$\overline {X}$	${\hat {\sigma }}_{x}^{2}$	${\displaystyle n_{y))$	${\overline {Y}}$	${\hat {\sigma }}_{y}^{2}$	$t$	$d$	$p$ -hodnota	${\displaystyle p_{\mathrm {sim} ))$ -hodnota	$t$	$d$	$p$ -hodnota	${\displaystyle p_{\mathrm {sim} ))$ -hodnota
jeden	patnáct	20.29	4.61	patnáct	22,67	4.35	-3.07	28	0,005	0,005	−3.07	28,0	0,005	0,004
2	deset	21.10	21.01	dvacet	22.22	1.04	−1.06	28	0,299	0,465	-0,76	9,57	0,464	0,459
3	deset	20.27	1.31	dvacet	22,89	16,69	−1,97	28	0,059	0,015	−2,66	23.28	0,014	0,018

Pro stejné rozptyly a stejnou velikost vzorku poskytl Studentův t-test a Welchův t-test přibližně stejný výsledek (příklad 1). Pro nestejné rozptyly Welchův t-test odhaduje skutečné rozdělení statistiky přesněji než Studentův t-test ( -hodnota pro Welchův t-test je blíže k simulované -hodnotě než pro Studentův t-test). $p$ ${\displaystyle p_{\mathrm {sim} ))$

Pokud není známo, zda jsou rozptyly dvou populací stejné, důrazně se nedoporučuje provádět předběžné testy k určení rovnosti rozptylů, ale je lepší okamžitě použít Welchův t-test. [jeden]

Implementace v různém softwaru

Programovací jazyk / software	Funkce	Poznámka
libreoffice	TTEST(Data1; Data2; Mode; Type)	Přečtěte si více [2]
MATLAB	ttest2(data1, data2, 'Vartype', 'unequal')	Přečtěte si více [3]
Microsoft Excel před rokem 2010	TTEST(array1, array2, tails, type)	Přečtěte si více [4]
Microsoft Excel 2010 a novější	T.TEST(array1, array2, tails, type)neboТТЕСТ(массив1;массив2;хвосты;тип)	Přečtěte si více [5] [6]
Krajta	scipy.stats.ttest_ind(a, b, equal_var=False)	Přečtěte si více [7]
R	t.test(data1, data2, alternative="two.sided", var.equal=FALSE)	Přečtěte si více [8]
Haskell	Statistics.Test.StudentT.welchTTest SamplesDiffer data1 data2	Přečtěte si více [9]
Julie	UnequalVarianceTTest(data1, data2)	Přečtěte si více [10]
Stát	ttest varname1 == varname2, welch	Přečtěte si více [11]
Tabulky Google	TTEST(range1, range2, tails, type)	Přečtěte si více [12]

Literatura

BL Welch Zobecnění „studentského“ problému, když je zapojeno několik různých populačních variací // Vol. 34, č. 1/2 (leden 1947), pp. 28-35

Poznámky

↑ Nestejný rozptylový t-test je málo využívanou alternativou Studentova t-testu a Mann-Whitneyho U testu| Oxford Academic . Staženo 31. května 2020. Archivováno z originálu 10. srpna 2020. (neurčitý)
↑ Statistické funkce, část pátá – Nápověda LibreOffice . Staženo 31. května 2020. Archivováno z originálu dne 28. února 2014. (neurčitý)
↑ Dvouvzorkový t-test - MATLAB ttest2 - MathWorks Velká Británie . Získáno 31. května 2020. Archivováno z originálu dne 5. srpna 2016. (neurčitý)
↑ Archivovaná kopie . Získáno 31. května 2020. Archivováno z originálu dne 21. března 2014. (neurčitý)
↑ Funkce T.TEST - Office Support . Získáno 31. května 2020. Archivováno z originálu dne 3. března 2014. (neurčitý)
↑ TTEST (funkce TTEST) - Podpora Office
↑ scipy.stats.ttest_ind - Referenční příručka SciPy v1.5.2 . Získáno 31. května 2020. Archivováno z originálu dne 23. října 2013. (neurčitý)
↑ R: Studentův t-test . Staženo 31. května 2020. Archivováno z originálu dne 29. listopadu 2016. (neurčitý)
↑ Statistics.Test.StudentT . Získáno 31. května 2020. Archivováno z originálu dne 13. června 2021. (neurčitý)
↑ Vítejte v přečtení nejnovější dokumentace Docs - HypothesisTests.jl . Staženo 31. května 2020. Archivováno z originálu dne 29. března 2016. (neurčitý)
↑ Nápověda Stata 16 pro test . Získáno 31. května 2020. Archivováno z originálu dne 7. ledna 2010. (neurčitý)
↑ T.TEST - Nápověda k editorům dokumentů . Získáno 31. května 2020. Archivováno z originálu dne 16. dubna 2021. (neurčitý)