P-hodnota
P-value ( anglicky P-value ) , p-významnost, p-kritérium - pravděpodobnost získání pro daný pravděpodobnostní model rozložení hodnot náhodné veličiny stejné nebo extrémnější hodnoty statistiky (aritmetický průměr , medián atd.), ve srovnání s dříve pozorovanými, za předpokladu, že je pravdivá
nulová hypotéza .
Charakteristickým rysem P-hodnot je jejich nestabilita na ekvivalentních vzorcích , což se může stát překážkou reprodukovatelnosti experimentálních výsledků [1] [2] [3] . Alternativy k použití P-hodnot zahrnují metody, jako je statistika skóre a Bayesův koeficient [4] [5] [6] .
Formální definice a postup testování
Dovolit být statistika použitá při testování nějaké nulové hypotézy . Předpokládá se, že pokud je nulová hypotéza pravdivá, pak je známo rozložení této statistiky. Označte distribuční funkci . P-hodnota je nejčastěji (při testování pravotočivé alternativy) definována jako:
Při kontrole alternativy pro levou ruku
V případě dvoustranného testu je p-hodnota:
Pokud je p(t) menší než daná hladina významnosti, pak je nulová hypotéza zamítnuta ve prospěch alternativní. Jinak se neodmítá.
Výhodou tohoto přístupu je, že je vidět, na jaké hladině významnosti bude nulová hypotéza zamítnuta a na jaké bude přijata, to znamená, že je viditelná míra spolehlivosti statistických inferencí, přesněji pravděpodobnost chyba při zamítnutí nulové hypotézy. Na jakékoli hladině významnosti vyšší než je nulová hypotéza je zamítnuta a na nižších hodnotách nikoli.
Kritika
Použití p -hodnot k testování nulových hypotéz v lékařských a přírodních vědách bylo kritizováno mnoha odborníky. Je třeba poznamenat, že jejich použití často vede k chybám prvního druhu ( falešně pozitivní ) [7] . Zejména časopis Basic and Applied Social Psychology (BASP) v roce 2015 zcela zakázal publikování článků, které používají p - hodnoty. Editoři časopisu to vysvětlili tím, že není příliš obtížné provést studii, ve které se získá p < 0,05, a takto nízké hodnoty p se příliš často stávají omluvou pro nekvalitní studie [8] .
Nesprávná interpretace P-hodnot
Obecně se má za to, že P-hodnoty jsou často nesprávně interpretovány a zneužity [9] [10] [11] . Jedna praxe, která se dostala pod zvláštní kritiku, je přijímání alternativní hypotézy pro jakoukoli P-hodnotu nominálně menší než 0,05 bez dalších podpůrných důkazů. Zatímco P-hodnoty jsou užitečné při posuzování toho, jak jsou data nekonzistentní s daným statistickým modelem, musí být kontextové faktory, jako je „návrh studie, kvalita měření, externí důkazy o studovaném jevu a správnost předpokladů, na nichž je založena analýza dat“. také vzít v úvahu [11] . Dalším problémem je, že P-hodnota je často mylně chápána jako pravděpodobnost, že nulová hypotéza je pravdivá [11] [12] . Někteří odborníci navrhli nahradit P-hodnoty alternativními důkazními metrikami [11] , jako je interval spolehlivosti [13] [14] ,
poměr pravděpodobnosti [15] [16]
nebo Bayesovský koeficient [17] [18] [19] , ale akutní diskuse o možnosti použití takových alternativ [20] [21] . Jiní navrhli odstranit pevné prahy významnosti a interpretovat P-hodnoty jako spojité hodnoty charakterizující množství důkazů proti pravděpodobnosti nulové hypotézy [22] [23] .
Viz také
Poznámky
- ↑ Cumming, 2008 .
- ↑ Nuzzo, 2014 .
- ↑ Halsey, Curran-Everett, Vowler et al., 2015 .
- ↑ Cumming, 2010 .
- ↑ Taroni, Biedermann, Bozza, 2016 .
- ↑ Goodman, 2016 .
- ↑ Douglas H. Johnson. Nevýznamnost testování statistické významnosti // Journal of Wildlife Management . - Wiley-VCH , 1999. - Sv. 3 , ne. 63 . - str. 763-772 .
- ↑ Chris Woolston. Psychologický časopis zakazuje hodnoty P (anglicky) // Nature News. — 2015-03-05. — Sv. 519 , iss. 7541 . - S. 9-9 . - doi : 10.1038/519009f .
- ↑ Vědci zneklidněni ztrátou statistického nástroje k vytřídění výzkumného podvodníka z faktů // Scientific American : časopis . - Springer Nature , 2015. - 16. dubna.
- ↑ Goodman S.N. K lékařské statistice založené na důkazech. 1: The P value fallacy // Annals of Internal Medicine : deník. - 1999. - Sv. 130 , č. 12 . - S. 995-1004 . - doi : 10.7326/0003-4819-130-12-199906150-00008 . — PMID 10383371 .
- ↑ 1 2 3 4 Wasserstein, Ronald L.; Lazar, Nicole A.Prohlášení ASA o p-hodnotách: kontext, proces a účel // The American Statistician : deník. - 2016. - Sv. 70 . - str. 129-133 . - doi : 10.1080/00031305.2016.1154108 .
- ↑ Colquhoun, David. Vyšetřování míry falešných objevů a nesprávné interpretace hodnot p // Royal Society Open Science : deník. - 2014. - Sv. 1 . — S. 140216 . - doi : 10.1098/rsos.140216 .
- ↑ Lee, Dong Kyu. Alternativy k hodnotě P: interval spolehlivosti a velikost účinku (anglicky) // Korean Journal of Anesthesiology
: deník. - 2017. - 7. března ( roč. 69 , č. 6 ). - str. 555-562 . — ISSN 2005-6419 . - doi : 10.4097/kjae.2016.69.6.555 . — PMID 27924194 .
- ↑ Ranstam, J. Proč je kultura P-hodnoty špatná a intervaly spolehlivosti jsou lepší alternativou // Osteoartritida a chrupavka : deník. - 2012. - Srpen ( vol. 20 , č. 8 ). - S. 805-808 . - doi : 10.1016/j.joca.2012.04.001 .
- ↑ Perneger, Thomas V. Třídění důkazů: Pravděpodobnostní poměry jsou alternativou k hodnotám P // BMJ : British Medical Journal : journal. - 2001. - 12. května ( roč. 322 , č. 7295 ). — S. 1184 . — ISSN 0959-8138 . — PMID 11379590 .
- ↑ Royall, Richard. Pravděpodobnostní paradigma pro statistické důkazy // Povaha vědeckých důkazů . - S. 119-152. doi : 10.7208 /chicago/9780226789583.003.0005 .
- ↑ Schimmack, Ulrich Nahrazení p-hodnot pomocí Bayesových faktorů: Zázračný lék na krizi replikovatelnosti v psychologické vědě . Replikovatelnost-Index (30. dubna 2015). Staženo: 7. března 2017.
(neurčitý)
- ↑ Marden, John I. Testování hypotéz: Od hodnot p k Bayesovým faktorům // Journal of the American Statistical Association : journal. - 2000. - prosinec ( roč. 95 , č. 452 ). — S. 1316 . - doi : 10.2307/2669779 .
- ↑ Stern, Hal S. Test jakýmkoli jiným jménem: Hodnoty, Bayesovy faktory a statistická inference // Multivariační výzkum chování : deník. - 2016. - 16. února ( roč. 51 , č. 1 ). - str. 23-29 . - doi : 10.1080/00273171.2015.1099032 . — PMID 26881954 .
- ↑ Murtaugh, Paul A. Na obranu p-hodnot (neurčité) // Ekologie. - 2014. - březen ( roč. 95 , č. 3 ). - S. 611-617 . - doi : 10.1890/13-0590.1 .
- ↑ Aschwanden, Christie Statisticians našli jednu věc, na které se mohou shodnout: Je čas přestat zneužívat P-hodnoty . FiveThirtyEight (7. března 2016). (neurčitý)
- ↑ Amrhein, Valentin; Korner-Nievergelt, František; Roth, Tobiasi. Země je placatá (p > 0,05): prahy významnosti a krize nereplikovatelného výzkumu // PeerJ
: deník. - 2017. - Sv. 5 . — P.e3544 . - doi : 10.7717/peerj.3544 .
- ↑ Amrhein, Valentin; Grónsko, Sander. Spíše odstraňte než předefinujte statistickou významnost // Nature Human Behavior: journal. - 2017. - Sv. 1 . — S. 0224 . - doi : 10.1038/s41562-017-0224-0 .
Literatura
- Cumming, G. Replikace a intervaly p: hodnoty p předpovídají budoucnost jen vágně, ale intervaly spolehlivosti jsou na tom mnohem lépe: [ eng. ] // Perspectives on Psychological Science . - 2008. - Sv. 3, č. 4. - S. 286-300. - doi : 10.1111/j.1745-6924.2008.00079.x .
- Cumming, G. Pochopení, vyučování a používání hodnot p // Sborník z konference ICOTS-8 : Data a kontext ve výuce statistiky: směrem ke společnosti založené na důkazech : [ eng. ] / C. Reading (Ed.). - International Association for Statistical Education: International Statistical Institute , 2010. - ISBN 978-90-77713-54-9 .
- Goodman, S.N. . Sladění statistického a vědeckého uvažování: Nepochopení a zneužití statistické významnosti brání vědě : [ eng. ]//Věda. - 2016. - Sv. 352, č.p. 6290. - S. 1180-1181. -doi:10.1126/science.aaf5406.
- Halsey, LG Nestálá hodnota P generuje nereprodukovatelné výsledky: [ eng. ] / L. G. Halsey, D. Curran-Everett, S. L. Vowler [et al.] / / Nature Methods . - 2015. - Sv. 12, č. 3. - S. 179-185. - doi : 10.1038/nmeth.3288 .
- Nuzzo, R. Statistické chyby: Hodnoty P, „zlatý standard“ statistické platnosti, nejsou tak spolehlivé, jak mnozí vědci předpokládají: [ eng. ] // Příroda . - 2014. - Sv. 506, č.p. 7487. - S. 150-152. - doi : 10.1038/506150a .
- Taroni, F. Testování statistických hypotéz a běžné nesprávné interpretace: Měli bychom opustit p-hodnotu ve forenzních aplikacích? : [ anglicky ] ] / F. Taroni, A. Biedermann, S. Bozza // Forensic Science International . - 2016. - Sv. 259 (únor). - S. e32-e36. - doi : 10.1016/j.forsciint.2015.11.013 .
Odkazy
Slovníky a encyklopedie |
|
---|
V bibliografických katalozích |
|
---|