P-hodnota

P-value ( anglicky  P-value ) , p-významnost, p-kritérium - pravděpodobnost získání pro daný pravděpodobnostní model rozložení hodnot náhodné veličiny stejné nebo extrémnější hodnoty statistiky (aritmetický průměr , medián atd.), ve srovnání s dříve pozorovanými, za předpokladu, že je pravdivá nulová hypotéza .

Charakteristickým rysem P-hodnot je jejich nestabilita na ekvivalentních vzorcích , což se může stát překážkou reprodukovatelnosti experimentálních výsledků [1] [2] [3] . Alternativy k použití P-hodnot zahrnují metody, jako je statistika skóre a Bayesův koeficient [4] [5] [6] .

Formální definice a postup testování

Dovolit být  statistika použitá při testování nějaké nulové hypotézy . Předpokládá se, že pokud je nulová hypotéza pravdivá, pak je známo rozložení této statistiky. Označte distribuční funkci . P-hodnota je nejčastěji (při testování pravotočivé alternativy) definována jako:

Při kontrole alternativy pro levou ruku

V případě dvoustranného testu je p-hodnota:

Pokud je p(t) menší než daná hladina významnosti, pak je nulová hypotéza zamítnuta ve prospěch alternativní. Jinak se neodmítá.

Výhodou tohoto přístupu je, že je vidět, na jaké hladině významnosti bude nulová hypotéza zamítnuta a na jaké bude přijata, to znamená, že je viditelná míra spolehlivosti statistických inferencí, přesněji pravděpodobnost chyba při zamítnutí nulové hypotézy. Na jakékoli hladině významnosti vyšší než je nulová hypotéza je zamítnuta a na nižších hodnotách nikoli.

Kritika

Použití p -hodnot k testování nulových hypotéz v lékařských a přírodních vědách bylo kritizováno mnoha odborníky. Je třeba poznamenat, že jejich použití často vede k chybám prvního druhu ( falešně pozitivní ) [7] . Zejména časopis Basic and Applied Social Psychology (BASP) v roce 2015 zcela zakázal publikování článků, které používají p - hodnoty. Editoři časopisu to vysvětlili tím, že není příliš obtížné provést studii, ve které se získá p < 0,05, a takto nízké hodnoty p se příliš často stávají omluvou pro nekvalitní studie [8] .

Nesprávná interpretace P-hodnot

Obecně se má za to, že P-hodnoty jsou často nesprávně interpretovány a zneužity [9] [10] [11] . Jedna praxe, která se dostala pod zvláštní kritiku, je přijímání alternativní hypotézy pro jakoukoli P-hodnotu nominálně menší než 0,05 bez dalších podpůrných důkazů. Zatímco P-hodnoty jsou užitečné při posuzování toho, jak jsou data nekonzistentní s daným statistickým modelem, musí být kontextové faktory, jako je „návrh studie, kvalita měření, externí důkazy o studovaném jevu a správnost předpokladů, na nichž je založena analýza dat“. také vzít v úvahu [11] . Dalším problémem je, že P-hodnota je často mylně chápána jako pravděpodobnost, že nulová hypotéza je pravdivá [11] [12] . Někteří odborníci navrhli nahradit P-hodnoty alternativními důkazními metrikami [11] , jako je interval spolehlivosti [13] [14] , poměr pravděpodobnosti [15] [16] nebo Bayesovský koeficient [17] [18] [19] , ale akutní diskuse o možnosti použití takových alternativ [20] [21] . Jiní navrhli odstranit pevné prahy významnosti a interpretovat P-hodnoty jako spojité hodnoty charakterizující množství důkazů proti pravděpodobnosti nulové hypotézy [22] [23] .

Viz také

Poznámky

  1. Cumming, 2008 .
  2. Nuzzo, 2014 .
  3. Halsey, Curran-Everett, Vowler et al., 2015 .
  4. Cumming, 2010 .
  5. Taroni, Biedermann, Bozza, 2016 .
  6. Goodman, 2016 .
  7. Douglas H. Johnson. Nevýznamnost testování statistické významnosti  //  Journal of Wildlife Management . - Wiley-VCH , 1999. - Sv. 3 , ne. 63 . - str. 763-772 .
  8. Chris Woolston. Psychologický časopis zakazuje hodnoty P  (anglicky)  // Nature News. — 2015-03-05. — Sv. 519 , iss. 7541 . - S. 9-9 . - doi : 10.1038/519009f .
  9. Vědci zneklidněni ztrátou statistického nástroje k vytřídění výzkumného podvodníka z faktů // Scientific American  : časopis  . - Springer Nature , 2015. - 16. dubna.  
  10. Goodman S.N. K lékařské statistice založené na důkazech.  1: The P value fallacy  // Annals of Internal Medicine : deník. - 1999. - Sv. 130 , č. 12 . - S. 995-1004 . - doi : 10.7326/0003-4819-130-12-199906150-00008 . — PMID 10383371 .
  11. 1 2 3 4 Wasserstein, Ronald L.; Lazar, Nicole A.Prohlášení ASA o p-hodnotách: kontext, proces a účel  //  The American Statistician : deník. - 2016. - Sv. 70 . - str. 129-133 . - doi : 10.1080/00031305.2016.1154108 .
  12. Colquhoun, David. Vyšetřování míry falešných objevů a nesprávné interpretace hodnot p  //  Royal Society Open Science : deník. - 2014. - Sv. 1 . — S. 140216 . - doi : 10.1098/rsos.140216 .
  13. Lee, Dong Kyu. Alternativy k hodnotě P: interval spolehlivosti a velikost účinku  (anglicky)  // Korean Journal of Anesthesiology  : deník. - 2017. - 7. března ( roč. 69 , č. 6 ). - str. 555-562 . — ISSN 2005-6419 . - doi : 10.4097/kjae.2016.69.6.555 . — PMID 27924194 .
  14. Ranstam, J. Proč je kultura P-hodnoty špatná a intervaly spolehlivosti jsou lepší alternativou  //  ​​Osteoartritida a chrupavka : deník. - 2012. - Srpen ( vol. 20 , č. 8 ). - S. 805-808 . - doi : 10.1016/j.joca.2012.04.001 .
  15. Perneger, Thomas V. Třídění důkazů: Pravděpodobnostní poměry jsou alternativou k hodnotám P  // BMJ  : British Medical Journal  : journal. - 2001. - 12. května ( roč. 322 , č. 7295 ). S. 1184 . ISSN 0959-8138 . PMID 11379590 .
  16. Royall, Richard. Pravděpodobnostní paradigma pro statistické důkazy // Povaha vědeckých důkazů  . - S. 119-152. doi : 10.7208 /chicago/9780226789583.003.0005 .
  17. Schimmack, Ulrich Nahrazení p-hodnot pomocí Bayesových faktorů: Zázračný lék na krizi replikovatelnosti v psychologické vědě . Replikovatelnost-Index (30. dubna 2015). Staženo: 7. března 2017.
  18. Marden, John I. Testování hypotéz: Od hodnot p k Bayesovým faktorům  //  Journal of the American Statistical Association  : journal. - 2000. - prosinec ( roč. 95 , č. 452 ). — S. 1316 . - doi : 10.2307/2669779 .
  19. Stern, Hal S. Test jakýmkoli jiným jménem: Hodnoty, Bayesovy faktory a statistická inference  //  Multivariační výzkum chování : deník. - 2016. - 16. února ( roč. 51 , č. 1 ). - str. 23-29 . - doi : 10.1080/00273171.2015.1099032 . — PMID 26881954 .
  20. Murtaugh, Paul A. Na obranu p-hodnot  (neurčité)  // Ekologie. - 2014. - březen ( roč. 95 , č. 3 ). - S. 611-617 . - doi : 10.1890/13-0590.1 .
  21. Aschwanden, Christie Statisticians našli jednu věc, na které se mohou shodnout: Je čas přestat zneužívat P-hodnoty . FiveThirtyEight (7. března 2016).
  22. Amrhein, Valentin; Korner-Nievergelt, František; Roth, Tobiasi. Země je placatá (p > 0,05): prahy významnosti a krize nereplikovatelného výzkumu //  PeerJ   : deník. - 2017. - Sv. 5 . — P.e3544 . - doi : 10.7717/peerj.3544 .
  23. Amrhein, Valentin; Grónsko, Sander. Spíše odstraňte než předefinujte statistickou významnost  //  Nature Human Behavior: journal. - 2017. - Sv. 1 . — S. 0224 . - doi : 10.1038/s41562-017-0224-0 .

Literatura

Odkazy