Bayesova věta

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 6. února 2022; kontroly vyžadují 3 úpravy .

Bayesův teorém (nebo Bayesův vzorec ) je jedním z hlavních teorémů elementární teorie pravděpodobnosti , který umožňuje určit pravděpodobnost události za předpokladu, že nastala jiná událost, která je na ní statisticky závislá . Jinými slovy, podle Bayesova vzorce je možné přesněji přepočítat pravděpodobnost s přihlédnutím k dříve známým informacím i datům z nových pozorování. Bayesův vzorec lze odvodit ze základních axiomů teorie pravděpodobnosti, zejména z podmíněné pravděpodobnosti . Rysem Bayesova teorému je, že jeho praktická aplikace vyžaduje velké množství výpočtů, výpočtů, takže Bayesovské odhady se začaly aktivně používat až po revoluci v počítačových a síťových technologiích.

Když Bayesova věta vznikla, pravděpodobnosti použité ve větě podléhaly řadě pravděpodobnostních interpretací. Jedna z těchto interpretací říkala, že odvození vzorce přímo souvisí s aplikací speciálního přístupu ke statistické analýze. Pokud použijeme Bayesovu interpretaci pravděpodobnosti , pak věta ukazuje, jak se osobní úroveň spolehlivosti může dramaticky změnit v důsledku počtu událostí, které nastaly. Toto je Bayesův závěr, který se stal základem Bayesovské statistiky. Věta se však nepoužívá pouze v Bayesovské analýze, ale aktivně se používá i pro velké množství dalších výpočtů.

Psychologické experimenty [1] ukázaly, že lidé často nesprávně odhadují skutečnou (matematicky správnou) pravděpodobnost události na základě nějaké získané zkušenosti ( a posteriori pravděpodobnost ), protože ignorují samotnou pravděpodobnost předpokladu ( apriorní pravděpodobnost ). Správný výsledek podle Bayesova vzorce se tedy může velmi lišit od intuitivně očekávaného.

Bayesův teorém je pojmenován po svém autorovi Thomasi Bayesovi (1702–1761), anglickém matematikovi a duchovním, který jako první navrhl použití teorému k opravě přesvědčení na základě aktualizovaných dat. Jeho práce „ Esej k řešení problému v doktríně šancí “ byla poprvé publikována v roce 1763 [2] , 2 roky po smrti autora. Než byla Bayesova posmrtná práce přijata a přečtena v Královské společnosti, byla rozsáhle upravena a aktualizována Richardem Pricem . Tyto myšlenky však nebyly zveřejněny, dokud je znovu neobjevil a rozvinul Pierre-Simon Laplace , který poprvé publikoval moderní formulaci teorému ve své knize The Analytic Theory of Probability z roku 1812.

Sir Harold Jeffreys napsal, že Bayesův teorém je „pro teorii pravděpodobnosti tím, čím je Pythagorova věta pro geometrii[3] .

Formulace

Bayesova formule :

,

kde

— apriorní pravděpodobnost hypotézy A (význam této terminologie viz níže); je pravděpodobnost hypotézy A při výskytu události B (a posteriori pravděpodobnost); je pravděpodobnost výskytu jevu B , pokud je hypotéza A pravdivá ; je celková pravděpodobnost výskytu události B .

Důkaz

Bayesův vzorec vyplývá z definice podmíněné pravděpodobnosti . Pravděpodobnost společné události je vyjádřena dvěma způsoby z hlediska podmíněných pravděpodobností

tudíž

Výpočet P(B)

V problémech a statistických aplikacích se obvykle počítá podle vzorce pro celkovou pravděpodobnost události v závislosti na několika nesourodých hypotézách s celkovou pravděpodobností 1.

,

kde pravděpodobnosti pod součtovým znaménkem jsou známé nebo mohou být experimentálně odhadnuty.

V tomto případě je Bayesův vzorec napsán takto:

"Fyzický význam" a terminologie

Bayesův vzorec umožňuje „přeskupit příčinu a následek“: na základě známé skutečnosti události vypočítat pravděpodobnost, že byla způsobena danou příčinou. Zároveň je nutné pochopit, že pro aplikaci věty není kauzální vztah mezi a povinný.

Události odrážející působení „příčin“ se v tomto případě nazývají hypotézy , protože jsou údajnými událostmi, které způsobily dané. Nepodmíněná pravděpodobnost platnosti hypotézy se nazývá a priori (jak pravděpodobně je příčina obecně ) a podmíněná pravděpodobnost, s přihlédnutím ke skutečnosti události, se nazývá a posteriori (jak pravděpodobně se ukázalo, že důvod je , s přihlédnutím k údajům o akci ).

Příklady

Příklad 1

Nechte událost  - auto nestartuje a hypotézu  - v nádrži není palivo. Je zřejmé, že pravděpodobnost , že auto nenastartuje, pokud v nádrži není palivo, se rovná jedné. V důsledku toho se zadní pravděpodobnost, že v nádrži není palivo, pokud vůz nenastartuje, tedy rovná , tedy poměru předchozí pravděpodobnosti, že v nádrži není žádné palivo, k pravděpodobnosti, že auto nestartuje. Pokud je například předchozí pravděpodobnost, že v nádrži není žádné palivo, 0,01 a pravděpodobnost, že auto nenastartuje, je 0,02 a náhodně vybrané auto nenastartovalo, pak pravděpodobnost, že v nádrži není žádné palivo je 0,5.

Příklad 2

Nechť pravděpodobnost sňatku pro prvního dělníka je , pro druhého dělníka - a pro třetího - . První vyrobil díly, druhý vyrobil díly a třetí vyrobil díly. Předák vezme náhodný díl a ukáže se, že je vadný. Otázkou je, jaká je pravděpodobnost, že tento díl vyrobil třetí dělník?

Událost  je vadná součást, událost  je součást vyrobená pracovníkem . Potom , kde , a .

Podle vzorce celkové pravděpodobnosti

Podle Bayesova vzorce dostaneme:

Příklad 3

Entomolog naznačuje, že brouk může být vzácným poddruhem brouka , protože má na těle vzor. U vzácných poddruhů je 98 % brouků vzorovaných, neboli P(vzor | vzácný) = 0,98. Mezi běžnými brouky je pouze 5 % vzorovaných: P(vzor | pravidelný) = 0,05. V celé populaci je pouze 0,1 % vzácných druhů brouků: P(vzácné) = 0,001. Jaká je pravděpodobnost, že vzorovaný brouk je vzácný poddruh, tedy co je P(vzácný | vzor) ?

Z rozšířeného Bayesova teorému dostáváme (jakýkoli brouk může být vzácný nebo běžný):

Příklad 4 je paradoxem Bayesovy věty

Nechť existuje onemocnění s frekvencí distribuce mezi populaci 0,001 a diagnostická vyšetřovací metoda, která s pravděpodobností 0,9 identifikuje pacienta, ale zároveň má pravděpodobnost 0,01 falešně pozitivního výsledku - chybného. zjištění onemocnění u zdravého člověka ( více… ). Najděte pravděpodobnost, že je člověk zdravý, pokud byl při vyšetření uznán nemocným.

Událost, u které vyšetření ukázalo, že je člověk nemocný, označme uvozovkami jako „nemocný“, nemocný – případ, že je člověk skutečně nemocný, zdravý – případ, že je skutečně zdravý. Poté se dané podmínky přepíší takto:

, zatímco , znamená:

Pravděpodobnost, že je člověk zdravý, pokud byl uznán nemocným, se rovná podmíněné pravděpodobnosti:

Abychom to našli, nejprve vypočítáme celkovou pravděpodobnost, že budeme rozpoznáni jako pacient:

Pravděpodobnost, že je člověk zdravý, pokud je výsledek „nemocný“:

91,7 % lidí, jejichž vyšetření ukázalo výsledek „nemocní“, jsou tedy ve skutečnosti zdraví lidé. Důvodem je, že podle stavu problému je pravděpodobnost falešně pozitivního výsledku, byť malá, řádově větší než podíl pacientů ve zkoumané skupině osob.

Pokud lze chybné výsledky průzkumu považovat za náhodné, pak druhé vyšetření stejné osoby poskytne nezávislý výsledek od prvního. V tomto případě, aby se snížil podíl falešně pozitivních výsledků, má smysl znovu vyšetřit lidi, kteří dostali výsledek „nemocní“. Pravděpodobnost, že je člověk po opakovaném výsledku „nemocný“ zdravý, lze také vypočítat pomocí Bayesova vzorce:

Možnosti interpretace pravděpodobností v Bayesově větě

Matematicky Bayesův teorém ukazuje vztah mezi pravděpodobností události A a pravděpodobností události B, P ( A ) a P ( B ), podmíněnou pravděpodobností výskytu události A s existujícím B a výskytem události B s stávající A, P ( A | B ) a P ( B | A).

V obecné podobě vypadá Bayesův vzorec takto:

Význam výrazu závisí na tom, jak jsou interpretovány pravděpodobnosti v daném vzorci.

Bayesova interpretace

V Bayesovské interpretaci pravděpodobnost měří úroveň důvěry. Bayesův teorém spojuje důvěryhodnost předpokladu před a po zohlednění zjevných důkazů. Někdo například navrhl, že když se hodí mince, přistane 2krát častěji ocasem nahoru a hlavou dolů. Zpočátku míra důvěry, že k takové události dojde, mince padne přesně takto - 50%. Úroveň spolehlivosti se může zvýšit na 70 %, pokud je předpoklad podpořen důkazy. [ vyčistit ]

Pro předpoklad (hypotézu) A a důkaz B

Interpretace frekvence

Při frekvenční interpretaci Bayesův teorém vypočítává proporce určitých výsledků události. Předpokládejme, že experiment byl spuštěn mnohokrát a v některých případech vedl k výsledkům A a/nebo B. Potom:

Roli Bayesova teorému lze nejlépe pochopit ze stromových diagramů uvedených vpravo. Diagramy demonstrují různé pořadí distribuce událostí přítomností nebo nepřítomností výsledků A a B. Bayesův teorém funguje jako spojovací článek mezi těmito distribucemi.

Formuláře

Události

Jednoduchý formulář

Pro události A a B , pokud P ( B ) ≠ 0,

Mnoho doplňků Bayesovy věty uvádí, že jev B je znám, a je třeba pochopit, jak znalosti o jevu B ovlivňují jistotu, že nastane jev A. V tomto případě jmenovatel posledního výrazu - pravděpodobnost výskyt jevu B - je znám; chceme změnit A. Bayesův teorém ukazuje, že zadní pravděpodobnosti jsou úměrné čitateli:

(proporcionalita A pro dané B ). Stručně řečeno, posterior je úměrný předchozímu (viz Lee, 2012, kapitola 1).

Pokud se události A 1 , A 2 , ... vzájemně vylučují a jsou vyčerpávající, to znamená, že je možný pouze jeden z jevů, dva jevy nemohou nastat současně, můžeme určit koeficient úměrnosti se zaměřením na skutečnost, že jejich pravděpodobnosti by měly přidat k jednomu. Například pro danou událost A  se událost A sama a její opak ¬ A vzájemně vylučují a jsou vyčerpávající. Označením faktoru proporcionality jako C máme:

a .

Spojením těchto dvou vzorců dostaneme, že:

Rozšířený formulář

Prostor událostí (jako je { A j }) je často definován pomocí P ( A j ) a P ( B | A j ). V tomto případě je užitečné určit P ( B ) použitím vzorce celkové pravděpodobnosti :

Zejména

.

Spojité náhodné proměnné

Uvažujme prostor elementárních dějů Ω tvořený dvěma veličinami X a Y . V zásadě platí Bayesova věta pro jevy A = { X = x } a B = { Y = y }. Výrazy se však stanou 0 v bodech, kde má proměnná konečnou hustotu pravděpodobnosti . Abychom mohli užitečně nadále používat Bayesovu větu, můžeme ji uvést v podmínkách vhodných hustot (viz Odvození vzorce ).

Jednoduchý formulář

Pokud je X spojité a Y diskrétní, pak

Je-li X diskrétní a Y spojité,

Pokud jsou X i Y spojité,

Rozšířený formulář

Prostor spojitých událostí je často definován jako čitatel podmínek A. Prostor spojitých událostí je často reprezentován jako čitatel. Do budoucna je užitečné zbavit se jmenovatele pomocí vzorce pro celkovou pravděpodobnost . Pro 'f Y ( y ) se toto stane integrálem:

Bayesovo pravidlo

Bayesovo pravidlo je upravená Bayesova věta:

kde

Toto se nazývá Bayesovo pravidlo nebo poměr pravděpodobnosti. Rozdíl v pravděpodobnosti výskytu dvou událostí je jednoduše poměr pravděpodobností těchto dvou událostí. Takto,

, ,

Odvození vzorců

Pro události

Bayesův teorém lze odvodit z definice pravděpodobnosti :

Pro náhodné proměnné

Pro dvě spojité náhodné proměnné X a Y lze Bayesův teorém podobně odvodit z definice podmíněného rozdělení :

Viz také

Poznámky

  1. Kahneman, et al, 2005 , pp. 153-160.
  2. Bayes, Thomas a Price, Richard (1763). „Esej o řešení problému v doktríně náhody. Zesnulým Rev. Pan. Bayes, sdělil Mr. Price v dopise Johnu Cantonovi, MA a FRS. Philosophical Transactions of the Royal Society of London 53: 370-418. (nedostupný odkaz) . Získáno 21. dubna 2010. Archivováno z originálu 10. dubna 2011. 
  3. Jeffreys, Harold (1973), Scientific Inference (3. vyd.), Cambridge University Press, s. 31, ISBN 978-0-521-18078-8

Literatura

  • Gmurman V. E. Teorie pravděpodobnosti a matematická statistika, - M . : Vysokoškolské vzdělání. 2005
  • Úsudek pod nejistotou: heuristika a předsudky / Daniel Kahneman, et al. — 21. - Cambridge University Press, 2005. - 555 s. - ISBN 978-0-521-28414-1 .
  • Eliezer Yudkowsky . Vizuální vysvětlení Bayesovy věty

Pro další studium

  • McGrayne, Sharon Bertsch. Teorie, která nezemře: Jak Bayesovo pravidlo rozluštilo kód Enigmy, dohnalo ruské ponorky a objevilo se triumfální dílo ze dvou století  sporů . - Yale University Press , 2011. - ISBN 978-0-300-18822-6 .
  • Andrew Gelman, John B. Carlin, Hal S. Stern a Donald B. Rubin (2003), Bayesian Data Analysis, Druhé vydání, CRC Press.
  • Charles M. Grinstead a J. Laurie Snell (1997), "Úvod do pravděpodobnosti (2. vydání)", American Mathematical Society (k dispozici zdarma pdf [1] .
  • Pierre-Simon Laplace. (1774/1986), "Memoár o pravděpodobnosti příčin událostí", Statistical Science 1 (3): 364-378.
  • Peter M. Lee (2012), Bayesian Statistics: An Introduction, Wiley.
  • Rosenthal, Jeffrey S. (2005): "Zasažen bleskem: Podivuhodný svět pravděpodobností." Harper Collings.
  • Stephen M. Stigler (1986), "Laplace's 1774 Memoir on Inverse Probability", Statistical Science 1(3):359-363.
  • Kámen, JV (2013). Kapitola 1 knihy Bayes' Rule: A Tutorial Introduction , University of Sheffield, Anglie.

Odkazy