Bayesovská statistika je teorie v oblasti statistiky založená na Bayesovské interpretaci pravděpodobnosti , kde pravděpodobnost odráží míru spolehlivosti události , která se může změnit, když jsou shromážděny nové informace, na rozdíl od pevné hodnoty založené na frekvenčním přístupu. [1] . Míra důvěry může být založena na apriorních znalostech o události, jako jsou výsledky předchozích experimentů nebo osobní důvěra v událost. To se liší od řady jiných interpretací pravděpodobnosti , jako je frekvenční interpretace, která pohlíží na pravděpodobnost jako na limit relativní četnosti události, ke které dojde po velkém počtu pokusů [2] .
Bayesovské statistické metody využívají Bayesův teorém k výpočtu a aktualizaci pravděpodobností při příjmu nových dat. Bayesův teorém popisuje podmíněnou pravděpodobnost události na základě dat a apriorních informací nebo důvěry v událost nebo podmínky spojené s událostí. Například, v Bayesian závěru , Bayesův teorém může být používán odhadnout parametr rozdělení pravděpodobnosti nebo statistický model . Protože Bayesovská statistika považuje pravděpodobnost za míru spolehlivosti, Bayesův teorém může přímo přiřadit rozdělení pravděpodobnosti, které kvantifikuje parametr nebo soubor parametrů [2] .
Bayesovská statistika je pojmenována po Thomasi Bayesovi , který formuloval speciální případ Bayesovy věty ve své práci publikované v roce 1763. V několika pracích publikovaných od konce 17. století do počátku 19. století vyvinul Pierre-Simon Laplace Bayesovský výklad pravděpodobnosti . Laplace použil to, co je nyní považováno za Bayesovské metody, k vyřešení řady statistických problémů. Mnoho Bayesovských metod bylo vyvinuto pozdějšími autory, ale tento termín nebyl použit k popisu takových metod až do 50. let 20. století. Po většinu 20. století byly Bayesovské metody pro většinu statistiků z filozofických a praktických důvodů nežádoucí. Mnoho bayesovských metod je výpočetně náročných a většina metod, které se používají více než století, byla založena na interpretaci frekvence. S nástupem výkonných počítačů a nových algoritmů , jako je například metoda Monte Carlo pro Markovovy řetězce , se však Bayesovské metody začínají používat s rostoucí intenzitou s příchodem 21. století [2] [3] .
Bayesova věta je základní věta v Bayesovské statistice, protože ji používají Bayesovské metody k aktualizaci pravděpodobností, což jsou stupně spolehlivosti, když jsou přijata nová data. Jsou-li dány dvě události a , podmíněná pravděpodobnost , za předpokladu, že je pravdivá, je vyjádřena vzorcem [4] :
kde . Ačkoli Bayesův teorém je základním výsledkem teorie pravděpodobnosti , má v Bayesovské statistice specifický výklad. Ve výše uvedené rovnici obvykle představuje prohlášení (jako je prohlášení, že mince padne v padesáti procentech případů o hlavu) a představuje zdůvodnění nebo nová data, která je třeba vzít v úvahu (jako je výsledek řady házení mincí). je předchozí pravděpodobnost události , která vyjadřuje důvěru v událost před zohledněním odůvodnění. Předchozí pravděpodobnost může také kvantifikovat znalosti nebo informace o události . je pravděpodobnostní funkce , kterou lze interpretovat jako pravděpodobnost důkazu za předpokladu , že k události došlo . Pravděpodobnost kvantifikuje rozsah, v jakém důkazy podporují tvrzení . je zadní pravděpodobnost , pravděpodobnost tvrzení po zvážení důkazů . Bayesův teorém v podstatě aktualizuje apriorní jistotu po zvážení nových důkazů [2] .
Pravděpodobnost důkazu lze vypočítat pomocí vzorce celkové pravděpodobnosti . Jestliže je rozdělení prostoru elementárních událostí , což je množina všech výsledků experimentu, pak [2] [4]
Pokud existuje nekonečný počet výsledků, je nutné integrovat přes všechny výsledky a vypočítat pomocí vzorce celkové pravděpodobnosti. Často je obtížné to spočítat, protože je třeba zahrnout sumaci nebo integraci, což je časově náročné, takže se často bere v úvahu pouze součin předchozí a pravděpodobnosti. Zadní pravděpodobnost je úměrná tomuto součinu [2] :
Maximální zadní odhad , který je módem zadního odhadu a je často počítán v bayesovské statistice pomocí matematických optimalizačních metod , zůstává stejný. Posteriorní pravděpodobnost lze aproximovat i bez přesného výpočtu hodnoty metodami jako Monte Carlo pro Markovovy řetězce nebo variačními bayesovskými metodami [2] .
Obecný soubor statistických technik lze rozdělit do řady větví, z nichž mnohé mají speciální bayesovské verze.
Bayesovská inference odkazuje na statistickou inferenci , ve které je nejistota v inferenci kvantifikována pomocí pravděpodobnosti. V klasické frekvenční inferenci se předpokládá, že parametry modelu a hypotézy jsou pevné a pravděpodobnosti nejsou přiřazeny parametrům nebo hypotézám ve frekvenční inferenci. Například ve frekvenčním odvozování nedává smysl explicitně uvádět pravděpodobnost události, která se může stát pouze jednou, jako je výsledek dalšího hodu symetrickou mincí. Dalo by však smysl říci, že s rostoucím počtem hodů mincí se podíl hlav přicházejících do hry přibližuje k polovině [5] .
Statistické modely definují sadu statistických předpokladů a procesů, které představují způsob generování vzorových dat. Statistické modely mají sadu parametrů, které lze měnit. Mince může být například reprezentována jako pokusy s Bernoulliho rozdělením , které simuluje dva možné výsledky. Bernoulliho rozdělení má jeden parametr rovný pravděpodobnosti jednoho výsledku, která se ve většině případů rovná pravděpodobnosti získání hlav [6] . Sestavení dobrého modelu pro data je ústředním bodem bayesovské inference. Ve většině případů modely pouze přibližují reálné procesy a nemusí brát v úvahu některé faktory, které ovlivňují data [2] . V Bayesově odvození lze pravděpodobnosti přiřadit parametrům modelu. Parametry mohou být reprezentovány jako náhodné proměnné . Bayesovský závěr používá Bayesovu větu k aktualizaci pravděpodobností po obdržení více dat [2] [7] .
Formulace statistického modelování pomocí Bayesovské statistiky má charakteristický rys v tom, že vyžaduje předchozí pravděpodobnosti pro jakékoli neznámé parametry. Kromě toho parametry prioritních pravděpodobností mohou mít samy o sobě předchozí pravděpodobnosti, což vede k bayesovskému hierarchickému modelování [8] , nebo mohou být vzájemně závislé, což vede k bayesovským sítím .
Bayesovský návrh experimentů zahrnuje koncept nazvaný „vliv předchozí důvěry“. Tento přístup využívá techniky statistické analýzy k začlenění výsledků předchozích experimentů do návrhu dalšího experimentu. Toho je dosaženo aktualizací "důvěry" pomocí dřívějších a pozdějších distribucí . To vám umožňuje využívat zdroje všeho druhu při plánování experimentů. Příkladem je problém mnohorukých banditů .
Statistické grafy zahrnují metody pro průzkum dat, validaci adekvátnosti modelu atd. Použití některých moderních počítačových technik pro Bayesovskou inferenci, zejména různých druhů technik Monte Carlo pro Markovovy řetězce , vedlo k potřebě ověřit, často graficky, přiměřenost takových výpočtů, odrážející požadovanou zadní pravděpodobnost.