Bayesovská síť (nebo Bayesian network , Bayesian faith network , anglicky Bayesian network, faith network ) - graf pravděpodobnosti modelu , což je množina proměnných a jejich pravděpodobnostních závislostí podle Bayese . Bayesovskou síť lze například použít k výpočtu pravděpodobnosti, že pacient má onemocnění na základě přítomnosti nebo nepřítomnosti souboru symptomů, na základě údajů o vztahu mezi symptomy a nemocemi. Matematický aparát bayesovských sítí vytvořil americký vědec Judah Pearl , vítěz Turingovy ceny (2011).
Formálně je Bayesovská síť řízený acyklický graf , jehož každý vrchol odpovídá náhodné proměnné a oblouky grafu kódují podmíněné vztahy nezávislosti mezi těmito proměnnými. Vrcholy mohou představovat proměnné libovolného typu, mohou to být vážené parametry, latentní proměnné nebo hypotézy. Existují účinné metody, které se používají k výpočtu a trénování bayesovských sítí. Pokud jsou proměnné Bayesovské sítě diskrétními náhodnými veličinami, pak se taková síť nazývá diskrétní Bayesovská síť. Bayesovské sítě, které modelují sekvence proměnných, se nazývají dynamické bayesovské sítě . Bayesovské sítě, které mohou mít jak jednotlivé, tak spojité proměnné, se nazývají hybridní Bayesovské sítě . Bayesovská síť, ve které oblouky kromě vztahů podmíněné nezávislosti kódují i vztahy kauzality, se nazývá kauzální bayesovské sítě [ 1] ) .
Pokud oblouk přechází z vrcholu do vrcholu , pak se nazývá rodič a nazývá se potomek . Pokud existuje řízená cesta od vrcholu k vrcholu , pak se nazývá předek a nazývá se potomek .
Množina vertex-rodičů vertexu bude označena jako .
Orientovaný acyklický graf se nazývá Bayesovská síť pro rozdělení pravděpodobnosti definované přes množinu náhodných proměnných , pokud je každý vrchol grafu spojen s náhodnou proměnnou z , a oblouky v grafu splňují podmínku (Markovova podmínka [1] ): jakákoli proměnná from musí být podmíněně nezávislá na všech vrcholech, které nejsou jejími potomky, pokud jsou v grafu , tzn.
veletrh:
kde je hodnota ; - konfigurace[ specifikovat ] ; je množina všech vrcholů, které nejsou potomky ; - konfigurace .
Kompletní společné rozložení hodnot ve vrcholech pak lze pohodlně zapsat jako rozklad (součin) lokálních rozložení:
Pokud vrchol nemá žádné předky, pak se jeho lokální rozdělení pravděpodobnosti nazývá nepodmíněné , jinak podmíněné . Pokud vrchol - náhodná proměnná obdržela hodnotu (například jako výsledek pozorování), pak se taková hodnota nazývá důkaz . Pokud byla hodnota proměnné nastavena zvenčí (a nebyla dodržena), pak se taková hodnota nazývá intervence ( anglicky action ) nebo intervence ( anglicky interference ) [1] .
Podmíněná nezávislost v Bayesovské síti je reprezentována grafickou vlastností d-separace .
Cesta se nazývá množina d - separovaných nebo blokovaných vrcholů tehdy a jen tehdy
Dovolit být neprotínající se podmnožiny vrcholů v acyklickém orientovaném grafu . O množině vrcholů se říká, že je d-oddělující právě tehdy , když blokuje všechny cesty z libovolného vrcholu, který patří k libovolnému vrcholu, který patří do , a je označen . Cesta je posloupnost po sobě jdoucích hran (libovolného směru) v grafu [1] .
Pro jakékoli tři nepřekrývající se podmnožiny vrcholů v acyklickém orientovaném grafu a pro všechna rozdělení pravděpodobnosti platí následující :
Jinými slovy, pokud jsou vrcholy d-odděleny, pak jsou podmíněně nezávislé; a pokud jsou vrcholy podmíněně nezávislé ve všech rozděleních pravděpodobnosti kompatibilních s grafem , pak jsou d-separovány [1] .
( znamená, že množiny proměnných a jsou pro danou množinu podmíněně nezávislé .)
Evidence - prohlášení ve tvaru "událost nastala v uzlu x". Například: „počítač se nespustí“ .
Bayesovská síť umožňuje získat odpovědi na následující typy pravděpodobnostních dotazů [2] :
Předpokládejme, že mohou existovat dva důvody, proč může tráva zvlhnout (GRASS WET): postřikovač fungoval nebo pršelo. Předpokládejte také, že déšť ovlivňuje činnost sprinkleru (během deště se jednotka nezapne). Pak lze situaci modelovat ilustrovanou Bayesovou sítí. Každá ze tří proměnných může nabývat pouze jedné ze dvou možných hodnot: T (pravda - pravda) a F (nepravda - nepravda), s pravděpodobnostmi uvedenými v tabulkách na obrázku.
Společná pravděpodobnostní funkce:
kde tři názvy proměnných znamenají G = Mokrá tráva , S = Sprinkler a R = Déšť .
Model umí odpovědět na otázky typu "Jaká je pravděpodobnost, že pršelo, když je mokrá tráva?" pomocí vzorce podmíněné pravděpodobnosti a sečtením proměnných:
Protože Bayesovská síť je kompletní model pro proměnné a jejich vztahy, lze ji použít k zodpovězení pravděpodobnostních otázek. Síť lze například použít k získání nových znalostí o stavu podmnožiny proměnných pozorováním jiných proměnných ( evidence variables ). Tento proces výpočtu zadní distribuce proměnných nad proměnnými důkazů se nazývá pravděpodobnostní inference. Tento důsledek nám poskytuje univerzální odhad pro aplikace, kde potřebujeme zvolit hodnoty podmnožiny proměnných, které minimalizují ztrátovou funkci, například pravděpodobnost chybného rozhodnutí. Bayesovskou síť lze také považovat za mechanismus pro automatické vytváření rozšíření Bayesova teorému pro složitější problémy.
K provádění pravděpodobnostní inference v Bayesových sítích se používají následující algoritmy [1] [3] :
Bayesovské sítě se používají pro modelování v bioinformatice ( genetické sítě , struktura proteinů ), medicíně , klasifikaci dokumentů , zpracování obrazu , zpracování dat , strojovém učení a systémech podpory rozhodování .
![]() |
---|
Grafové pravděpodobnostní modely | |
---|---|
|
Strojové učení a dolování dat | |
---|---|
Úkoly | |
Učení s učitelem | |
shluková analýza | |
Redukce rozměrů | |
Strukturální prognózy | |
Detekce anomálií | |
Grafové pravděpodobnostní modely | |
Neuronové sítě | |
Posílení učení |
|
Teorie | |
Časopisy a konference |
|