Bayesovská síť

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 29. prosince 2021; kontroly vyžadují 4 úpravy .

Bayesovská síť (nebo Bayesian network , Bayesian faith network , anglicky  Bayesian network, faith network ) - graf pravděpodobnosti modelu , což je množina proměnných a jejich pravděpodobnostních závislostí podle Bayese . Bayesovskou síť lze například použít k výpočtu pravděpodobnosti, že pacient má onemocnění na základě přítomnosti nebo nepřítomnosti souboru symptomů, na základě údajů o vztahu mezi symptomy a nemocemi. Matematický aparát bayesovských sítí vytvořil americký vědec Judah Pearl , vítěz Turingovy ceny (2011).

Formálně je Bayesovská síť řízený acyklický graf , jehož každý vrchol odpovídá náhodné proměnné a oblouky grafu kódují podmíněné vztahy nezávislosti mezi těmito proměnnými. Vrcholy mohou představovat proměnné libovolného typu, mohou to být vážené parametry, latentní proměnné nebo hypotézy. Existují účinné metody, které se používají k výpočtu a trénování bayesovských sítí. Pokud jsou proměnné Bayesovské sítě diskrétními náhodnými veličinami, pak se taková síť nazývá diskrétní Bayesovská síť. Bayesovské sítě, které modelují sekvence proměnných, se nazývají dynamické bayesovské sítě . Bayesovské sítě, které mohou mít jak jednotlivé, tak spojité proměnné, se nazývají hybridní Bayesovské sítě . Bayesovská síť, ve které oblouky kromě vztahů podmíněné nezávislosti kódují i ​​vztahy kauzality, se nazývá kauzální bayesovské sítě [ 1] ) . 

Definice a provozní principy

Pokud oblouk přechází z vrcholu do vrcholu , pak se nazývá rodič a nazývá se potomek . Pokud existuje řízená cesta od vrcholu k vrcholu , pak se nazývá předek a nazývá se potomek .

Množina vertex-rodičů vertexu bude označena jako .

Orientovaný acyklický graf se nazývá Bayesovská síť pro rozdělení pravděpodobnosti definované přes množinu náhodných proměnných , pokud je každý vrchol grafu spojen s náhodnou proměnnou z , a oblouky v grafu splňují podmínku (Markovova podmínka [1] ): jakákoli proměnná from musí být podmíněně nezávislá na všech vrcholech, které nejsou jejími potomky, pokud jsou v grafu , tzn.

veletrh:

kde  je hodnota ;  - konfigurace[ specifikovat ] ;  je množina všech vrcholů, které nejsou potomky ;  - konfigurace .

Kompletní společné rozložení hodnot ve vrcholech pak lze pohodlně zapsat jako rozklad (součin) lokálních rozložení:

Pokud vrchol nemá žádné předky, pak se jeho lokální rozdělení pravděpodobnosti nazývá nepodmíněné , jinak podmíněné . Pokud vrchol - náhodná proměnná obdržela hodnotu (například jako výsledek pozorování), pak se taková hodnota nazývá důkaz . Pokud byla hodnota proměnné nastavena zvenčí (a nebyla dodržena), pak se taková hodnota nazývá intervence ( anglicky action ) nebo intervence ( anglicky interference ) [1] .    

Podmíněná nezávislost v Bayesovské síti je reprezentována grafickou vlastností d-separace .

d-separace

Cesta se nazývá množina d - separovaných nebo blokovaných vrcholů tehdy a jen tehdy  

  1. obsahuje řetězec nebo větev , která patří do , nebo
  2. obsahuje obrácenou vidlici (kolider) takovou, že nepatří a vrchol nemá žádné potomky, které patří do .

Dovolit být  neprotínající se podmnožiny vrcholů v acyklickém orientovaném grafu . O množině vrcholů se říká, že je d-oddělující právě tehdy , když blokuje všechny cesty z libovolného vrcholu, který patří k libovolnému vrcholu, který patří do , a je označen . Cesta je posloupnost po sobě jdoucích hran (libovolného směru) v grafu [1] .

D-separační teorém

Pro jakékoli tři nepřekrývající se podmnožiny vrcholů v acyklickém orientovaném grafu a pro všechna rozdělení pravděpodobnosti platí následující :

  1. if , then , if a jsou Markov kompatibilní a
  2. jestliže vztah podmíněné nezávislosti platí pro všechna rozdělení pravděpodobnosti, která jsou Markovově kompatibilní s , pak to implikuje .

Jinými slovy, pokud jsou vrcholy d-odděleny, pak jsou podmíněně nezávislé; a pokud jsou vrcholy podmíněně nezávislé ve všech rozděleních pravděpodobnosti kompatibilních s grafem , pak jsou d-separovány [1] .

( znamená, že množiny proměnných a jsou pro danou množinu podmíněně nezávislé .)

Důkazy

Evidence  - prohlášení ve tvaru "událost nastala v uzlu x". Například: „počítač se nespustí“ .

Pravděpodobnostní dotazy

Bayesovská síť umožňuje získat odpovědi na následující typy pravděpodobnostních dotazů [2] :

předpovídání nebo přímá inference , - stanovení pravděpodobnosti události z pozorovatelných důvodů, diagnostika , nebo reverzní inference ( únos ), - určení pravděpodobnosti příčiny s pozorovanými následky, intercausal (smíšená) inference ( anglicky  intercausal inference ) nebo transdukce , - stanovení pravděpodobnosti jedné z příčin události za předpokladu, že dojde k jedné nebo více dalším příčinám této události.

Příklad

Předpokládejme, že mohou existovat dva důvody, proč může tráva zvlhnout (GRASS WET): postřikovač fungoval nebo pršelo. Předpokládejte také, že déšť ovlivňuje činnost sprinkleru (během deště se jednotka nezapne). Pak lze situaci modelovat ilustrovanou Bayesovou sítí. Každá ze tří proměnných může nabývat pouze jedné ze dvou možných hodnot: T (pravda - pravda) a F (nepravda - nepravda), s pravděpodobnostmi uvedenými v tabulkách na obrázku.

Společná pravděpodobnostní funkce:

kde tři názvy proměnných znamenají G = Mokrá tráva , S = Sprinkler a R = Déšť .

Model umí odpovědět na otázky typu "Jaká je pravděpodobnost, že pršelo, když je mokrá tráva?" pomocí vzorce podmíněné pravděpodobnosti a sečtením proměnných:

Pravděpodobnostní závěr

Protože Bayesovská síť je kompletní model pro proměnné a jejich vztahy, lze ji použít k zodpovězení pravděpodobnostních otázek. Síť lze například použít k získání nových znalostí o stavu podmnožiny proměnných pozorováním jiných proměnných ( evidence variables ). Tento proces výpočtu zadní distribuce proměnných nad proměnnými důkazů se nazývá pravděpodobnostní inference. Tento důsledek nám poskytuje univerzální odhad pro aplikace, kde potřebujeme zvolit hodnoty podmnožiny proměnných, které minimalizují ztrátovou funkci, například pravděpodobnost chybného rozhodnutí. Bayesovskou síť lze také považovat za mechanismus pro automatické vytváření rozšíření Bayesova teorému pro složitější problémy.

K provádění pravděpodobnostní inference v Bayesových sítích se používají následující algoritmy [1] [3] :

Aplikace

Bayesovské sítě se používají pro modelování v bioinformatice ( genetické sítě , struktura proteinů ), medicíně , klasifikaci dokumentů , zpracování obrazu , zpracování dat , strojovém učení a systémech podpory rozhodování .

Další informace

Svobodný a otevřený software

Komerční softwarové produkty

Viz také

Poznámky

  1. 1 2 3 4 5 6 Judea Pearl. Kauzalita: Modely, uvažování a vyvozování. - 2. vydání. - Cambridge University Press, 2009. - 464 s. — ISBN 9780521895606 .
  2. Adnan Darwiche. Modelování a uvažování s Bayesovskými sítěmi. - Cambridge University Press, 2009. - 526 s. — ISBN 978-0521884389 .
  3. Stuart Russell, Peter Norvig. Umělá inteligence: Moderní přístup (AIMA): [přel. z angličtiny]. - 2. vyd. - M.: Williams, 2005. - 1424 s.

Odkazy