Dempster-Schaferova teorie

Dempster-Schaferova teorie  je matematická teorie důkazu ([SH76]) založená na funkcích přesvědčení a věrohodném uvažování , které se používají ke kombinaci samostatných informací (důkazů) k výpočtu pravděpodobnosti události. Teorii vyvinuli Arthur P. Dempster a Glenn Schafer .

Zvažte dva možné hráče

První hrou je házení mincí, kde se uzavírají sázky na to, zda se to povede, nebo ne. Nyní si představte druhou hru, ve které se sází na výsledek zápasu mezi nejlepším boxerem na světě a nejlepším zápasníkem na světě. Předpokládejme, že neznáme bojová umění a je pro nás velmi těžké se rozhodnout, na koho vsadit.

Mnoho lidí bude méně sebevědomých v situaci druhé hry, ve které jsou pravděpodobnosti neznámé, než v první hře, kde je snadné vidět, že pravděpodobnost každého výsledku je poloviční. V případě druhé hry Bayesovská teorie přiřadí poloviční pravděpodobnost každému výsledku, bez ohledu na informaci, která činí jeden z výsledků pravděpodobnější než druhý. Dempster-Schaferova teorie vám umožňuje určit míru důvěry hráče ohledně pravděpodobností přiřazených k různým výsledkům.

Formalizace

Dovolit být  univerzální soubor , Soubor všech prohlášení v úvahu. Exponenciální množina , je sbírka všech podmnožin množiny , včetně prázdné množiny . Pokud například:

pak

Podle definice je hmotnost prázdné sady nula:

Hmotnosti zbývajících prvků exponenciální množiny jsou normalizovány na jednotkový součet:

Hmotnost prvku exponenciální množiny vyjadřuje poměr všech relevantních a dostupných důkazů, které podporují tvrzení, že určitý prvek patří , ale nepatří do žádné podmnožiny . Veličina se vztahuje pouze na množinu a nevytváří žádné další údaje o ostatních podmnožinách , z nichž každá má svou vlastní hmotnost.

Na základě přidělených hmotností je možné určit horní a dolní hranici rozsahu možností. Tento interval obsahuje přesnou hodnotu pravděpodobnosti uvažované podmnožiny (v klasickém smyslu) a je omezen dvěma neaditivními spojitými mírami nazývanými víra ( nebo podpora ) a věrohodnost ( věrohodnost ) :

Spolehlivost množiny je definována jako součet všech hmotností správných podmnožin uvažované množiny:

Pravděpodobnost  je součet hmotností všech množin , které se protínají s uvažovanou množinou :

Tato dvě opatření spolu souvisí následovně:

Z výše uvedeného vyplývá, že pro výpočet zbývajících dvou stačí znát alespoň jedno z měřítek (hmotnost, spolehlivost nebo pravděpodobnost).

Zvažte problém kombinace dvou nezávislých souborů přiřazených hmotností. Původní pravidlo spojení, známé jako Dempsterovo pravidlo kombinace , je zobecněním Bayesova pravidla. Toto pravidlo zdůrazňuje shodu mezi více zdroji a ignoruje všechny protichůdné důkazy prostřednictvím normalizace. Zákonnost použití tohoto pravidla je vážně zpochybňována v případě významných nesrovnalostí mezi zdroji informací.

Ve skutečnosti se sjednocení (nazývané přidaná hmotnost ) vypočítá ze dvou sad hmotností a následovně:

kde:

je měřítkem konfliktu mezi dvěma skupinami mas. Normalizační faktor , odpovídá úplnému ignorování nekonzistencí a přiřazení prázdné množiny jakékoli hmotě odpovídající konfliktu. Proto tato operace vede v případě významného konfliktu za určitých okolností k neintuitivním výsledkům .

Diskuse

Důvěryhodnost a důvěryhodnost

Shaferův přístup nám umožňuje interpretovat spolehlivost a pravděpodobnost jako hranice intervalu možné hodnoty pravdivosti hypotézy:

důvěra ≤ určitá míra pravdy ≤ věrohodnost .

Předpokládá se, že:

Důvěra v hypotézu = {součet množství důkazů jednoznačně podporujících hypotézu}. Pravděpodobnost = 1 − {součet hmotností všech důkazů, které jsou v rozporu s hypotézou}.

Řekněme například, že máme hypotézu „kočka v krabici je mrtvá“. Pokud je pro ni spolehlivost 0,5 a pravděpodobnost 0,8, pak to znamená, že máme důkaz (s celkovou váhou 0,5), který jednoznačně naznačuje, že kočka je mrtvá; existují však také důkazy (s celkovou hmotností 0,2), které jednoznačně ukazují, že kočka žije (pravděpodobnost „kočka je mrtvá“ = 1 − 0,2 = 0,8). Zbývající hmotnost (doplňující 0,5 a 0,2 až 1,0), což je také mezera mezi pravděpodobností 0,8 a spolehlivostí 0,5, odpovídá „nejistotě“ („univerzální“ hypotéze), přítomnosti důkazu, že rozhodně existuje kočka v krabici, ale neříká nic o tom, zda je živý nebo mrtvý.

Celkem byl interval [0,5; 0,8] charakterizuje nejistotu pravdivosti výchozí hypotézy na základě dostupných důkazů.

Hypotéza Hmotnost Důvěra Pravděpodobnost
Nula (žádná kočka) 0 0 0
Naživu 0,2 0,2 0,5
Mrtvý 0,5 0,5 0,8
Univerzální (živý nebo mrtvý) 0,3 1,0 1,0

Váha „nulové“ hypotézy je z definice nastavena na 0 (odpovídá případům „žádné rozhodnutí“ nebo neřešitelný rozpor mezi důkazy). To vede k tomu, že důvěra v „nulovou“ hypotézu je 0 a pravděpodobnost „univerzální“ hypotézy je 1. Protože hmotnost „univerzální“ hypotézy se vypočítává z hmotností „živých“ a „ mrtvé“ hypotézy, pak je její spolehlivost automaticky rovna 1 a pravděpodobnost nulové hypotézy je 0.

Vezměme si trochu složitější příklad, který demonstruje rysy důvěry a věrohodnosti. Předpokládejme, že používáme sadu detektorů k registraci jediného vzdáleného signálu požáru, který může mít jednu ze tří barev (červená, žlutá nebo zelená):

Hypotéza Hmotnost Důvěra Pravděpodobnost
Nula 0 0 0
Červené 0,35 0,35 0,56
Žlutá 0,25 0,25 0,45
Zelená 0,15 0,15 0,34
Červená nebo žlutá 0,06 0,66 0,85
Červená nebo Zelená 0,05 0,55 0,75
Žlutá nebo zelená 0,04 0,44 0,65
Univerzální 0,10 1,00 1,00

kde například:

Spolehlivost (červená nebo žlutá) = hmotnost (nulová hypotéza) + hmotnost (červená) + hmotnost (žlutá) + hmotnost (červená nebo žlutá) = 0 + 0,35 + 0,25 + 0,06 = 0,66 Pravděpodobnost (červená nebo žlutá) = 1 − důvěra (popírání červené nebo žluté barvy) = 1 − důvěra (zelená) = 1 − hmotnost (nulová hypotéza) − hmotnost (zelená) = 1 − 0 − 0,15 = 0,85

Události této množiny by neměly být považovány za průnik událostí v pravděpodobnostním prostoru, protože jsou uvedeny v masovém prostoru. Je správnější považovat událost „Červená nebo Žlutá“ za spojení událostí „Červená“ a „Žlutá“ a (viz axiomy teorie pravděpodobnosti) P (Červená nebo Žlutá) ≥ P (Žlutá) a P (Universal) = 1, kde „Univerzální“ hypotéza odpovídá „červené“, „žluté“ nebo „zelené“. V TDS odpovídá množství „univerzální“ hypotézy důkazu, který nelze připsat žádné jiné hypotéze; tedy důkaz, který tvrdí, že tam byl nějaký signál, ale vůbec nemluví o jeho barvě.

V tomto příkladu je důkazu „Červený nebo zelený“ přiřazena hmotnost 0,05. Takové důkazy by bylo možné získat například od lidí s červenou/zelenou slepotou. TDS nám umožňuje zvážit takové důkazy vyváženým způsobem.

Literatura

Viz také