F-divergence

f- divergence ( f- discrepancy ) je třída funkcionálů, které obecně definují asymetrickou míru divergence mezi dvěma rozděleními pravděpodobnosti a. Běžně aplikovaný v teorii informace a teorii pravděpodobnosti . Funkcionál je jednoznačně určen (generován) funkcí, která splňuje určité podmínky.

Tuto třídu divergenci zavedli a nezávisle studovali Csiszár (1963 ), Morimoto (1963 ) a Ali & Silvey (1966 ). Proto se někdy můžete setkat s názvy f -Chisara divergence , Chisara-Morimoto divergence nebo Ali-Silvi distance.

Definice

Dovolit a být rozdělení pravděpodobnosti dané na množině takové, že je absolutně spojité s ohledem na . Nechť je funkce konvexní pro a . Potom funkce definuje f -divergenci s ohledem na následující způsob:

Jestliže je nějaká míra na , a obě distribuce a jsou spojité vzhledem k , tj. existují funkce a , pak lze f- divergenci zapsat jako

V případě Lebesgueovy míry mají rozdělení hustoty a , pak má f- divergence tvar

Pro diskrétní distribuce a , kde ,

Je třeba poznamenat, že funkce je definována až do členu , kde je libovolná konstanta. Forma f- divergence skutečně nezávisí na volbě , protože člen funkce má nulový příspěvek k hodnotě integrálu. Kromě toho může funkce obsahovat kladnou multiplikativní konstantu , která specifikuje měrnou jednotku pro divergenci. V tomto ohledu někteří autoři (například Basseville (2010 )) uvádějí další omezení funkce :

První z těchto omezení fixuje konstantu , druhé fixuje konstantu . Podmínka může být užitečná v tom, že v tomto případě s minimem v bodě (viz Liese & Vajda (2006 )) je výraz pro f -divergenci intuitivně srozumitelnější. Tento způsob konkretizace funkce však není vždy vhodný: například existence spojité verze f- entropie spojené s danou f- divergencí může vyžadovat jinou hodnotu konstanty .

f -divergenci lze rozšířit v Taylorově řadě a zapsat jako vážený součet vzdáleností typu χ (viz Nielsen & Nock (2013 )).

Speciální případy f -divergence

Mnohé známé divergence, jako Kullback-Leiblerova divergence , Hellingerova vzdálenost na druhou , chí-kvadrát vzdálenost a řada dalších, jsou speciální případy f- divergence, které odpovídají určité volbě funkce . Následující tabulka uvádí některé běžné typy divergencí mezi rozděleními pravděpodobnosti a jejich odpovídající funkcí (viz Liese & Vajda (2006 )).

Divergence Generativní funkce
Kullback-Leibler divergence
Reverzní Kullback-Leibler Divergence
Hellingerova vzdálenost na druhou
Plná variační vzdálenost
Pearsonova vzdálenost
Neumannova vzdálenost
Alfa divergence
Alfa divergence (jiné zápisy)

Vlastnosti

Vezmeme-li v úvahu poslední vlastnost, třídu f- divergencí lze ekvivalentně definovat jako . Podobnou definici nalezneme například v Zhang (2004 ). Interpretace rozdělení jako pravdivá, která vyplývá z definice f -divergence, tedy není její zásadní vlastností, ale je pouze důsledkem shody o pořadí argumentů v definici. Jinými slovy, argumenty a jsou si koncepčně rovny.

Za zmínku také stojí, že f- divergence je bezrozměrná veličina , bez ohledu na rozměr množiny .

Související pojmy

Kromě f -divergence definoval I. Chisar související pojem f -entropie ( Csiszár (1972 )).

Odkazy