f- divergence ( f- discrepancy ) je třída funkcionálů, které obecně definují asymetrickou míru divergence mezi dvěma rozděleními pravděpodobnosti a. Běžně aplikovaný v teorii informace a teorii pravděpodobnosti . Funkcionál je jednoznačně určen (generován) funkcí, která splňuje určité podmínky.
Tuto třídu divergenci zavedli a nezávisle studovali Csiszár (1963 ), Morimoto (1963 ) a Ali & Silvey (1966 ). Proto se někdy můžete setkat s názvy f -Chisara divergence , Chisara-Morimoto divergence nebo Ali-Silvi distance.
Dovolit a být rozdělení pravděpodobnosti dané na množině takové, že je absolutně spojité s ohledem na . Nechť je funkce konvexní pro a . Potom funkce definuje f -divergenci s ohledem na následující způsob:
Jestliže je nějaká míra na , a obě distribuce a jsou spojité vzhledem k , tj. existují funkce a , pak lze f- divergenci zapsat jako
V případě Lebesgueovy míry mají rozdělení hustoty a , pak má f- divergence tvar
Pro diskrétní distribuce a , kde ,
Je třeba poznamenat, že funkce je definována až do členu , kde je libovolná konstanta. Forma f- divergence skutečně nezávisí na volbě , protože člen funkce má nulový příspěvek k hodnotě integrálu. Kromě toho může funkce obsahovat kladnou multiplikativní konstantu , která specifikuje měrnou jednotku pro divergenci. V tomto ohledu někteří autoři (například Basseville (2010 )) uvádějí další omezení funkce :
První z těchto omezení fixuje konstantu , druhé fixuje konstantu . Podmínka může být užitečná v tom, že v tomto případě s minimem v bodě (viz Liese & Vajda (2006 )) je výraz pro f -divergenci intuitivně srozumitelnější. Tento způsob konkretizace funkce však není vždy vhodný: například existence spojité verze f- entropie spojené s danou f- divergencí může vyžadovat jinou hodnotu konstanty .
f -divergenci lze rozšířit v Taylorově řadě a zapsat jako vážený součet vzdáleností typu χ (viz Nielsen & Nock (2013 )).
Mnohé známé divergence, jako Kullback-Leiblerova divergence , Hellingerova vzdálenost na druhou , chí-kvadrát vzdálenost a řada dalších, jsou speciální případy f- divergence, které odpovídají určité volbě funkce . Následující tabulka uvádí některé běžné typy divergencí mezi rozděleními pravděpodobnosti a jejich odpovídající funkcí (viz Liese & Vajda (2006 )).
Divergence | Generativní funkce |
---|---|
Kullback-Leibler divergence | |
Reverzní Kullback-Leibler Divergence | |
Hellingerova vzdálenost na druhou | |
Plná variační vzdálenost | |
Pearsonova vzdálenost | |
Neumannova vzdálenost | |
Alfa divergence | |
Alfa divergence (jiné zápisy) |
Vezmeme-li v úvahu poslední vlastnost, třídu f- divergencí lze ekvivalentně definovat jako . Podobnou definici nalezneme například v Zhang (2004 ). Interpretace rozdělení jako pravdivá, která vyplývá z definice f -divergence, tedy není její zásadní vlastností, ale je pouze důsledkem shody o pořadí argumentů v definici. Jinými slovy, argumenty a jsou si koncepčně rovny.
Za zmínku také stojí, že f- divergence je bezrozměrná veličina , bez ohledu na rozměr množiny .
Kromě f -divergence definoval I. Chisar související pojem f -entropie ( Csiszár (1972 )).