Skrytý Markovův model

Skrytý Markovův model ( HMM ) je statistický model , který simuluje fungování procesu podobného Markovovu procesu s neznámými parametry a úkolem je neznámé parametry uhodnout na základě pozorovaných. Získané parametry lze použít v další analýze, například pro rozpoznávání vzorů. HMM lze považovat za nejjednodušší bayesovskou síť víry .

První poznámky o skrytých Markovových modelech publikoval Baum v 60. letech 20. století a již v 70. letech byly poprvé použity při rozpoznávání řeči. Od poloviny 80. let se SMM používají při analýze biologických sekvencí, zejména DNA.

Hlavní aplikace HMM byla přijata v oblasti rozpoznávání řeči, psaní, pohybů a bioinformatiky. Kromě toho se HMM používají v kryptoanalýze , strojovém překladu .

Příklad

Představme si dva kamarády, kteří každý večer po telefonu probírají, co dělali přes den. Váš přítel může dělat pouze tři věci: chodit po parku, nakupovat nebo uklízet pokoj. Jeho výběr vychází pouze z počasí, které bylo v době rozhodování. Nevíte nic o počasí v regionu, kde váš kamarád žije, ale můžete se na základě jeho rozhodnutí pokusit odhadnout, jaké bylo počasí.

Počasí je znázorněno jako Markovův řetězec, má dva stavy: slunečno nebo deštivo, ale sami ho nevidíte, takže je před vámi skryté. Každý den váš přítel udělá jedno ze tří možných rozhodnutí: chodit, nakupovat nebo uklízet. Můžete se dozvědět o rozhodnutí svého přítele, takže je to pozorovatelná hodnota. Obecně přijímáme SMM.

Struktura skrytého Markovova modelu

V konvenčním Markovově modelu je stav viditelný pro pozorovatele, takže pravděpodobnosti přechodu jsou jediným parametrem. Ve skrytém Markovově modelu můžeme sledovat pouze proměnné, které jsou ovlivněny daným stavem. Každý stav má rozdělení pravděpodobnosti mezi všechny možné výstupní hodnoty. Proto sekvence znaků generovaných HMM poskytuje informace o sekvenci stavů.

Níže uvedený diagram ukazuje obecnou strukturu HMM. Ovály představují proměnné s náhodnou hodnotou. Náhodná proměnná je hodnota skryté proměnné v čase . Náhodná proměnná  je hodnota pozorované proměnné v čase . Šipky v diagramu představují podmíněné závislosti.

Z diagramu je zřejmé, že hodnota skryté proměnné (v čase ) závisí pouze na hodnotě skryté proměnné (v čase ). Tomu se říká Markovův majetek. I když zároveň hodnota sledované proměnné závisí pouze na hodnotě latentní proměnné (obojí v čase ).

Pravděpodobnost zobrazení délkové sekvence je

zde součet běží přes všechny možné sekvence skrytých uzlů Metoda výpočtu hrubou silou  je pro mnoho problémů z reálného života velmi časově náročná, protože počet možných sekvencí skrytých uzlů je velmi velký. Ale použití postupu dopředu-dozadu [1] může výrazně zvýšit rychlost výpočtů.

Základní algoritmy

S SMM jsou spojeny tři hlavní úkoly:

Viz také

Poznámky

  1. Rabiner, str. 262

Odkazy