Vzdálenost editace grafu
Vzdálenost editace grafu je koeficient podobnosti (nebo nepodobnosti) mezi dvěma grafy . Pojem editační vzdálenosti grafu poprvé matematicky zformulovali Alberto Sanfeliu a King-San Fu v roce 1983 [1] . Hlavní aplikace vzdálenosti editace grafu je v nepřesném porovnávání grafů , jako je robustní rozpoznávání vzorů ve strojovém učení [2] .
Vzdálenost úprav grafu mezi dvěma grafy souvisí se vzdáleností úprav mezi řádky . Při interpretaci propadů jako spojených orientovaných acyklických grafů s maximálním stupněm dva lze klasické definice editační vzdálenosti, jako je Levenshteinova vzdálenost [3] , Hammingova vzdálenost [4] a Jaro-Winklerova vzdálenost , interpretovat jako vzdálenosti editace grafu mezi vhodné grafy. Podobně vzdálenost úprav grafu je zobecněním vzdálenosti úprav stromu mezi zakořeněnými stromy [5] [6] [7] [8] .
Formální definice a vlastnosti
Matematická definice vzdálenosti editace grafu závisí na definici grafů, pro které je vzdálenost definována. Záleží například na tom, zda a jak jsou označeny vrcholy a hrany grafu a také na tom, zda je graf orientován . Obecně platí, že vzhledem k sadě operací úprav grafů (také známých jako elementární operace s grafy ), lze vzdálenost úpravy grafu mezi dvěma grafy a , zapsané jako , definovat jako
,
kde znamená množinu transformačních cest do ( izomorfní s grafem) a rovná se ceně každé editační operace .
Sada základních operací s grafy obvykle zahrnuje:
vložení vrcholu — do grafu se vloží jeden nový označený vrchol.
odstranění vrcholu — jeden (často nesouvisející) vrchol je z grafu odstraněn.
nahrazení vrcholu - změna označení (nebo barvy) daného vrcholu.
vložení hrany — do grafu se mezi dvojici vrcholů vloží nová barevná hrana.
odstranění hrany — odstranění jedné hrany mezi dvojicí vrcholů.
substituce hrany - změna označení (nebo barvy) dané hrany.
Kromě toho, ale spíše výjimečně, operace jako rozdělení hrany , které vloží nový vrchol do hrany (výsledkem jsou dvě hrany), a zmenšení hrany , které odstraní vrchol stupně dva mezi hranami (stejné barvy). sloučení dvou hran, jsou zahrnuty v jednom. I když lze takto složité operace definovat z hlediska jednodušších transformací, jejich použití umožňuje lepší parametrizaci nákladové funkce , když je operátor levnější než součet jeho částí.
Aplikace
Vzdálenost editace grafu má aplikace v rozpoznávání rukopisu [9] , rozpoznávání otisků prstů [10] a chemoinformatiky [11] .
Algoritmy a složitost
Přesné algoritmy pro výpočet vzdálenosti editace grafu mezi párem grafů obvykle transformují problém na problém nalezení minimální transformační cesty mezi dvěma grafy. Výpočet optimální cesty úprav se redukuje na hledání cesty nebo problém s nejkratší cestou , často implementovaný jako vyhledávací algoritmus A* .
Kromě přesných algoritmů je známo mnoho účinných aproximačních algoritmů [12] [13] .
Ačkoli výše uvedené algoritmy někdy v praxi fungují dobře, obecně je problém výpočtu editační vzdálenosti grafu NP-úplný [14] (důkaz je k dispozici v sekci 2 na webových stránkách Zeng et al. ) a dokonce obtížné aproximovat (formálně je to APX -hard [15] ).
Poznámky
- ↑ Sanfeliu, Fu, 1983 , str. 353–363.
- ↑ Gao, Xiao, Tao, Li, 2010 , str. 113-129.
- ↑ Levenshtein, 1965 , s. 845–848.
- ↑ Hamming, 1950 , str. 147–160.
- ↑ Shasha and Zhang 1989 , str. 1245–1262.
- ↑ Zhang, 1996 , s. 205–222.
- ↑ Bille, 2005 , str. 22–34.
- ↑ Demaine, Mozes, Rossman, Weimann, 2010 , str. A2.
- ↑ Fischer, Suen, Frinken, Riesen, Bunke, 2013 , str. 194–203.
- ↑ Neuhaus, Bunke, 2005 , s. 191–200.
- ↑ Birchall, Gillet, Harper, Pickett, 2006 , str. 557–586.
- ↑ Neuhaus, Bunke, 2007 .
- ↑ Riesen, 2016 .
- ↑ Garey, Johnson, 1979 .
- ↑ Lin, 1994 , str. 74–82.
Literatura
- Alberto Sanfeliu, King-Sun Fu. Míra vzdálenosti mezi přiřazenými relačními grafy pro rozpoznávání vzorů // IEEE Transactions on Systems, Man and Kybernetika . - 1983. - T. 13 , no. 3 . — S. 353–363 . - doi : 10.1109/TSMC.1983.6313167 .
- Xinbo Gao, Bing Xiao, Dacheng Tao, Xuelong Li. Přehled vzdálenosti úprav grafu // Analýza a aplikace vzorů. - 2010. - T. 13 . — s. 113–129 . - doi : 10.1007/s10044-008-0141-y .
- Vladimír I. Levenštein. Binární kódy s opravou delecí, inzercí a substitucí symbolů // Zprávy Akademií věd CCCP. - 1965. - T. 163 , čís. 4 . — S. 845–848 .
- Richard W. Hamming. Detekce chyb a kódy pro opravu chyb // Bell System Technical Journal . - 1950. - T. 29 , čís. 2 . — S. 147–160 . - doi : 10.1002/j.1538-7305.1950.tb00463.x . Archivováno z originálu 25. května 2006.
- Shasha D., Zhang K. Jednoduché rychlé algoritmy pro úpravu vzdálenosti mezi stromy a související problémy // SIAM J. Comput. . - 1989. - T. 18 , č. 6 . - S. 1245-1262 . - doi : 10.1137/0218082 .
- Zhang K. Vázaná vzdálenost úprav mezi neuspořádanými označenými stromy // Algorithmica . - 1996. - T. 15 , č. 3 . — S. 205–222 . - doi : 10.1007/BF01975866 .
- Bille P. Průzkum o vzdálenosti úprav stromu a související problémy // Teor. Počítat. sci. . - 2005. - T. 337 , č. 1–3 . — S. 22–34 . - doi : 10.1016/j.tcs.2004.12.030 .
- Erik D. Demaine, Shay Mozes, Benjamin Rossman, Oren Weimann. Optimální dekompoziční algoritmus pro vzdálenost editace stromu // ACM Transactions on Algorithms . - 2010. - T. 6 , no. 1 . - S. A2 . - doi : 10.1145/1644015.1644017 .
- Andreas Fischer, Ching Y. Suen, Volkmar Frinken, Kaspar Riesen, Horst Bunke. Algoritmus rychlé shody pro rozpoznávání rukopisu na základě grafů // Reprezentace na základě grafů v rozpoznávání vzorů. - 2013. - T. 7877. - S. 194-203. — ( Poznámky k přednáškám z informatiky ). — ISBN 978-3-642-38220-8 . - doi : 10.1007/978-3-642-38221-5_21 .
- Michel Neuhaus, Horst Bunke. Přístup ke klasifikaci otisků prstů založený na grafu pomocí směrové odchylky // Biometrické ověření osoby na základě zvuku a videa. - 2005. - T. 3546. - S. 191-200. — ( Poznámky k přednáškám z informatiky ). — ISBN 978-3-540-27887-0 . - doi : 10.1007/11527923_20 .
- Kristian Birchall, Valerie J. Gillet, Gavin Harper, Stephen D. Pickett. Tréninková opatření podobnosti pro specifické aktivity: Aplikace na redukované grafy // Journal of Chemical Information and Modeling . - 2006. - Leden ( roč. 46 , č. 2 ). — S. 557–586 . - doi : 10.1021/ci050465e . — PMID 16562986 .
- Michel Neuhaus, Horst Bunke. Přemostění mezery mezi vzdáleností úprav grafu a stroji jádra. - World Scientific, 2007. - V. 68. - (Strojové vnímání a umělá inteligence). — ISBN 978-9812708175 .
- Kašpar Riesen. Rozpoznávání strukturního vzoru s grafem Edit Distance: Aproximation Algorithms and Applications. - Springer, 2016. - (Pokroky v počítačovém vidění a rozpoznávání vzorů). — ISBN 978-3319272511 .
- Garey MR, Johnson DS Computers and Intractability: Guide to the Theory of NP-Completeness . - W. H. Freeman and Company, 1979. - ISBN 978-0-7167-1045-5 .
- Chih Long Lin. Problém tvrdosti aproximace grafové transformace // Algoritmy a výpočty / Ding-Zhu Du, Xiang-Sun Zhang. - Springer Berlin Heidelberg, 1994. - T. 834. - (Poznámky z přednášek z informatiky). — ISBN 9783540583257 . - doi : 10.1007/3-540-58325-4_168 .