Hammingova vzdálenost (kódová vzdálenost) - počet pozic, ve kterých se liší odpovídající znaky dvou slov stejné délky [1] . Obecněji platí, že Hammingova vzdálenost je aplikována na řetězce stejné délky všech q -árních abeced a slouží jako rozdílová metrika (funkce, která určuje vzdálenost v metrickém prostoru ) objektů stejné dimenze.
Metriku původně formuloval Richard Hamming během svého působení v Bellových laboratořích , aby definoval míru rozdílu mezi kódovými slovy (binárními vektory ) ve vektorovém prostoru kódových slov: v tomto případě Hammingova vzdálenost mezi dvěma binárními sekvencemi (vektory) a délka . je počet pozic, ve kterých se liší. V této formulaci byla Hammingova vzdálenost zahrnuta do NIST Dictionary of Algorithms and Data Structures . Hammingova vzdálenost je speciální případ Minkowského metriky (s vhodnou definicí odčítání):
.Dvě slova s Hammingovou vzdáleností 1 se nazývají sousedé.
V některých číselných systémech, jako je Grayův kód , zakódovaná celá čísla, která se liší o 1, mají Hammingovu vzdálenost 1. Taková čísla jsou prý „sousední“.
Sousední kódování je důležité při návrhu logických zařízení, kde je třeba se vyhnout logickým závodům .
Sada slov o stejné délce tvoří metrický prostor , kde je pro každou dvojici prostorových prvků definováno číslo - Hammingova vzdálenost , která splňuje axiomy metriky:
Hammingova vzdálenost je vždy:
kde je délka slov ve znacích.U nukleových kyselin ( DNA a RNA ) závisí možnost hybridizace dvou polynukleotidových řetězců se vznikem sekundární struktury - dvoušroubovice - na míře komplementarity nukleotidových sekvencí obou řetězců. S rostoucí Hammingovou vzdáleností klesá počet vodíkových vazeb tvořených komplementárními páry bází a v souladu s tím klesá stabilita dvojího řetězce. Počínaje nějakou hraniční Hammingovou vzdáleností je hybridizace nemožná.
V evoluční divergenci homologních sekvencí DNA je Hammingova vzdálenost měřítkem, podle kterého lze posoudit čas, který uplynul od divergence homologů, například délku evolučního segmentu oddělujícího homologní geny a prekurzorový gen.
Struny | |
---|---|
Míry podobnosti řetězců | |
Hledání podřetězců | |
palindromy | |
Sekvenční zarovnání | |
Struktury přípon | |
jiný |