Hammingova vzdálenost

Hammingova vzdálenost (kódová vzdálenost) - počet pozic, ve kterých se liší odpovídající znaky dvou slov stejné délky [1] . Obecněji platí, že Hammingova vzdálenost je aplikována na řetězce stejné délky všech q -árních abeced a slouží jako rozdílová metrika (funkce, která určuje vzdálenost v metrickém prostoru ) objektů stejné dimenze.

Metriku původně formuloval Richard Hamming během svého působení v Bellových laboratořích , aby definoval míru rozdílu mezi kódovými slovy (binárními vektory ) ve vektorovém prostoru kódových slov: v tomto případě Hammingova vzdálenost mezi dvěma binárními sekvencemi (vektory) a délka . je počet pozic, ve kterých se liší. V této formulaci byla Hammingova vzdálenost zahrnuta do NIST Dictionary of Algorithms and Data Structures . Hammingova vzdálenost je speciální případ Minkowského metriky (s vhodnou definicí odčítání):  

.

Dvě slova s ​​Hammingovou vzdáleností 1 se nazývají sousedé.

V některých číselných systémech, jako je Grayův kód , zakódovaná celá čísla, která se liší o 1, mají Hammingovu vzdálenost 1. Taková čísla jsou prý „sousední“.

Sousední kódování je důležité při návrhu logických zařízení, kde je třeba se vyhnout logickým závodům .

Příklady

Vlastnosti

Sada slov o stejné délce tvoří metrický prostor , kde je pro každou dvojici prostorových prvků definováno číslo - Hammingova vzdálenost , která splňuje axiomy metriky:

  1. ( axiom identity ).
  2. ( axiom symetrie ).
  3. ( trojúhelníkový axiom nebo trojúhelníková nerovnost ).
pak axiom symetrie vyplývá z axiomu identity a trojúhelníkové nerovnosti.

Hammingova vzdálenost je vždy:

kde  je délka slov ve znacích.

Hammingova vzdálenost v bioinformatice a genomice

U nukleových kyselin ( DNA a RNA ) závisí možnost hybridizace dvou polynukleotidových řetězců se vznikem sekundární struktury - dvoušroubovice  - na míře komplementarity nukleotidových sekvencí obou řetězců. S rostoucí Hammingovou vzdáleností klesá počet vodíkových vazeb tvořených komplementárními páry bází a v souladu s tím klesá stabilita dvojího řetězce. Počínaje nějakou hraniční Hammingovou vzdáleností je hybridizace nemožná.

V evoluční divergenci homologních sekvencí DNA je Hammingova vzdálenost měřítkem, podle kterého lze posoudit čas, který uplynul od divergence homologů, například délku evolučního segmentu oddělujícího homologní geny a prekurzorový gen.

Viz také

Poznámky

  1. Hammingova vzdálenost: Počet pozic číslic, ve kterých se liší odpovídající číslice dvou binárních slov stejné délky ( Federal Standard 1037C Archived 2 March 2009 at Wayback Machine ).

Literatura