Matice vzdálenosti

Matice vzdálenosti  je čtvercová matice objektů (řádu n ), obsahující jako prvky vzdálenosti mezi objekty v metrickém prostoru .

Vlastnosti

Vlastnosti matice jsou odrazem vlastností samotných vzdáleností [1] :

  1. symetrie kolem úhlopříčky, to je ;
  2. odraz vlastnosti identity vzdálenosti v matici vzdálenosti se projevuje v přítomnosti 0 podél úhlopříčky matice, protože vzdálenost objektu sama od sebe je zjevně 0, a také v přítomnosti nulových hodnot pro absolutně podobné předměty;
  3. hodnoty vzdálenosti v matici jsou vždy nezáporné
  4. trojúhelníková nerovnost má tvar pro všechny , a .

Obecně matice vypadá takto:


V širokém smyslu jsou vzdálenosti odrazem takového konceptu, jako je rozdíl , který je duální s pojmem podobnosti , a prvky matice rozdílů (obecně řečeno matice divergence) jsou duální s prvky matice podobnosti ( obecně konvergenční matice ). Vztah mezi mírou podobnosti a mírou rozdílu lze zapsat jako , kde F  je míra rozdílu; K  je míra podobnosti. Proto lze všechny vlastnosti míry podobnosti extrapolovat na jejich odpovídající rozdílové míry pomocí jednoduché transformace a naopak. Vztahy mezi objekty lze vizuálně reprezentovat pomocí algoritmů shlukování grafů . Dá se říci, že vzdálenosti jsou používány mnohem častěji než míry podobnosti: častěji jsou implementovány ve statistických programech ( Statistica , SPSS atd.) v modulu shlukové analýzy .

Vzdálenosti

Je známo [2] , že existuje zobecněná míra vzdáleností navržená Hermannem Minkowskim :

Výše uvedená skupina vzdáleností zahrnuje:

Mimo tuto rodinu se používají vzdálenosti. Nejznámější je Mahalanobisova vzdálenost .

Zajímavá je také, jako dobrá ilustrace spojení mezi mírami podobnosti a rozdílu, Yurtsevova vzdálenost , duální s mírou podobnosti Brown-Blanque [5] :

Příklad

V rovině je šest různých bodů (viz obrázek). Jako metrika byla zvolena euklidovská vzdálenost v pixelech .

Odpovídající matice vzdálenosti bude rovna

A b C d E F
A 0 184 222 177 216 231
b 184 0 45 123 128 200
C 222 45 0 129 121 203
d 177 123 129 0 46 83
E 216 128 121 46 0 83
F 231 200 203 83 83 0

Výsledná matice může být reprezentována jako teplotní mapa . Zde tmavší barva odpovídá menší vzdálenosti mezi body.

Poznámky

  1. Schrader, Yu. A. Co je vzdálenost? . — M .: Fizmatgiz , 1963. — 76 s.
  2. Kim, J.-O. , Muller, C. W., Klekka , W. R. , Oldenderfer, M. S. , Blashfield , R. K. Faktorová, diskriminační a shluková analýza. - M. : Finance a statistika, 1989. - 215 s. — ISBN 5-279-00247-X .
  3. Sokal, R. R. , Sneath, P. H. A. Principy numerické  taxonomie . — San Francisco, Londýn: W. H. Freeman and Co., 1963. — 359 s.
  4. Godron, M. Quelques aplikace de la pojem de fréquence en ecologie végétale  (francouzsky)  // Oecol. Plant.. - 1968. - Sv. 3 , č . 3 . - str. 185-212 .
  5. Semkin, B. I. K metodě analýzy různě velkých souborů ve srovnávací floristice // Komarov Readings. - 2009. - Vydání. LVI . - S. 170-185 .