Matice vzdálenosti je čtvercová matice objektů (řádu n ), obsahující jako prvky vzdálenosti mezi objekty v metrickém prostoru .
Vlastnosti matice jsou odrazem vlastností samotných vzdáleností [1] :
Obecně matice vypadá takto:
V širokém smyslu jsou vzdálenosti odrazem takového konceptu, jako je rozdíl , který je duální s pojmem podobnosti , a prvky matice rozdílů (obecně řečeno matice divergence) jsou duální s prvky matice podobnosti ( obecně konvergenční matice ). Vztah mezi mírou podobnosti a mírou rozdílu lze zapsat jako , kde F je míra rozdílu; K je míra podobnosti. Proto lze všechny vlastnosti míry podobnosti extrapolovat na jejich odpovídající rozdílové míry pomocí jednoduché transformace a naopak.
Vztahy mezi objekty lze vizuálně reprezentovat pomocí algoritmů shlukování grafů . Dá se říci, že vzdálenosti jsou používány mnohem častěji než míry podobnosti: častěji jsou implementovány ve statistických programech ( Statistica , SPSS atd.) v modulu shlukové analýzy .
Je známo [2] , že existuje zobecněná míra vzdáleností navržená Hermannem Minkowskim :
Výše uvedená skupina vzdáleností zahrnuje:
Mimo tuto rodinu se používají vzdálenosti. Nejznámější je Mahalanobisova vzdálenost .
Zajímavá je také, jako dobrá ilustrace spojení mezi mírami podobnosti a rozdílu, Yurtsevova vzdálenost , duální s mírou podobnosti Brown-Blanque [5] :
V rovině je šest různých bodů (viz obrázek). Jako metrika byla zvolena euklidovská vzdálenost v pixelech .
Odpovídající matice vzdálenosti bude rovna
A | b | C | d | E | F | |
---|---|---|---|---|---|---|
A | 0 | 184 | 222 | 177 | 216 | 231 |
b | 184 | 0 | 45 | 123 | 128 | 200 |
C | 222 | 45 | 0 | 129 | 121 | 203 |
d | 177 | 123 | 129 | 0 | 46 | 83 |
E | 216 | 128 | 121 | 46 | 0 | 83 |
F | 231 | 200 | 203 | 83 | 83 | 0 |
Výsledná matice může být reprezentována jako teplotní mapa . Zde tmavší barva odpovídá menší vzdálenosti mezi body.