Topologická analýza dat

Topologická analýza dat  je novou oblastí teoretického výzkumu pro dolování dat a problémy s počítačovým viděním .

Hlavní otázky:

  1. Jak získat vysokorozměrné struktury z nízkorozměrných reprezentací;
  2. Jak se jednotlivé jednotky skládají do globálních struktur.

Lidský mozek si snadno vytvoří představu o obecné struktuře z konkrétních nízkorozměrných dat. Například pro něj není obtížné získat trojrozměrný tvar předmětu z plochých obrázků v každém oku. Vytvoření společné struktury se také provádí spojením fragmentů diskrétních v čase do spojitého obrazu. Takže například televizní obraz je technicky pole jednotlivých bodů, které je však vnímáno jako jedna scéna.

Hlavní metoda topologické analýzy dat:

  1. Nahrazení sady datových prvků nějakou rodinou simpliciálních komplexů v souladu s parametrem proximity.
  2. Analýza těchto topologických komplexů pomocí algebraické topologie a konkrétně pomocí nové teorie persistentní homologie .
  3. Překódování stabilní homologie datové sady do parametrizované verze Betti čísel , nazývané čárový kód .

Mračno bodů

Data jsou často reprezentována množinou bodů v euklidovském prostoru En , jejichž tvar odráží jev popsaný daty.

Skutečné trojrozměrné objekty mohou být reprezentovány jako mračno bodů . Jednotlivé body jsou například označeny laserem a jejich nestrukturovaná sada slouží jako počítačová reprezentace objektu. Mračno bodů je jakákoli (případně hlučná) množina bodů v E n nebo projekce bodů v nižší dimenzi.

V počítačové grafice a statistice existují různé metody pro vytváření předobrazů z projekcí. Topologická analýza dat je určena pro vysokorozměrné prostory nebo prostory, které jsou příliš zakřivené na to, aby z nich bylo možné vytvářet ploché projekce.

K transformaci mračna bodů v metrickém prostoru na celistvý objekt se body použijí jako vrcholy grafu , jejichž hranám jsou přiřazeny vzdálenosti, pak se graf změní na jednoduchý komplex a studuje se pomocí algebraické topologie.

Viz také

Odkazy