Samoorganizující se mapa Kohonenu

Kohonenova samoorganizující se mapa ( anglicky  Self-organizing map  - SOM) je nekontrolovaná neuronová síť , která plní úlohu vizualizace a shlukování . Myšlenku sítě navrhl finský vědec T. Kohonen . Jedná se o metodu promítání vícerozměrného prostoru do prostoru s nižší dimenzí (nejčastěji dvourozměrného), používá se také k řešení problémů modelování, prognózování, identifikace souborů nezávislých prvků, hledání vzorců ve velkých souborech dat. , vývoj počítačových her, kvantování barev na jejich omezený počet indexů v paletě barev: při tisku na tiskárně a dříve na PC nebo na set-top boxech s displejem se sníženým počtem barev, pro archivátory [univerzální použití] nebo video kodeky atd. Je to jedna z verzí Kohonenovy neuronové sítě .

Historie

Metodu navrhl finský vědec Teuvo Kohonen v roce 1984. Existuje mnoho modifikací původního modelu.

Struktura sítě

Samoorganizující se mapa se skládá z komponent nazývaných uzly nebo neurony. Jejich počet stanoví analytik . Každý z uzlů je popsán dvěma vektory. První je tzv. vektor hmotnosti m , který má stejný rozměr jako zadání. Druhým je vektor r , což jsou souřadnice uzlu na mapě. Kohonenova mapa je vizuálně zobrazena pomocí obdélníkových nebo šestiúhelníkových buněk; ten druhý se používá častěji, protože v tomto případě jsou vzdálenosti mezi středy sousedních buněk stejné, což zvyšuje správnost vizualizace mapy.

Zpočátku je známa dimenze vstupních dat, nějakým způsobem je na ní postavena výchozí verze mapy. Během procesu učení se vektory vah uzlů přibližují ke vstupním datům. Pro každé pozorování (vzorek) se vybere nejpodobnější uzel z hlediska váhového vektoru a hodnota jeho váhového vektoru se přiblíží pozorování. Také váhové vektory několika uzlů umístěných poblíž se blíží pozorování, takže pokud byla dvě pozorování podobná ve vstupním souboru dat, blízké uzly jim budou na mapě odpovídat. Proces cyklického učení, iterující přes vstupní data, končí, když mapa dosáhne přijatelné (předem určené analytikem) chyby, nebo po stanoveném počtu iterací. Kohonenova mapa tedy jako výsledek tréninku klasifikuje vstupní data do shluků a vizuálně zobrazuje vícerozměrná vstupní data ve dvourozměrné rovině, rozděluje vektory blízkých prvků do sousedních buněk a vybarvuje je v závislosti na analyzovaných parametrech neuronů.

Výsledkem algoritmu jsou následující mapy:

Provoz sítě

Algoritmus

Existují tři nejběžnější způsoby, jak nastavit počáteční váhy uzlů:

Nechť je  číslo iterace (inicializace odpovídá číslu 0).

, for any , kde  je hmotnostní vektor uzlu . Pokud existuje několik uzlů, které splňují podmínku, je z nich náhodně vybrán BMU. Funkce určuje „míru sousedství“ uzlů a změnu vektorů vah. Postupně by měl zpřesňovat jejich hodnoty, nejprve u většího počtu uzlů a silnějších, poté u menšího a slabšího. Gaussova funkce se často používá jako funkce sousedství: kde  je tréninkový faktor, který s každou další iterací monotónně klesá (tj. určuje aproximaci hodnoty váhových vektorů BMU a jeho sousedů s pozorováním; čím větší krok, tím menší zpřesnění); ,  - souřadnice uzlů a na mapě;  — faktor, který snižuje počet sousedů s iteracemi, monotónně klesá. Parametry a jejich charakter poklesu nastavuje analytik. Jednodušší způsob, jak definovat funkci sousedství: , pokud je v blízkosti poloměru předem určeného analytikem, a 0 v opačném případě. Funkce je stejná pro BMU a klesá se vzdáleností od BMU. Změňte vektor hmotnosti podle vzorce: Že. váhové vektory všech uzlů, které sousedí s BMU, se blíží uvažovanému pozorování. Například jako aritmetický průměr vzdáleností mezi pozorováními a váhových vektorů jejich odpovídajících BMU: , kde N je počet prvků vstupní datové sady.

Vlastnosti modelu

Odolnost vůči hlučným datům, rychlé a nekontrolované učení, schopnost zjednodušit vícerozměrná vstupní data pomocí vizualizace. [2]

Samoorganizující se Kohonenovy mapy lze pro shlukovou analýzu použít pouze v případě, že je předem znám počet shluků [2] .

Důležitou nevýhodou je, že konečný výsledek práce neuronových sítí závisí na počátečním nastavení sítě. Na druhou stranu neuronové sítě dokážou teoreticky aproximovat jakoukoli spojitou funkci, což umožňuje výzkumníkovi nedělat předem žádné hypotézy o modelu [2] .

Viz také

Poznámky

  1. Chubuková, 2000 , s. 140.
  2. 1 2 3 Manzhula, 2011 .

Literatura

Odkazy