Samoorganizující se mapa Kohonenu
Kohonenova samoorganizující se mapa ( anglicky Self-organizing map - SOM) je nekontrolovaná neuronová síť , která plní úlohu vizualizace a shlukování . Myšlenku sítě navrhl finský vědec T. Kohonen . Jedná se o metodu promítání vícerozměrného prostoru do prostoru s nižší dimenzí (nejčastěji dvourozměrného), používá se také k řešení problémů modelování, prognózování, identifikace souborů nezávislých prvků, hledání vzorců ve velkých souborech dat. , vývoj počítačových her, kvantování barev na jejich omezený počet indexů v paletě barev: při tisku na tiskárně a dříve na PC nebo na set-top boxech s displejem se sníženým počtem barev, pro archivátory [univerzální použití] nebo video kodeky atd. Je to jedna z verzí Kohonenovy neuronové sítě .
Historie
Metodu navrhl finský vědec Teuvo Kohonen v roce 1984. Existuje mnoho modifikací původního modelu.
Struktura sítě
Samoorganizující se mapa se skládá z komponent nazývaných uzly nebo neurony. Jejich počet stanoví analytik . Každý z uzlů je popsán dvěma vektory. První je tzv. vektor hmotnosti m , který má stejný rozměr jako zadání. Druhým je vektor r , což jsou souřadnice uzlu na mapě. Kohonenova mapa je vizuálně zobrazena pomocí obdélníkových nebo šestiúhelníkových buněk; ten druhý se používá častěji, protože v tomto případě jsou vzdálenosti mezi středy sousedních buněk stejné, což zvyšuje správnost vizualizace mapy.
Zpočátku je známa dimenze vstupních dat, nějakým způsobem je na ní postavena výchozí verze mapy. Během procesu učení se vektory vah uzlů přibližují ke vstupním datům. Pro každé pozorování (vzorek) se vybere nejpodobnější uzel z hlediska váhového vektoru a hodnota jeho váhového vektoru se přiblíží pozorování. Také váhové vektory několika uzlů umístěných poblíž se blíží pozorování, takže pokud byla dvě pozorování podobná ve vstupním souboru dat, blízké uzly jim budou na mapě odpovídat. Proces cyklického učení, iterující přes vstupní data, končí, když mapa dosáhne přijatelné (předem určené analytikem) chyby, nebo po stanoveném počtu iterací. Kohonenova mapa tedy jako výsledek tréninku klasifikuje vstupní data do shluků a vizuálně zobrazuje vícerozměrná vstupní data ve dvourozměrné rovině, rozděluje vektory blízkých prvků do sousedních buněk a vybarvuje je v závislosti na analyzovaných parametrech neuronů.
Výsledkem algoritmu jsou následující mapy:
- mapa vstupu neuronů — zobrazuje vnitřní strukturu vstupních dat úpravou vah mapových neuronů. Obvykle se používá několik vstupních map, z nichž každá zobrazuje jednu z nich a je obarvena v závislosti na váze neuronu. Na jedné z map je určitou barvou vyznačena oblast, která obsahuje přibližně stejné vstupy pro analyzované příklady.
- mapa výstupu neuronů - vizualizuje model relativní polohy vstupních příkladů. Vyznačené oblasti na mapě jsou shluky neuronů s podobnými výstupními hodnotami.
- speciální mapy jsou mapa shluků získaná jako výsledek aplikace Kohonenova samoorganizujícího se mapového algoritmu, stejně jako další mapy, které je charakterizují. [jeden]
Provoz sítě
- Inicializace mapy, tedy počáteční přiřazení váhových vektorů pro uzly.
- Cyklus:
- Výběr dalšího pozorování (vektor ze sady vstupů).
- Nalezení pro něj nejlépe vyhovující jednotky (BMU nebo Winner) - uzel na mapě, jehož váhový vektor se nejméně liší od pozorování (v metrice nastavené analytikem nejčastěji euklidovský).
- Určení počtu sousedů BMU a učení - změna váhových vektorů BMU a jeho sousedů za účelem jejich přiblížení k pozorování.
- Definice chyby mapy.
Algoritmus
Existují tři nejběžnější způsoby, jak nastavit počáteční váhy uzlů:
- Nastavení všech souřadnic náhodnými čísly.
- Přiřazení hodnoty náhodného pozorování ze vstupu k váhovému vektoru.
- Výběr váhových vektorů z lineárního prostoru překlenutého hlavními složkami vstupního souboru dat.
- Cyklus
Nechť je číslo iterace (inicializace odpovídá číslu 0).
- Vyberte libovolné pozorování ze sady vstupních dat.
- Najděte vzdálenosti od něj k hmotnostním vektorům všech uzlů mapy a určete nejbližší uzel z hlediska hmotnosti . Toto je BMU nebo vítěz. Podmínka pro :
,
for any , kde je hmotnostní vektor uzlu . Pokud existuje několik uzlů, které splňují podmínku, je z nich náhodně vybrán BMU.
- Pomocí funkce (funkce sousedství) určete sousedy a změňte jejich vektory vah.
- Cvičení
Funkce určuje „míru sousedství“ uzlů a změnu vektorů vah. Postupně by měl zpřesňovat jejich hodnoty, nejprve u většího počtu uzlů a silnějších, poté u menšího a slabšího. Gaussova funkce se často používá jako funkce sousedství:
kde je tréninkový faktor, který s každou další iterací monotónně klesá (tj. určuje aproximaci hodnoty váhových vektorů BMU a jeho sousedů s pozorováním; čím větší krok, tím menší zpřesnění);
, - souřadnice uzlů a na mapě;
— faktor, který snižuje počet sousedů s iteracemi, monotónně klesá.
Parametry a jejich charakter poklesu nastavuje analytik.
Jednodušší způsob, jak definovat funkci sousedství:
,
pokud je v blízkosti poloměru předem určeného analytikem, a 0 v opačném případě.
Funkce je stejná pro BMU a klesá se vzdáleností od BMU.
Změňte vektor hmotnosti podle vzorce:
Že. váhové vektory všech uzlů, které sousedí s BMU, se blíží uvažovanému pozorování.
Například jako aritmetický průměr vzdáleností mezi pozorováními a váhových vektorů jejich odpovídajících BMU:
,
kde N je počet prvků vstupní datové sady.
Vlastnosti modelu
Odolnost vůči hlučným datům, rychlé a nekontrolované učení, schopnost zjednodušit vícerozměrná vstupní data pomocí vizualizace. [2]
Samoorganizující se Kohonenovy mapy lze pro shlukovou analýzu použít pouze v případě, že je předem znám počet shluků [2] .
Důležitou nevýhodou je, že konečný výsledek práce neuronových sítí závisí na počátečním nastavení sítě. Na druhou stranu neuronové sítě dokážou teoreticky aproximovat jakoukoli spojitou funkci, což umožňuje výzkumníkovi nedělat předem žádné hypotézy o modelu [2] .
Viz také
Poznámky
- ↑ Chubuková, 2000 , s. 140.
- ↑ 1 2 3 Manzhula, 2011 .
Literatura
- T. Kohonen , Samoorganizující se mapy (třetí rozšířené vydání), New York, 2001, 501 stran. ISBN 3-540-67921-9
- Debock G., Kohonen T. Analýza finančních dat se samoorganizujícími se mapami, Alpina Publisher, 2001, 317 s. ISBN 5-89684-013-6
- Zinoviev A. Yu. Vizualizace vícerozměrných dat . - Krasnojarsk: Ed. Krasnojarská státní technická univerzita, 2000. - 180 s.
- Chubuková I.A. data mining . - 2000. - 326 s.
- Manzhula V.G., Fedyashov D.S. Kohonenovy neuronové sítě a fuzzy neuronové sítě v dolování dat . — 2011.
- Lakhmi C. Jain; NM Martin Fúze neuronových sítí, fuzzy systémů a genetických algoritmů: průmyslové aplikace. — CRC Press, CRC Press LLC, 1998
Odkazy
Typy umělých neuronových sítí |
---|
|