Učení z příkladů je typ učení, ve kterém je intelektuálnímu systému prezentována sada pozitivních a negativních příkladů spojených s nějakou dříve neznámou pravidelností. V inteligentních systémech se vyvíjejí rozhodovací pravidla, pomocí kterých se množina příkladů dělí na pozitivní a negativní. Kvalita separace je obvykle kontrolována zkušebním vzorkem příkladů. [jeden]
Nechť je množina popisů objektů, množina platných odpovědí. Existuje neznámá cílová závislost — mapování , jehož hodnoty jsou známy pouze na objektech finálního trénovacího vzorku . Je potřeba sestavit algoritmus , který by aproximoval neznámou cílovou závislost jak na prvcích vzorku, tak na celé množině .
Říkají také, že algoritmus musí být schopen zobecnit empirická fakta, případně odvodit obecné znalosti ( pravidelnost , závislost ) z konkrétních faktů (pozorování, precedenty).
Je zavedena ztrátová funkce , která charakterizuje odchylku odpovědi od správné odpovědi na libovolném objektu .
Typická volba ztrátové funkce:
Je zaveden funkcionál kvality , který charakterizuje průměrnou chybu ( empirické riziko ) algoritmu na libovolném vzorku .
Empirická metoda minimalizace rizika je jedním z nejběžnějších přístupů k učení algoritmů z precedentů. Spočívá v nalezení algoritmu v daném modelu algoritmů, který minimalizuje průměrnou chybu na trénovací množině:
Problém učení je tedy redukován na optimalizaci a může být řešen numerickými optimalizačními metodami .
Malá hodnota funkcionálu kvality na trénovacím vzorku nezaručuje, že sestrojený algoritmus dobře obnoví cílovou závislost na celém prostoru . Při pokusu popsat konkrétní data přesněji, než by úroveň šumu v datech a chyba samotného modelu v zásadě umožňovaly , hrozí nebezpečí přepasování nebo přepasování .
Je snadné uvést příklad algoritmu, který minimalizuje empirické riziko na nulu, ale nemá schopnost zobecňovat. Po obdržení cvičného vzorku si jej zapamatuje a poté porovná prezentovaný objekt s trénovacími objekty z . V případě shody dává algoritmus správnou odpověď . V opačném případě je vydána libovolná odpověď. Empirické riziko má nejmenší možnou hodnotu rovnou nule. Tento algoritmus však není schopen obnovit závislost mimo učební objekty. Tento příklad přesvědčivě ukazuje, že pro úspěšné učení je potřeba nejen memorovat, ale i zobecňovat.
Téměř u každé metody se vynakládá zvláštní úsilí, aby se zabránilo nadměrnému vybavení. Meze použitelnosti empirické metody minimalizace rizik a problém overfittingu studuje statistická teorie učení .
Znak je mapování , kde je množina přípustných hodnot znaku. Pokud jsou uvedeny vlastnosti , pak se vektor nazývá popis prvku objektu . Orientační popisy lze identifikovat s objekty samotnými. V tomto případě se sada nazývá prostor funkcí .
V závislosti na sadě jsou značky rozděleny do následujících typů:
Často se uplatňují problémy s různými typy vlastností, ne všechny metody jsou vhodné pro jejich řešení.
Prvotní informace jsou prezentovány ve formě indikativních popisů. Hodnoty některých funkcí pro některé objekty mohou chybět. Takové případy v praxi často nastávají. Experimentátor například nemusí zaznamenat výsledek pozorování; respondent může odmítnout odpovědět na otázku dotazníku; pacient tento typ vyšetření nemusí absolvovat; atd. Mnoho metod analýzy dat však vyžaduje úplné vyplnění vstupní matice popisů prvků. K doplnění chybějících hodnot se často používá následující přístup. S ohledem na tuto vlastnost jako na cíl je vytvořen algoritmus, který předpovídá její hodnotu v závislosti na dalších vlastnostech. Chybějící hodnoty jsou doplněny předpověďmi. Tato operace se provádí se všemi funkcemi, které mají chybějící hodnoty.
Pokud je znaménko kvantitativní, použijí se metody regresní obnovy , pokud je znaménko kvalitativní (nominální), použijí se klasifikační metody .