Funkce (strojové učení)

Ve strojovém učení a rozpoznávání vzorů je znakem individuální měřitelná vlastnost nebo charakteristika pozorovaného jevu [1] . Výběr informativních, charakteristických a nezávislých vlastností je kritickým krokem pro efektivní algoritmy v rozpoznávání vzorů , klasifikaci a regresi . Prvky jsou obvykle numerické, ale strukturální prvky, jako jsou řetězce a grafy , se používají při rozpoznávání syntaktických vzorů . Pojem „vlastnost“ souvisí s vysvětlujícími proměnnými používanými ve statistických technikách, jako je lineární regrese .

Klasifikace

Sada numerických znaků je pohodlně popsána příznakovým vektorem. Příklad dosažení klasifikace dvou prvků z vektoru rysu (spojeného s perceptronem ) sestává z výpočtu bodového součinu vektoru rysu a vektoru váhy, porovnání výsledku s prahovou hodnotou a rozhodnutí, do které třídy objekt patří. na základě toho srovnání.

Klasifikační algoritmy, které se spoléhají na příznakové vektory, zahrnují klasifikaci nejbližšího souseda , neuronové sítě a statistické techniky , jako je Bayesovský přístup .

Příklady

Při rozpoznávání znaků mohou funkce zahrnovat histogramy , včetně počtu černých bodů v horizontálním a vertikálním směru, počtu vnitřních dutin, zvýraznění tahu a mnoha dalších.

Při rozpoznávání řeči mohou funkce pro rozpoznávání fonémů zahrnovat šumové číslo, délku zvuků, relativní hlasitost, shodu filtrů a další.

V algoritmech detekce spamu mohou funkce zahrnovat přítomnost nebo nepřítomnost některých hlaviček e-mailů, strukturu e-mailu, jazyk, frekvenci určitých výrazů, gramatickou správnost textu.

V počítačovém vidění existuje velké množství možných vlastností , jako jsou hrany a objekty.

Rozšíření

V rozpoznávání vzorů a strojovém učení je příznakový vektor n-rozměrný vektor numerických příznaků, který představuje nějaký objekt. Mnoho algoritmů ve strojovém učení vyžaduje numerickou reprezentaci objektů, protože takové reprezentace usnadňují zpracování a statistickou analýzu. Při práci s obrázky může prvek odpovídat obrazovým bodům (pixelům), zatímco prvky textu mohou odpovídat frekvenci používání výrazů v textu. Jevové vektory jsou ekvivalentní vektorům vysvětlujících proměnných používaných ve statistických postupech, jako je lineární regrese . Jevové vektory jsou často kombinovány s váhami pomocí bodového součinu ke konstrukci lineární prediktorové funkce , která se používá k určení skóre pro předpověď.

Vektorový prostor spojený s těmito vektory se často nazývá prostor rysů . Ke zmenšení rozměru prostoru prvků lze použít několik technik redukce rozměrů .

Prvky vyšší úrovně lze odvodit z již známých prvků a přidat je do vektoru prvků. Například pro studium nemocí je užitečný atribut „věk“, který lze definovat jako věk = „rok úmrtí“ mínus „rok narození“ . Tento proces se označuje jako vytváření vlastností [2] [3] . Konstrukce prvků je aplikace množiny konstrukčních operátorů na množinu existujících prvků, což vede ke konstrukci prvků nových. Příklady takových konstrukčních operátorů zahrnují testy rovnosti {=, ≠}, aritmetické operátory {+,−,×, /}, operátory pole {max(S), min(S), průměr(S)} a složitější operátory, například count(S,C) [4] , který počítá počet prvků ve vektoru příznaků S, které splňují nějakou podmínku C, nebo například vzdálenost k jiné rozpoznávací třídě zobecněné nějakým zařízením. Vytváření prvků je považováno za mocný nástroj jak pro zvýšení přesnosti, tak pro zlepšení porozumění strukturám, zejména u velkorozměrných problémů [5] . Aplikace zahrnují studium nemocí a rozpoznávání emocí v konverzaci [6] .

Výběr a výběr

Počáteční sada nezpracovaných funkcí může být nadbytečná a příliš velká na zpracování. Předběžný krok v mnoha aplikacích strojového učení a rozpoznávání vzorů tedy sestává z výběru podmnožiny funkcí nebo sestavení nové redukované sady funkcí, která poskytuje učení pro zlepšení obecnosti a interpretovatelnosti.

Izolace nebo výběr rysů je kombinací umění a vědy. Systémy, které to dělají, jsou známé jako systémy pro inženýrství funkcí . Extrakce a výběr rysů vyžaduje experimentování s mnoha možnostmi, stejně jako schopnost kombinovat automatizované techniky s intuicí a znalosti úzkého specialisty v této oblasti. Automatizace tohoto procesu se nazývá učení funkcí , kdy stroj nejen využívá funkce k tomu, aby se sám učil, ale také se učí nové funkce.

Viz také

kovariát
Redukce rozměrů
Konstrukce rysů
Hašování funkcí
Statistická klasifikace
Vysvětlitelná umělá inteligence

Poznámky

↑ Biskup, 2006 .
↑ Liu, Motoda, 1998 .
↑ Piramuthu, Sikora, 2009 , str. 3401-3406.
↑ Bloedorn a Michalski 1998 , str. 30-37.
↑ Breiman, Friedman, Olshen, Kámen, 1984 .
↑ Sidorová, Badia, 2009 .

Literatura

Christopher Bishop. rozpoznávání vzorů a strojové učení. - Berlin: Springer, 2006. - ISBN 0-387-31073-8 .
Liu H., Motoda H. Výběr funkcí pro zjišťování znalostí a dolování dat. — Norwell, MA, USA: Kluwer Academic Publishers, 1998.
Piramuthu S., Sikora RT Iterativní funkce pro zlepšení algoritmů induktivního učení. In Journal of Expert Systems with Applications. - 2009. - Březen ( díl 36 , číslo 2 ).
Bloedorn E., Michalski R. Konstruktivní indukce řízená daty: metodologie a její aplikace // IEEE Intelligent Systems, Special issue on Feature Transformation and Subset Selection. — 1998.
Breiman L., Friedman T., Olshen R., Stone C. Klasifikační a regresní stromy. — Wadsworth, 1984.
Sidorova J., Badia T. Syntaktické učení pro ESEDA.1, nástroj pro vylepšenou detekci a analýzu řečových emocí. // Konference Internetové technologie a zabezpečené transakce 2009 (ICITST-2009) Londýn 9. listopadu–12. IEEE. — 2009.

Další čtení

Zlověstné tajemství v srdci umělé inteligence