Popis funkce objektu ( angl. feature vector ) je vektor , který se skládá z hodnot odpovídajících určité sadě vlastností pro daný objekt. Hodnoty funkcí mohou být různého, nemusí nutně číselného typu . Je to jedna z nejběžnějších metod zadávání dat ve strojovém učení .
Označte X množinu objektů, situací, precedentů nějaké předmětové oblasti . Například u problémů se strojovým učením, se kterými se setkáváme v medicíně, mohou být precedenty pacienti, v oblasti půjček při provádění kreditního hodnocení - vypůjčovatelé , v problému filtrování spamu - jednotlivé zprávy.
Feature ( anglicky feature ) je výsledkem měření nějaké charakteristiky objektu, tedy zobrazení:
,kde je množina přípustných hodnot atributů.
Hodnoty prvků mohou být texty , grafy , digitalizované obrázky , číselné sekvence , databázové záznamy atd. V závislosti na sadě se prvky dělí na následující typy:
Často se uplatňují problémy s různými typy funkcí, pro které nejsou vhodné všechny metody.
Pokud jsou uvedeny vlastnosti , pak se vektor nazývá popis prvku objektu .
Ve strojovém učení lze popisy funkcí identifikovat se samotnými objekty, to znamená: . V tomto případě se sada nazývá prostor funkcí .
Matice příznak-objekt (informační matice, matice vstupních dat) je soubor popisů příznaků učebních ukázkových objektůdélky, zapsaných jako matice velikosti(řádky,sloupce). Sloupce této matice odpovídají vlastnostema každý řádek představuje popis funkce jednoho výukového objektu. Tento typ reprezentace je přijímán v problémech klasifikace a regresní analýzy a velké množství metod učení takovou reprezentaci dat implikuje.
Problémy, se kterými se v praxi setkáváme, nemusí obsahovat data vhodná pro matematické zpracování. Například v úloze filtrování nevyžádané pošty jsou objekty - zprávy - reprezentovány texty libovolné délky, mohou obsahovat přílohy různých formátů atd. Pro převedení dat do standardní podoby se používá postup - extrakce příznaků z dat nebo generování příznaků . ( .generace funkce ) . Jakékoli mapování ze sady na sadu hodnot, které je vhodné pro zpracování, lze tedy brát jako funkci. Nic nám nebrání vzít nějaký klasifikační (nebo regresní) algoritmus jako takové mapování, které umožňuje získat komplexní kompozice algoritmů.