Softmax je zobecněním logistické funkce pro vícerozměrný případ. Funkce transformuje rozměrový vektor na vektor stejné dimenze, kde každá souřadnice výsledného vektoru je reprezentována reálným číslem v intervalu [0,1] a součet souřadnic je 1.
Souřadnice se počítají takto:
Funkce Softmax se používá ve strojovém učení pro klasifikační problémy , kdy počet možných tříd je větší než dvě (pro dvě třídy se používá logistická funkce). Se souřadnicemi výsledného vektoru se zachází jako s pravděpodobností, že objekt patří do třídy . Vektor sloupce se vypočítá takto:
kde je sloupcový vektor vlastností objektu dimenze ; je transponovaná matice váhových koeficientů prvků, která má rozměr ; je sloupcový vektor s prahovými hodnotami dimenze (viz perceptron ), kde je počet tříd objektů a počet funkcí objektu.
Softmax se často používá pro poslední vrstvu hlubokých neuronových sítí pro klasifikační úlohy. V tomto případě se křížová entropie používá jako ztrátová funkce k trénování neuronové sítě .
Strojové učení a dolování dat | |
---|---|
Úkoly | |
Učení s učitelem | |
shluková analýza | |
Redukce rozměrů | |
Strukturální prognózy | |
Detekce anomálií | |
Grafové pravděpodobnostní modely | |
Neuronové sítě | |
Posílení učení |
|
Teorie | |
Časopisy a konference |
|