Softmax

Softmax je zobecněním logistické funkce pro vícerozměrný případ. Funkce transformuje rozměrový vektor na vektor stejné dimenze, kde každá souřadnice výsledného vektoru je reprezentována reálným číslem v intervalu [0,1] a součet souřadnic je 1.

Souřadnice se počítají takto:

Aplikace ve strojovém učení

Funkce Softmax se používá ve strojovém učení pro klasifikační problémy , kdy počet možných tříd je větší než dvě (pro dvě třídy se používá logistická funkce). Se souřadnicemi výsledného vektoru se zachází jako s pravděpodobností, že objekt patří do třídy . Vektor sloupce se vypočítá takto:

kde je sloupcový vektor vlastností objektu dimenze ; je transponovaná matice váhových koeficientů prvků, která má rozměr ; je sloupcový vektor s prahovými hodnotami dimenze (viz perceptron ), kde je počet tříd objektů a počet funkcí objektu.

Softmax se často používá pro poslední vrstvu hlubokých neuronových sítí pro klasifikační úlohy. V tomto případě se křížová entropie používá jako ztrátová funkce k trénování neuronové sítě .