Logistická regrese

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 8. února 2022; ověření vyžaduje 1 úpravu .

Logistická regrese nebo logit model ( anglicky  logit model ) je statistický model používaný k předpovídání pravděpodobnosti události, která nastane jejím porovnáním s logistickou křivkou . Tato regrese dává odpověď jako pravděpodobnost binární události (1 nebo 0).

Popis

Logistická regrese se používá k predikci pravděpodobnosti výskytu události na základě hodnot sady funkcí. K tomu je zavedena tzv. závislá proměnná , která nabývá pouze jedné ze dvou hodnot – zpravidla jsou to čísla 0 (událost nenastala) a 1 (událost nastala) a množina nezávislé proměnné (také nazývané znaménka, prediktory nebo regresory) - reálné , na základě jejichž hodnot je třeba vypočítat pravděpodobnost přijetí jedné nebo druhé hodnoty závislé proměnné. Stejně jako v případě lineární regrese je pro usnadnění zápisu zavedena fiktivní funkce

Předpokládá se, že pravděpodobnost výskytu události je:

kde a jsou sloupcové vektory hodnot nezávislých proměnných a parametrů (regresní koeficienty) - reálná čísla a  je  takzvaná logistická funkce (někdy také nazývaná sigmoidní nebo logitová funkce):

Protože nabývá pouze hodnot 0 a 1, pravděpodobnost získání hodnoty 0 je:

Pro stručnost lze distribuční funkci pro dané zapsat v následujícím tvaru:

Ve skutečnosti se jedná o Bernoulliho rozdělení s parametrem rovným .

Výběr parametrů

Pro výběr parametrů je nutné vytvořit trénovací vzorek skládající se ze sad hodnot nezávislých proměnných a odpovídajících hodnot závislé proměnné . Formálně se jedná o množinu dvojic , kde  je vektor hodnot nezávislých proměnných a  je jim odpovídající hodnota . Každý takový pár se nazývá tréninkový příklad.

Obvykle se používá metoda maximální věrohodnosti , podle které se volí parametry maximalizující hodnotu věrohodnostní funkce na trénovacím vzorku:

Maximalizace funkce pravděpodobnosti je ekvivalentní maximalizaci jejího logaritmu :

, kde

Pro maximalizaci této funkce lze například použít metodu sestupu gradientu . Spočívá v provedení následujících iterací, počínaje nějakou počáteční hodnotou parametru :

V praxi se také používá Newtonova metoda a stochastický gradientní sestup .

Regularizace

Pro zlepšení zobecňující schopnosti výsledného modelu, tedy snížení efektu overfittingu , se v praxi často zvažuje logistická regrese s regularizací .

Regularizace spočívá ve skutečnosti, že parametrový vektor je zpracován jako náhodný vektor s nějakou danou apriorní hustotou distribuce . K trénování modelu se místo metody maximální věrohodnosti používá metoda maximalizace aposteriorního odhadu , to znamená, že se hledají parametry , které maximalizují hodnotu:

Předchozí rozdělení je často vícerozměrné normální rozdělení s nulovým průměrem s kovarianční maticí odpovídající apriornímu přesvědčení, že všechny regresní koeficienty by měly být malá čísla, v ideálním případě by mnoho málo významných koeficientů mělo být nulové. Dosazením hustoty tohoto předchozího rozdělení do výše uvedeného vzorce a logaritmováním získáme následující optimalizační problém:

kde  je parametr regularizace. Tato metoda je známá jako L2-regularizovaná logistická regrese, protože cílová funkce zahrnuje L2-normu parametrového vektoru pro regularizaci.

Pokud místo L2-normy použijeme L1-norm , což je ekvivalentní použití Laplaceova rozdělení jako a priori místo normálního, pak dostaneme další běžnou verzi metody - L1-regularized logistickou regresi:

Aplikace

Tento model se často používá k řešení klasifikačních problémů - do třídy lze přiřadit  objekt , pokud je pravděpodobnost předpovězena modelem , a jinak do třídy . Výsledná klasifikační pravidla jsou lineární klasifikátory .

Související metody

Probitová regrese je velmi podobná logistické regresi , liší se od ní pouze jinou volbou funkce . Softmax regrese zobecňuje logistickou regresi na případ vícetřídní klasifikace, to znamená, když závislá proměnná nabývá více než dvou hodnot. Všechny tyto modely jsou zase zástupci široké třídy statistických modelů - zobecněných lineárních modelů .

Viz také

Literatura