Logistická regrese nebo logit model ( anglicky logit model ) je statistický model používaný k předpovídání pravděpodobnosti události, která nastane jejím porovnáním s logistickou křivkou . Tato regrese dává odpověď jako pravděpodobnost binární události (1 nebo 0).
Logistická regrese se používá k predikci pravděpodobnosti výskytu události na základě hodnot sady funkcí. K tomu je zavedena tzv. závislá proměnná , která nabývá pouze jedné ze dvou hodnot – zpravidla jsou to čísla 0 (událost nenastala) a 1 (událost nastala) a množina nezávislé proměnné (také nazývané znaménka, prediktory nebo regresory) - reálné , na základě jejichž hodnot je třeba vypočítat pravděpodobnost přijetí jedné nebo druhé hodnoty závislé proměnné. Stejně jako v případě lineární regrese je pro usnadnění zápisu zavedena fiktivní funkce
Předpokládá se, že pravděpodobnost výskytu události je:
kde a jsou sloupcové vektory hodnot nezávislých proměnných a parametrů (regresní koeficienty) - reálná čísla a je takzvaná logistická funkce (někdy také nazývaná sigmoidní nebo logitová funkce):
Protože nabývá pouze hodnot 0 a 1, pravděpodobnost získání hodnoty 0 je:
Pro stručnost lze distribuční funkci pro dané zapsat v následujícím tvaru:
Ve skutečnosti se jedná o Bernoulliho rozdělení s parametrem rovným .
Pro výběr parametrů je nutné vytvořit trénovací vzorek skládající se ze sad hodnot nezávislých proměnných a odpovídajících hodnot závislé proměnné . Formálně se jedná o množinu dvojic , kde je vektor hodnot nezávislých proměnných a je jim odpovídající hodnota . Každý takový pár se nazývá tréninkový příklad.
Obvykle se používá metoda maximální věrohodnosti , podle které se volí parametry maximalizující hodnotu věrohodnostní funkce na trénovacím vzorku:
Maximalizace funkce pravděpodobnosti je ekvivalentní maximalizaci jejího logaritmu :
, kdePro maximalizaci této funkce lze například použít metodu sestupu gradientu . Spočívá v provedení následujících iterací, počínaje nějakou počáteční hodnotou parametru :
V praxi se také používá Newtonova metoda a stochastický gradientní sestup .
Pro zlepšení zobecňující schopnosti výsledného modelu, tedy snížení efektu overfittingu , se v praxi často zvažuje logistická regrese s regularizací .
Regularizace spočívá ve skutečnosti, že parametrový vektor je zpracován jako náhodný vektor s nějakou danou apriorní hustotou distribuce . K trénování modelu se místo metody maximální věrohodnosti používá metoda maximalizace aposteriorního odhadu , to znamená, že se hledají parametry , které maximalizují hodnotu:
Předchozí rozdělení je často vícerozměrné normální rozdělení s nulovým průměrem s kovarianční maticí odpovídající apriornímu přesvědčení, že všechny regresní koeficienty by měly být malá čísla, v ideálním případě by mnoho málo významných koeficientů mělo být nulové. Dosazením hustoty tohoto předchozího rozdělení do výše uvedeného vzorce a logaritmováním získáme následující optimalizační problém:
kde je parametr regularizace. Tato metoda je známá jako L2-regularizovaná logistická regrese, protože cílová funkce zahrnuje L2-normu parametrového vektoru pro regularizaci.
Pokud místo L2-normy použijeme L1-norm , což je ekvivalentní použití Laplaceova rozdělení jako a priori místo normálního, pak dostaneme další běžnou verzi metody - L1-regularized logistickou regresi:
Tento model se často používá k řešení klasifikačních problémů - do třídy lze přiřadit objekt , pokud je pravděpodobnost předpovězena modelem , a jinak do třídy . Výsledná klasifikační pravidla jsou lineární klasifikátory .
Probitová regrese je velmi podobná logistické regresi , liší se od ní pouze jinou volbou funkce . Softmax regrese zobecňuje logistickou regresi na případ vícetřídní klasifikace, to znamená, když závislá proměnná nabývá více než dvou hodnot. Všechny tyto modely jsou zase zástupci široké třídy statistických modelů - zobecněných lineárních modelů .
Nejmenší čtverce a regresní analýza | |||||||||
---|---|---|---|---|---|---|---|---|---|
Výpočetní statistika |
| ||||||||
Korelace a závislost |
| ||||||||
Regresní analýza |
| ||||||||
Regrese jako statistický model |
| ||||||||
Rozklad rozptylu |
| ||||||||
Modelová studie |
| ||||||||
Předpoklady |
| ||||||||
Plánování experimentů |
| ||||||||
Numerická aproximace | |||||||||
Aplikace |
|
Strojové učení a dolování dat | |
---|---|
Úkoly | |
Učení s učitelem | |
shluková analýza | |
Redukce rozměrů | |
Strukturální prognózy | |
Detekce anomálií | |
Grafové pravděpodobnostní modely | |
Neuronové sítě | |
Posílení učení |
|
Teorie | |
Časopisy a konference |
|