Nelineární regrese je typ regresní analýzy , ve které jsou experimentální data modelována funkcí, která je nelineární kombinací parametrů modelu a závisí na jedné nebo více nezávislých proměnných. Data jsou aproximována metodou postupných aproximací .
Data se skládají z bezchybných vysvětlujících proměnných x a souvisejících pozorovaných závislých proměnných ( odpovědí ) y . Každá proměnná y je modelována jako náhodná veličina se střední hodnotou danou nelineární funkcí f ( x ,β). Metodologická chyba může být přítomna, ale její zpracování je za hranicemi regresní analýzy. Pokud vysvětlující proměnné nejsou bez chyb, model se stává modelem s chybami v proměnných a je také mimo rozsah.
Například Michaelis-Mentenův model pro enzymatickou kinetiku
lze napsat jako
kde je parametr , je parametr a [ S ] je nezávislá proměnná ( x ). Tato funkce je nelineární, protože ji nelze vyjádřit jako lineární kombinaci a .
Jiné příklady nelineárních funkcí jsou exponenciální funkce , logaritmické funkce , goniometrické funkce , mocninné funkce , Gaussovy funkce a Lorentzovy křivky . Regresní analýza s funkcemi jako exponenciální nebo logaritmická může být někdy redukována na lineární případ a lze použít standardní lineární regresi, ale měla by být používána opatrně. Podrobnosti naleznete v části Linearizace níže.
V obecném případě reprezentace v uzavřené formě (jako v případě lineární regrese ) nemusí existovat. K určení nejlepších odhadů parametrů se obvykle používají optimalizační algoritmy . Na rozdíl od lineární regrese může existovat několik lokálních minim funkce, která je optimalizována, a globální minimum může dokonce poskytnout zkreslený odhad. V praxi se odhadované hodnoty parametrů používají spolu s optimalizačním algoritmem ve snaze najít globální minimum součtu čtverců.
Podrobnosti o nelineárním modelování viz " Nejmenší čtverce " a " Nelineární nejmenší čtverce .
Předpokladem tohoto postupu je, že model lze aproximovat lineární funkcí.
kde . Vyplývá to z toho, že odhad nejmenších čtverců je dán vzorcem
Statistika nelineární regrese se vypočítá a použije jako statistika lineární regrese, ale místo X ve vzorcích se použije J . Lineární přizpůsobení zavádí vychýlení statistiky, takže při interpretaci statistik odvozených z nelineárního modelu byste měli být opatrnější.
Často se předpokládá, že nejlépe padnoucí křivka je ta, která minimalizuje součet druhých mocnin zbytků . Toto je (konvenční) přístup nejmenších čtverců (OLS). Avšak v případě, kdy závislá proměnná nemá konstantní rozptyl, lze součet vážených čtverců minimalizovat . Každá váha by v ideálním případě měla být převrácenou hodnotou rozptylu pozorování, avšak váhy lze při každé iteraci přepočítat v iterativním váženém algoritmu nejmenších čtverců.
Některé nelineární regresní problémy lze redukovat na lineární vhodnou transformací formulace modelu.
Zvažte například problém nelineární regrese
s parametry aab as multiplikačním chybovým faktorem U . Pokud vezmeme logaritmus obou stran, dostaneme
kde u = ln( U ). Z toho lze získat odhad neznámých parametrů lineární regresí ln( y ) na x a výpočty nevyžadují iterační optimalizaci. Použití nelineární transformace však vyžaduje opatrnost. Dopad datových hodnot se změní, vzor chyb modelu a interpretace jakýchkoli získaných výsledků se změní, což může vést k nežádoucím výsledkům. Na druhou stranu, v závislosti na největším zdroji chyb, může nelineární transformace distribuovat chyby jako Gaussovo rozdělení, takže při aplikaci nelineární transformace je třeba vzít v úvahu model.
Například pro rovnici Michaelis-Menten se široce používá lineární reprezentace Lineweaver-Burk
.Vzhledem k vysoké citlivosti na chyby dat a také kvůli silnému zkreslení se to však nedoporučuje.
Pro rozdělení chyb patřící do rodiny exponenciálních rozdělení lze k transformaci parametrů na zobecněný lineární model použít spojovací funkci .
Nezávislá proměnná (řekněme X) může být rozdělena do tříd nebo segmentů a může být provedena lineární regrese segment po segmentu . Segmentovaná regrese s analýzou spolehlivosti může přinést výsledek, ve kterém se závislá proměnná nebo odezva (řekněme Y) chová v různých segmentech odlišně [1] .
Graf vpravo ukazuje, že salinita půdy (X) zpočátku nemá žádný vliv na výnos (Y) hořčice, dokud není dosaženo kritické nebo prahové hodnoty, poté má negativní vliv na výnos [2]
Titius-Bodeovo pravidlo ve formě matematického vzorce je jednorozměrná nelineární regresní rovnice , která dává do vztahu pořadová čísla planet Sluneční soustavy , počítaná od Slunce , s přibližnými hodnotami hlavních poloměrů . -osy jejich drah . Přesnost je docela uspokojivá, ne pro astronomické účely.
Nejmenší čtverce a regresní analýza | |||||||||
---|---|---|---|---|---|---|---|---|---|
Výpočetní statistika |
| ||||||||
Korelace a závislost |
| ||||||||
Regresní analýza |
| ||||||||
Regrese jako statistický model |
| ||||||||
Rozklad rozptylu |
| ||||||||
Modelová studie |
| ||||||||
Předpoklady |
| ||||||||
Plánování experimentů |
| ||||||||
Numerická aproximace | |||||||||
Aplikace |
|