Nelineární regrese

Nelineární regrese  je typ regresní analýzy , ve které jsou experimentální data modelována funkcí, která je nelineární kombinací parametrů modelu a závisí na jedné nebo více nezávislých proměnných. Data jsou aproximována metodou postupných aproximací .

Obecná ustanovení

Data se skládají z bezchybných vysvětlujících proměnných x a souvisejících pozorovaných závislých proměnných ( odpovědí ) y . Každá proměnná y je modelována jako náhodná veličina se střední hodnotou danou nelineární funkcí f ( x ,β). Metodologická chyba může být přítomna, ale její zpracování je za hranicemi regresní analýzy. Pokud vysvětlující proměnné nejsou bez chyb, model se stává modelem s chybami v proměnných a je také mimo rozsah.

Například Michaelis-Mentenův model pro enzymatickou kinetiku

lze napsat jako

kde  je parametr ,  je parametr a [ S ] je nezávislá proměnná ( x ). Tato funkce je nelineární, protože ji nelze vyjádřit jako lineární kombinaci a .

Jiné příklady nelineárních funkcí jsou exponenciální funkce , logaritmické funkce , goniometrické funkce , mocninné funkce , Gaussovy funkce a Lorentzovy křivky . Regresní analýza s funkcemi jako exponenciální nebo logaritmická může být někdy redukována na lineární případ a lze použít standardní lineární regresi, ale měla by být používána opatrně. Podrobnosti naleznete v části Linearizace níže.

V obecném případě reprezentace v uzavřené formě (jako v případě lineární regrese ) nemusí existovat. K určení nejlepších odhadů parametrů se obvykle používají optimalizační algoritmy . Na rozdíl od lineární regrese může existovat několik lokálních minim funkce, která je optimalizována, a globální minimum může dokonce poskytnout zkreslený odhad. V praxi se odhadované hodnoty parametrů používají spolu s optimalizačním algoritmem ve snaze najít globální minimum součtu čtverců.

Podrobnosti o nelineárním modelování viz " Nejmenší čtverce " a " Nelineární nejmenší čtverce .

Regresní statistika

Předpokladem tohoto postupu je, že model lze aproximovat lineární funkcí.

kde . Vyplývá to z toho, že odhad nejmenších čtverců je dán vzorcem

Statistika nelineární regrese se vypočítá a použije jako statistika lineární regrese, ale místo X ve vzorcích se použije J . Lineární přizpůsobení zavádí vychýlení statistiky, takže při interpretaci statistik odvozených z nelineárního modelu byste měli být opatrnější.

Obyčejné a vážené nejmenší čtverce

Často se předpokládá, že nejlépe padnoucí křivka je ta, která minimalizuje součet druhých mocnin zbytků . Toto je (konvenční) přístup nejmenších čtverců (OLS). Avšak v případě, kdy závislá proměnná nemá konstantní rozptyl, lze součet vážených čtverců minimalizovat . Každá váha by v ideálním případě měla být převrácenou hodnotou rozptylu pozorování, avšak váhy lze při každé iteraci přepočítat v iterativním váženém algoritmu nejmenších čtverců.

Linearizace

Transformace

Některé nelineární regresní problémy lze redukovat na lineární vhodnou transformací formulace modelu.

Zvažte například problém nelineární regrese

s parametry aab as multiplikačním chybovým faktorem U . Pokud vezmeme logaritmus obou stran, dostaneme

kde u = ln( U ). Z toho lze získat odhad neznámých parametrů lineární regresí ln( y ) na x a výpočty nevyžadují iterační optimalizaci. Použití nelineární transformace však vyžaduje opatrnost. Dopad datových hodnot se změní, vzor chyb modelu a interpretace jakýchkoli získaných výsledků se změní, což může vést k nežádoucím výsledkům. Na druhou stranu, v závislosti na největším zdroji chyb, může nelineární transformace distribuovat chyby jako Gaussovo rozdělení, takže při aplikaci nelineární transformace je třeba vzít v úvahu model.

Například pro rovnici Michaelis-Menten se široce používá lineární reprezentace Lineweaver-Burk

.

Vzhledem k vysoké citlivosti na chyby dat a také kvůli silnému zkreslení se to však nedoporučuje.

Pro rozdělení chyb patřící do rodiny exponenciálních rozdělení lze k transformaci parametrů na zobecněný lineární model použít spojovací funkci .

Segmentace

Nezávislá proměnná (řekněme X) může být rozdělena do tříd nebo segmentů a může být provedena lineární regrese segment po segmentu . Segmentovaná regrese s analýzou spolehlivosti může přinést výsledek, ve kterém se závislá proměnná nebo odezva (řekněme Y) chová v různých segmentech odlišně [1] .

Graf vpravo ukazuje, že salinita půdy (X) zpočátku nemá žádný vliv na výnos (Y) hořčice, dokud není dosaženo kritické nebo prahové hodnoty, poté má negativní vliv na výnos [2]

Příklady

Titius-Bodeovo pravidlo ve formě matematického vzorce je jednorozměrná nelineární regresní rovnice , která dává do vztahu pořadová čísla planet Sluneční soustavy , počítaná od Slunce , s přibližnými hodnotami hlavních poloměrů . -osy jejich drah . Přesnost je docela uspokojivá, ne pro astronomické účely.

Viz také

Poznámky

  1. Oosterbaan, 1994 , str. 175-224.
  2. ( Oosterbaan 2002 ) Ilustrace vytvořil SegReg

Literatura

Čtení pro další čtení