Nelineární regrese

Nelineární regrese je typ regresní analýzy , ve které jsou experimentální data modelována funkcí, která je nelineární kombinací parametrů modelu a závisí na jedné nebo více nezávislých proměnných. Data jsou aproximována metodou postupných aproximací .

Obecná ustanovení

Data se skládají z bezchybných vysvětlujících proměnných x a souvisejících pozorovaných závislých proměnných ( odpovědí ) y . Každá proměnná y je modelována jako náhodná veličina se střední hodnotou danou nelineární funkcí f ( x ,β). Metodologická chyba může být přítomna, ale její zpracování je za hranicemi regresní analýzy. Pokud vysvětlující proměnné nejsou bez chyb, model se stává modelem s chybami v proměnných a je také mimo rozsah.

Například Michaelis-Mentenův model pro enzymatickou kinetiku

v={\frac {V_{\max }\ [{\mbox{S}}]}{K_{m}+[{\mbox{S}}]}}

lze napsat jako

f(x,{\boldsymbol {\beta )))={\frac {\beta _{1}x}{\beta _{2}+x))

kde je parametr , je parametr a [ S ] je nezávislá proměnná ( x ). Tato funkce je nelineární, protože ji nelze vyjádřit jako lineární kombinaci a . $\beta_{1}$ ${\displaystyle V_{\max ))$ $\beta _{2}$ $K_{m}$ $\beta_{1}$ $\beta _{2}$

Jiné příklady nelineárních funkcí jsou exponenciální funkce , logaritmické funkce , goniometrické funkce , mocninné funkce , Gaussovy funkce a Lorentzovy křivky . Regresní analýza s funkcemi jako exponenciální nebo logaritmická může být někdy redukována na lineární případ a lze použít standardní lineární regresi, ale měla by být používána opatrně. Podrobnosti naleznete v části Linearizace níže.

V obecném případě reprezentace v uzavřené formě (jako v případě lineární regrese ) nemusí existovat. K určení nejlepších odhadů parametrů se obvykle používají optimalizační algoritmy . Na rozdíl od lineární regrese může existovat několik lokálních minim funkce, která je optimalizována, a globální minimum může dokonce poskytnout zkreslený odhad. V praxi se odhadované hodnoty parametrů používají spolu s optimalizačním algoritmem ve snaze najít globální minimum součtu čtverců.

Podrobnosti o nelineárním modelování viz " Nejmenší čtverce " a " Nelineární nejmenší čtverce .

Regresní statistika

Předpokladem tohoto postupu je, že model lze aproximovat lineární funkcí.

{\displaystyle f(x_{i},{\boldsymbol {\beta )))\přibližně f^{0}+\sum _{j}J_{ij}\beta _{j))

kde . Vyplývá to z toho, že odhad nejmenších čtverců je dán vzorcem ${\displaystyle J_{ij}={\frac {\částečné f(x_{i},{\boldsymbol {\beta )))}{\částečné \beta _{j))))$

{\hat {\boldsymbol {\beta ))}\approx \mathbf {(J^{T}J)^{-1}J^{T}y} .

Statistika nelineární regrese se vypočítá a použije jako statistika lineární regrese, ale místo X ve vzorcích se použije J . Lineární přizpůsobení zavádí vychýlení statistiky, takže při interpretaci statistik odvozených z nelineárního modelu byste měli být opatrnější.

Obyčejné a vážené nejmenší čtverce

Často se předpokládá, že nejlépe padnoucí křivka je ta, která minimalizuje součet druhých mocnin zbytků . Toto je (konvenční) přístup nejmenších čtverců (OLS). Avšak v případě, kdy závislá proměnná nemá konstantní rozptyl, lze součet vážených čtverců minimalizovat . Každá váha by v ideálním případě měla být převrácenou hodnotou rozptylu pozorování, avšak váhy lze při každé iteraci přepočítat v iterativním váženém algoritmu nejmenších čtverců.

Linearizace

Transformace

Některé nelineární regresní problémy lze redukovat na lineární vhodnou transformací formulace modelu.

Zvažte například problém nelineární regrese

y=ae^{bx}U\,\!

s parametry aab as multiplikačním chybovým faktorem U . Pokud vezmeme logaritmus obou stran, dostaneme

\ln {(y)}=\ln {(a)}+bx+u,\,\!

kde u = ln( U ). Z toho lze získat odhad neznámých parametrů lineární regresí ln( y ) na x a výpočty nevyžadují iterační optimalizaci. Použití nelineární transformace však vyžaduje opatrnost. Dopad datových hodnot se změní, vzor chyb modelu a interpretace jakýchkoli získaných výsledků se změní, což může vést k nežádoucím výsledkům. Na druhou stranu, v závislosti na největším zdroji chyb, může nelineární transformace distribuovat chyby jako Gaussovo rozdělení, takže při aplikaci nelineární transformace je třeba vzít v úvahu model.

Například pro rovnici Michaelis-Menten se široce používá lineární reprezentace Lineweaver-Burk

{\frac {1}{v}}={\frac {1}{V_{\max }}}+{\frac {K_{m}}{V_{\max }[S]}}

Vzhledem k vysoké citlivosti na chyby dat a také kvůli silnému zkreslení se to však nedoporučuje.

Pro rozdělení chyb patřící do rodiny exponenciálních rozdělení lze k transformaci parametrů na zobecněný lineární model použít spojovací funkci .

Segmentace

Nezávislá proměnná (řekněme X) může být rozdělena do tříd nebo segmentů a může být provedena lineární regrese segment po segmentu . Segmentovaná regrese s analýzou spolehlivosti může přinést výsledek, ve kterém se závislá proměnná nebo odezva (řekněme Y) chová v různých segmentech odlišně [1] .

Graf vpravo ukazuje, že salinita půdy (X) zpočátku nemá žádný vliv na výnos (Y) hořčice, dokud není dosaženo kritické nebo prahové hodnoty, poté má negativní vliv na výnos [2]

Příklady

Titius-Bodeovo pravidlo ve formě matematického vzorce je jednorozměrná nelineární regresní rovnice , která dává do vztahu pořadová čísla planet Sluneční soustavy , počítaná od Slunce , s přibližnými hodnotami hlavních poloměrů . -osy jejich drah . Přesnost je docela uspokojivá, ne pro astronomické účely.

Viz také

Nelineární nejmenší čtverce
Aproximace pomocí křivek
Zobecněný lineární model
Lokální regrese

Poznámky

↑ Oosterbaan, 1994 , str. 175-224.
↑ ( Oosterbaan 2002 ) Ilustrace vytvořil SegReg

Literatura

RJ Oosterbaan. Frekvenční a regresní analýza // Principy a aplikace odvodnění / HPRitzema. - Wageningen, Nizozemsko: Mezinárodní institut pro rekultivaci a zlepšování půdy (ILRI), 1994. - V. 16. - S. 175-224. — ISBN 90-70754-33-9 .
RJ Oosterbaan. Výzkum odvodnění na polích farmářů: analýza dat. Součást projektu „Liquid Gold“ Mezinárodního institutu pro rekultivaci a zlepšování půdy (ILRI) . — Wageningen, Nizozemsko, 2002.

Čtení pro další čtení

RM Bethea, BS Duran, TL Boullion. Statistické metody pro inženýry a vědce . - New York: Marcel Dekker, 1985. - ISBN 0-8247-7227-X .
N. Meade, T. Islám. Predikční intervaly pro prognózy růstové křivky // Journal of Forecasting. - 1995. - T. 14 , no. 5 . - S. 413-430 . - doi : 10.1002/for.3980140502 .
K. Schittkowski. Data Fitting v dynamických systémech. - Boston: Kluwer, 2002. - ISBN 1402010796 .
GAF Seber, CJ Wild. nelineární regrese. - New York: John Wiley and Sons, 1989. - ISBN 0471617601 .

Nejmenší čtverce a regresní analýza

Výpočetní statistika

Metoda nejmenších čtverců
Lineární MNC
Nelineární nejmenší čtverce
LSM s iterativním přepočtem vah

Korelace
a závislost

Pearsonův korelační koeficient
Korelace pořadí ( Spearman
Kendall )
Částečná korelace
Zkreslující faktor

Regresní analýza

Normální MNC
Metoda částečných nejmenších čtverců
Nejmenší plné čtverce
Ridge regrese

Regrese jako
statistický
model

Lineární regrese	Jednoduchá lineární regrese Normální MNC Zobecněné nejmenší čtverce Vážené nejmenší čtverce Základní lineární model
prediktivní struktura	Polynomiální regrese růstová křivka Segmentovaná regrese Lokální regrese
Vlastní regrese	nelineární Neparametrické semiparametrické udržitelného kvantil izotonický
Nestandardní chyby	Zobecněný lineární model Binomická regrese Poissonova regrese Logistická regrese

Rozklad rozptylu

Analýza rozptylu
Kovarianční analýza
Vícerozměrná analýza rozptylu

Modelová studie

C p Sléz
Postupná regrese
Výběr statistického modelu
Validace regresního modelu

Předpoklady

Průměrná a očekávaná odezva
Gauss-Markovova věta
Chyby a odchylky
Statistický test
Studentská rovnováha
Minimální střední kvadratická chyba

Plánování
experimentů

Metodika povrchu odezvy
Optimální design experimentu
Bayesovský experimentální design

Numerická
aproximace

Aplikace

Aproximace pomocí křivek
Kalibrační křivka
Savitsky-Golayův filtr
Identifikace systému
Přesouvání metodou nejmenších čtverců