Newtonova metoda, Newtonův algoritmus ( také známý jako metoda tečny ) je iterativní numerická metoda pro nalezení kořene ( nuly ) dané funkce . Tuto metodu poprvé navrhl anglický fyzik , matematik a astronom Isaac Newton ( 1643-1727 ) . Hledání řešení se provádí konstrukcí postupných aproximací a je založeno na principech jednoduché iterace . Metoda má kvadratickou konvergenci . Modifikací metody je metoda tětiv a tečen . Newtonovu metodu lze také použít k řešení optimalizačních problémů , ve kterých je potřeba určit nulu první derivace nebo gradientu v případě vícerozměrného prostoru.
Abychom rovnici numericky vyřešili metodou jednoduché iterace , musíme ji zredukovat na ekvivalentní rovnici: , kde je mapování kontrakce .
Pro nejlepší konvergenci metody v bodě další aproximace musí být splněna podmínka . Řešení této rovnice se hledá ve tvaru , pak:
Za předpokladu, že bod aproximace je „dostatečně blízko“ kořenu a že daná funkce je spojitá , konečný vzorec pro je:
S ohledem na to je funkce definována:
Za určitých podmínek tato funkce provádí mapování kontrakce v okolí kořene.
DůkazNechť je dána funkce reálné proměnné , která je ve svém oboru definice dvakrát spojitě diferencovatelná a jejíž derivace nikdy nezmizí:
A je nutné dokázat, že funkce provádí kontrakční zobrazení blízko kořene rovnice .
Kvůli spojité diferencovatelnosti funkce a nerovnosti nuly je její první derivace spojitá .
Derivát je:
Za podmínek uložených na , je také nepřetržitý. Nechť je požadovaný kořen rovnice: , tedy v jejím okolí :
Pak podle Lagrangeovy věty :
Vzhledem k tomu, že ve stejném sousedství delty platí následující:
Takto získaná funkce v okolí kořene implementuje mapování kontrakce . ■
V tomto případě je algoritmus pro nalezení numerického řešení rovnice redukován na postup iterativního výpočtu :
Podle Banachovy věty má posloupnost aproximací sklon ke kořeni rovnice .
Hlavní myšlenka metody je následující: počáteční aproximace je nastavena blízko hypotetického kořene, poté je v aproximačním bodě vykreslena tečna ke grafu studované funkce, pro kterou je průsečík s osou úsečky nalezeno. Tento bod je brán jako další aproximace. A tak dále, dokud není dosaženo požadované přesnosti.
Nechť 1) reálná funkce je spojitě derivovatelná na intervalu ;
2) existuje požadovaný bod : ;
3) existují i takové, že
pro
a
pro ;
4) pointa je taková, že . Potom vzorec pro iterační aproximaci ke k
lze odvodit z geometrického významu tečny takto:
kde je úhel sklonu tečny ke grafu v bodě .
Proto (v rovnici tečné přímky předpokládáme ) požadovaný výraz pro má tvar:
Pokud , pak lze tuto hodnotu použít jako další aproximaci k .
Jestliže , pak existuje „úlet“ (kořen leží blízko hranice ). V tomto případě je nutné (pomocí myšlenky metody bisekce ) nahrazovat , dokud se bod „nevrátí“ do oblasti hledání .
Poznámky. 1) Přítomnost spojité derivace umožňuje vybudovat plynule se měnící tečnu na celé ploše hledání řešení .
2) Případy hraničního (v bodě nebo v bodě ) umístění požadovaného řešení jsou uvažovány obdobným způsobem.
3) Z geometrického hlediska rovnost
znamená, že tečna ke grafu
v bodě
- je rovnoběžná s osou
a
na konci se s ní neprotíná.
4) Čím větší je konstanta a čím menší je konstanta z odstavce 3 podmínek, tím blíže je
průsečík tečny ke grafu a osa k bodu , to znamená, že se hodnota blíží požadované hodnotě .
Iterační proces začíná nějakou počáteční aproximací a mezi požadovaným bodem by neměly být další nuly funkce , tedy "čím blíže k požadovanému kořeni , tím lépe." Pokud neexistují žádné předpoklady o nalezení , pokus a omyl mohou zúžit rozsah možných hodnot použitím teorému střední hodnoty .
U předdefinovaných se
iterační proces ukončí , pokud
a
.
Zejména pro zobrazovací matici a lze vypočítat na základě měřítka zobrazení grafu , to znamená, pokud a spadají do jedné vertikální a do jedné horizontální řady.
Zvažte problém hledání pozitivních , pro které . Tato úloha může být reprezentována jako úloha najít nulu funkce . Máme výraz pro derivaci . Protože pro všechny a pro je zřejmé , že řešení leží mezi 0 a 1. Vezměme hodnotu jako počáteční aproximaci , pak:
Platné platné číslice jsou podtržené . Je vidět, že jejich počet roste krok od kroku (přibližně se zdvojnásobuje s každým krokem): od 1 do 2, od 2 do 5, od 5 do 10, což ilustruje kvadratickou rychlost konvergence .
Podívejme se na několik příkladů poukazujících na nedostatky metody.
Nechat
Pak
Vezměme nulu jako počáteční aproximaci. První iterace dá jednotku jako aproximaci. Druhý zase dá nulu. Metoda se zacyklí a nebude nalezeno žádné řešení. Obecně může být konstrukce posloupnosti aproximací velmi matoucí .
Zvažte funkci:
Tehdy a všude kromě 0.
V blízkosti kořene derivace mění znaménko při přiblížení k nule zprava nebo zleva. Zatímco pro .
Není tedy omezena blízko kořene a metoda bude divergovat, i když je funkce všude diferencovatelná, její derivace je nenulová v kořenu, nekonečně diferencovatelná všude kromě kořene a její derivace je ohraničena kolem kořene. .
Zvažte příklad:
Potom a kromě případů , kdy to není definováno.
V dalším kroku máme :
Rychlost konvergence výsledné sekvence je přibližně 4/3. To je výrazně méně než 2, což je nutné pro kvadratickou konvergenci, takže v tomto případě můžeme mluvit pouze o lineární konvergenci, ačkoli funkce je všude spojitě diferencovatelná , derivace v kořeni není rovna nule a je všude nekonečně diferencovatelná . kromě kořene.
Nechat
Pak a odtud . Konvergence metody tedy není kvadratická, ale lineární, ačkoli funkce je všude nekonečně diferencovatelná.
Nechť je rovnice dána , kde a je třeba najít její řešení.
Níže je uvedena formulace hlavní věty, která nám umožňuje dát jasné podmínky použitelnosti. Nese jméno sovětského matematika a ekonoma Leonida Vitalieviče Kantoroviče ( 1912-1986 ) .
Kantorovičova věta.
Pokud existují takové konstanty , že:
Navíc délka uvažovaného segmentu . Pak jsou pravdivá následující tvrzení:
Z posledního tvrzení věty zejména vyplývá kvadratická konvergence metody:
Pak budou omezení původní funkce vypadat takto:
Metodu popsal Isaac Newton v rukopise O analýze rovnicemi nekonečných řad ( latinsky De analysi per aequationes numero terminorum infinitas ) adresovaném Barrowovi v roce 1669 a v The Method of Fluxions and Infinite Series ( latinsky: De metodis fluxionum et serierum infinitarum" ) nebo " Analytická geometrie " ( lat. "Geometria analytica" ) ve sbírkách Newtonových děl, která byla napsána v roce 1671 . Ve svých spisech Newton zavádí pojmy, jako je expanze funkce do řady , infinitesimals a fluxions ( deriváty v současném smyslu). Tato díla vyšla mnohem později: první vyšla v roce 1711 zásluhou Williama Johnsona, druhá vyšla Johnem Colzonem v roce 1736 po smrti tvůrce. Popis metody se však výrazně lišil od jeho současného výkladu: Newton aplikoval svou metodu výhradně na polynomy . Počítal ne po sobě jdoucí aproximace , ale posloupnost polynomů a jako výsledek obdržel přibližné řešení .
Metoda byla poprvé publikována v pojednání „Algebra“ od Johna Wallise v roce 1685, na jehož žádost ji stručně popsal sám Newton. V roce 1690 Joseph Raphson publikoval zjednodušený popis ve svém „Analysis aequationum universalis“ ( latinsky: „Analysis aequationum universalis“ ). Raphson si prohlížel Newtonovu metodu jako čistě algebraickou a omezil její použití na polynomy, ale popsal metodu v podmínkách postupných aproximací namísto obtížněji pochopitelné sekvence polynomů používané Newtonem. Konečně v roce 1740 byla Newtonova metoda popsána Thomasem Simpsonem jako iterační metoda prvního řádu pro řešení nelineárních rovnic pomocí derivace, jak je zde uvedeno. Ve stejné publikaci Simpson zobecnil metodu na případ systému dvou rovnic a poznamenal, že Newtonova metoda může být také aplikována na optimalizační problémy nalezením nuly derivace nebo gradientu .
V 1879, Arthur Cayley , v Newton-Fourier imaginární problém, byl první poukázat na potíže v zobecnění Newtonovy metody k případu imaginárních kořenů polynomials stupně vyšší než sekunda a komplexní počáteční aproximace. Tato práce připravila cestu pro studium teorie fraktálů .
Související metoda sečny je Newtonova „přibližná“ metoda a vyhýbá se výpočtu derivace. Hodnota derivátu v iteračním vzorci je nahrazena jeho odhadem pro dva předchozí body iterace:
.
Hlavní vzorec má tedy tvar
Tato metoda je podobná Newtonově metodě, ale má o něco pomalejší rychlost konvergence. Pořadí konvergence metody se rovná zlatému řezu - 1,618 ...
Poznámky. 1) Pro zahájení iteračního procesu jsou vyžadovány dvě různé hodnoty
a
.
2) Na rozdíl od „reálné Newtonovy metody“ (metoda tečny), která vyžaduje pouze ukládání
(a dočasně během výpočtů a ), metoda sečny vyžaduje uložení
,
,
,
.
3) Používá se, pokud je výpočet obtížný (například vyžaduje velké množství strojových zdrojů: čas a / nebo paměť).
Aby se snížil počet volání na hodnoty derivace funkce, používá se takzvaná metoda jedné tečny.
Iterační vzorec pro tuto metodu je:
Podstatou metody je vypočítat derivaci pouze jednou, v počátečním aproximačním bodě , a tuto hodnotu pak použít v každé následující iteraci:
S touto volbou platí v bodě následující rovnost :
a pokud je segment, na kterém se předpokládá přítomnost kořene a je zvolena počáteční aproximace , dostatečně malý a derivace je spojitá, pak se hodnota nebude příliš lišit , a proto bude graf procházet téměř vodorovně a protínat přímka , což zase zajistí rychlou konvergenci posloupnosti aproximačních bodů ke kořenu.
Tato metoda je speciálním případem metody jednoduché iterace . Má lineární řád konvergence.
Zobecněme získaný výsledek na vícerozměrný případ.
Nechť je nutné najít řešení systému:
Vybereme-li si nějakou počáteční hodnotu , nalezneme postupné aproximace řešením soustav rovnic :
kde .
Nechť je třeba najít minimum funkce několika proměnných . Tato úloha je ekvivalentní problému nalezení nuly gradientu . Aplikujme výše uvedenou Newtonovu metodu:
kde je hesián funkce .
V pohodlnější iterační formě tento výraz vypadá takto:
Je třeba poznamenat, že v případě kvadratické funkce najde Newtonova metoda extrém v jedné iteraci.
Nalezení hessovské matice je výpočetně nákladné a často nemožné. V takových případech mohou jako alternativa sloužit kvazi-newtonské metody , ve kterých je v procesu akumulace informací o zakřivení funkce zabudována aproximace Hessovy matice.
Newton-Raphsonova metoda je vylepšením Newtonovy extrémní metody popsané výše. Hlavní rozdíl je v tom, že při další iteraci jedna z metod jednorozměrné optimalizace vybere optimální krok:
kde K optimalizaci výpočtů se používá následující vylepšení: místo přepočítávání Hessianu účelové funkce při každé iteraci se omezíme na počáteční aproximaci a aktualizujeme ji pouze jednou v krocích, nebo ji neaktualizujeme vůbec.
V praxi se často vyskytují úlohy, ve kterých je potřeba upravit volné parametry objektu nebo upravit matematický model na reálná data. V těchto případech se objevují problémy nejmenších čtverců :
Tyto problémy se vyznačují speciálním druhem gradientu a hessovské matice :
kde je Jacobiho matice vektorové funkce , je Hessova matice pro její složku .
Poté se ze systému určí další krok:
Gauss-Newtonova metoda je založena na předpokladu, že člen dominuje nad . Tento požadavek není splněn, pokud jsou minimální rezidua velká, tedy pokud je norma srovnatelná s maximální vlastní hodnotou matice . Jinak můžete napsat:
Když je tedy norma blízká nule a matice má plnou hodnost sloupce , krok se od newtonovského kroku liší jen málo (s přihlédnutím k ), a metoda může dosáhnout kvadratické míry konvergence, i když se druhé derivace neberou v úvahu. účet. Vylepšením metody je Levenberg-Marquardtův algoritmus založený na heuristických úvahách.
Doposud se v popisu metody používaly funkce, které provádějí mapování v rámci množiny reálných hodnot . Metodu však lze také použít k nalezení nuly funkce komplexní proměnné . Postup však zůstává stejný:
Zvláště zajímavá je volba počáteční aproximace . Vzhledem k tomu, že funkce může mít několik nul, může metoda v různých případech konvergovat k různým hodnotám a je zcela přirozené chtít zjistit, které oblasti zajistí konvergenci ke konkrétnímu kořenu. Tato otázka zajímala Arthura Cayleyho již v roce 1879 , ale bylo možné ji vyřešit až v 70. letech dvacátého století s příchodem výpočetní techniky. Ukázalo se, že na průsečíkech těchto oblastí (obvykle se jim říká oblasti přitažlivosti ) vznikají takzvané fraktály - nekonečné sobě podobné geometrické obrazce.
Vzhledem k tomu, že Newton aplikoval svou metodu výhradně na polynomy , fraktály vzniklé v důsledku takové aplikace se staly známými jako Newtonovy fraktály nebo Newtonovy bazény .
Optimalizační metody | |
---|---|
Jednorozměrný |
|
Nulové pořadí | |
První objednávka | |
druhá objednávka | |
Stochastické | |
Metody lineárního programování | |
Metody nelineárního programování |