Optimální kontrola |
---|
Optimální řízení je úkolem navrhnout systém, který poskytuje danému řídicímu objektu nebo procesu zákon řízení nebo řídicí sekvenci akcí, které poskytují maximum nebo minimum daného souboru kritérií kvality systému [1] .
Optimální řídicí problém zahrnuje výpočet optimálního řídicího programu a syntézu optimálního řídicího systému. Optimální řídicí programy se zpravidla počítají numerickými metodami pro nalezení extrému funkcionálu nebo řešení okrajové úlohy pro soustavu diferenciálních rovnic [2] . Z matematického hlediska je syntéza optimálních řídicích systémů problémem nelineárního programování ve funkčních prostorech [3] .
Pro řešení problému určení optimálního řídicího programu je sestaven matematický model řízeného objektu nebo procesu, který popisuje jeho chování v čase pod vlivem řídicích akcí a jeho vlastního aktuálního stavu [4] .
Pokud není předem znám matematický model řízeného objektu nebo procesu, pak k jeho určení je nutné provést postup pro identifikaci řízeného objektu nebo procesu [5]
Matematický model pro problém optimálního řízení zahrnuje: formulaci cíle kontroly vyjádřeného kritériem kvality kontroly; definice diferenciálních nebo diferenčních rovnic [6] popisujících možné způsoby pohybu řídicího objektu; definice omezení použitých zdrojů ve formě rovnic nebo nerovnic [7] .
Všechny úlohy optimálního řízení lze považovat za úlohy matematického programování a lze je v této podobě řešit numerickými metodami. [8] [9]
Při optimálním řízení hierarchických víceúrovňových systémů se využívají např. velké chemické průmysly, hutní a energetické komplexy, víceúčelové a víceúrovňové hierarchické systémy optimálního řízení. Matematický model zavádí kritéria kvality řízení pro každou úroveň řízení a pro celý systém jako celek a také koordinaci akcí mezi úrovněmi řízení [10] [11] .
Pokud je řízený objekt nebo proces deterministický, pak se k jeho popisu používají diferenciální rovnice. Nejčastěji používané obyčejné diferenciální rovnice jsou ve tvaru . Ve složitějších matematických modelech (pro systémy s distribuovanými parametry) se k popisu objektu používají parciální diferenciální rovnice . Pokud je řízený objekt stochastický, pak se k jeho popisu použijí stochastické diferenciální rovnice .
Teorie diferenciálních her se používá k řešení problémů optimálního řízení za podmínek konfliktu nebo nejistoty . [12]
Pokud řešení daného problému optimálního řízení není spojitě závislé na počátečních datech ( chybně položený problém ), pak se takový problém řeší speciálními numerickými metodami. [13]
Pro řešení problémů optimálního řízení s neúplnými počátečními informacemi a za přítomnosti chyb měření se používá metoda maximální věrohodnosti [14] .
Optimální řídicí systém schopný shromažďovat zkušenosti a zlepšovat svou práci na tomto základě se nazývá učící se optimální řídicí systém [15] .
Skutečné chování objektu nebo systému se vždy liší od programu v důsledku nepřesností ve výchozích podmínkách, neúplných informací o vnějších poruchách působících na objekt, nepřesností v provádění programového řízení atd. Proto pro minimalizaci odchylky objektu chování od optimálního, obvykle se používá automatický řídicí systém . [16]
Někdy (například při řízení složitých objektů, jako je vysoká pec v metalurgii nebo při analýze ekonomických informací), počáteční data a znalosti o kontrolovaném objektu při nastavení optimálního řídicího problému obsahují nejisté nebo nejasné informace, které nelze zpracovat tradičními kvantitativní metody. V takových případech lze použít optimální řídicí algoritmy založené na matematické teorii fuzzy množin ( fuzzy řízení ). Použité pojmy a znalosti jsou převedeny do fuzzy formy, jsou určena fuzzy pravidla pro vyvozování rozhodnutí a následně je provedena inverzní transformace fuzzy rozhodnutí na fyzikální řídicí proměnné. [17] [11]
Pro optimální řízení ekonomických procesů se používají metody ekonomické kybernetiky , teorie her , teorie grafů [18]
Nejrozšířeněji se při návrhu řídicích systémů pro deterministické objekty se soustředěnými parametry popsanými obyčejnými diferenciálními rovnicemi používají následující metody: variační počet , Pontryaginův princip maxima a Bellmanovo dynamické programování [1] .
Problém optimálního řízeníFormulujeme problém optimálního ovládání:
zde — stavový vektor — řízení, — počáteční a konečné okamžiky času.
Optimálním problémem řízení je najít stavové a řídící funkce pro čas , které minimalizují funkčnost.
Variační početPovažujte tento problém optimálního řízení za Lagrangeův problém variačního počtu [19] . Abychom našli potřebné podmínky pro extrém, použijeme Eulerovu-Lagrangeovu větu [19] . Lagrangeova funkce má tvar: , kde jsou okrajové podmínky. Lagrangián má tvar: , kde , , jsou n-rozměrné vektory Lagrangeových multiplikátorů .
Nezbytné podmínky pro extrém podle této věty jsou:
Nezbytné podmínky (3-5) tvoří základ pro určení optimálních trajektorií. Napsáním těchto rovnic získáme dvoubodovou okrajovou úlohu, kde část okrajových podmínek je nastavena v počátečním okamžiku a zbytek v konečném okamžiku. Metody řešení takových problémů jsou podrobně rozebrány v knize [20]
Pontrjaginův princip maximaPotřeba Pontrjaginova maxima v zásadě vzniká tehdy, když nikde v přípustném rozsahu řídící veličiny není možné splnit nutnou podmínku (3), totiž .
V tomto případě je podmínka (3) nahrazena podmínkou (6):
(6)V tomto případě je podle Pontrjaginova principu maxima hodnota optimální kontroly rovna hodnotě kontroly na jednom z konců přípustného rozsahu. Pontryaginovy rovnice jsou psány pomocí Hamiltonovy funkce definované vztahem . Z rovnic vyplývá, že Hamiltonova funkce souvisí s Lagrangeovou funkcí následovně: . Dosazením z poslední rovnice do rovnic (3–5) získáme potřebné podmínky vyjádřené Hamiltonovou funkcí:
Nezbytné podmínky zapsané v tomto tvaru se nazývají Pontrjaginovy rovnice. Princip Pontrjaginova maxima je podrobněji rozebrán v knize [19] .
PříkladNechť je potřeba vyřešit problém minimalizace funkčnosti:
, kde , , .Hamiltonova funkce má v tomto případě tvar:
.Z podmínek 9) a 10) zjistíme, že:
, .Dostaneme:
.Maximum této funkce vzhledem k , , je dosaženo v , kde
Podle podmínek, . Prostředek:
Od , dostáváme . Z podmínky spojitosti v bodě najdeme konstantu .
Takto:
Lze ověřit, že nalezené a představují optimální řešení tohoto problému [21]
PřípadněPrincip maxima je důležitý zejména v řídicích systémech s maximální rychlostí a minimální spotřebou energie, kde se používají reléové regulace, které v přípustném regulačním intervalu nabývají spíše extrémních než středních hodnot.
HistorieZa rozvoj teorie optimálního řízení byli L. S. Pontrjagin a jeho spolupracovníci V. G. Boltyansky , R. V. Gamkrelidze a E. F. Miščenko v roce 1962 oceněni Leninovou cenou .
Metoda dynamického programováníMetoda dynamického programování je založena na Bellmanově principu optimality, který je formulován následovně: optimální strategie řízení má tu vlastnost, že bez ohledu na počáteční stav a řízení na začátku procesu musí následné kontroly představovat optimální strategii řízení s ohledem na stav získaný po počáteční fázi procesu [22] . Metoda dynamického programování je podrobněji popsána v knize [23]
Dostatečné podmínky optimalityDostatečné podmínky pro optimalitu řízených procesů získal v roce 1962 V. F. Krotov , na jejich základě byly zkonstruovány iterativní výpočetní metody postupného zlepšování, umožňující nalézt globální optimum v problémech řízení [24] [25] [26] .
V úlohách optimálního řízení takových objektů, jako je průběžná topná pec, výměník tepla , potahovací zařízení, sušící jednotka, chemický reaktor , separátor směsi, vysoká pec nebo pec s otevřenou nístějí , koksárenská baterie, válcovací zařízení. mlýn , indukční ohřívací pec atd. řízený proces je popsán pomocí parciálních diferenciálních rovnic, integrálních rovnic a integro-diferenciálních rovnic.
Teorie optimálního řízení byla v tomto případě vyvinuta pouze pro určité typy těchto rovnic: eliptické, parabolické a hyperbolické typy.
V některých jednoduchých případech je možné získat analog Pontryaginova maximálního principu. [27] [28]
Pokud mají řešení soustav rovnic nestability, body nespojitosti, body bifurkace, více řešení, pak se k jejich získání používá řada speciálních metod [29] .
Problém optimálního řízeníPro formulaci maximálního principu pro systémy s distribuovanými parametry je zavedena Hamiltonova funkce: , kde pomocné funkce musí splňovat rovnice a okrajové podmínky pro , pro , .
Jestliže je optimální řízení a funkce získané pod optimálním řízením splňují rovnice , pak funkce , uvažovaná jako funkce argumentu , dosahuje maxima v oblasti u , tedy téměř pro všechny body , rovnosti |
Pokud je systém lineárním systémem tvaru , pak věta
Pro optimální řízení v lineárním případě je nutné a postačující, aby byl splněn princip maxima. |
Viz důkaz těchto dvou teorémů v knize [28] .
V tomto případě je řízený objekt nebo proces popsán lineárními stochastickými diferenciálními rovnicemi . V tomto případě je řešení úlohy optimálního řízení provedeno na základě Riccatiho rovnice [30] .
Slovníky a encyklopedie | |
---|---|
V bibliografických katalozích |