Neurofeedback

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 20. února 2016; kontroly vyžadují 26 úprav .

Neurocontrol ( angl. Neurocontrol ) je speciální případ inteligentního řízení , které využívá umělé neuronové sítě k řešení problémů řízení dynamických objektů. Neurocontrol je průsečíkem takových disciplín, jako je umělá inteligence , neurofyziologie , teorie automatického řízení , robotika . Neuronové sítěmají řadu unikátních vlastností, které z nich dělají silný nástroj pro tvorbu řídicích systémů: schopnost učit se z příkladů a zobecňovat data, schopnost přizpůsobovat se změnám vlastností řídicího objektu a prostředí, vhodnost pro syntézu nelineárních řadiče, vysoká odolnost proti poškození jejich prvků v důsledku počáteční inherentní architektury neuronové sítě paralelismu. Termín „neurofeedback“ poprvé použil jeden z autorů metody backpropagation Paul J. Verbos v roce 1976 [1] [2] . Existuje mnoho příkladů praktické aplikace neuronových sítí pro řešení problémů řízení letadla [3] [4] , vrtulníku [5] , robotického automobilu [6] , rychlosti hřídele motoru [7] , hybridního motoru automobilu [8] , elektrická pec [9] , turbogenerátor [10] , svařovací stroj [11] , pneumatický válec [12] , systém řízení výzbroje pro lehce obrněná vozidla [13] , model obráceného kyvadla [14] .

Metody neurofeedbacku

Podle způsobu použití neuronových sítí se metody neurokontroly dělí na přímé a nepřímé . U přímých metod je neuronová síť trénována k přímému generování řídicích akcí na objektu, v nepřímých metodách je neuronová síť trénována k provádění pomocných funkcí: identifikace řídicího objektu , potlačení šumu , provozní nastavení koeficientů PID regulátoru . V závislosti na počtu neuronových sítí, které tvoří neurokontrolér, se neurokontrolní systémy dělí na jednomodulové a vícemodulové . Neurocontrol systémy, které se používají ve spojení s tradičními regulátory, se nazývají hybridní .

V oblasti řízení se umělé neurální systémy (ANS) používají v úlohách identifikace objektů, v algoritmech pro predikci a diagnostiku a také pro syntézu optimálních automatických řídicích systémů (ACS) . Pro implementaci ACP na bázi ANN se v současné době intenzivně rozvíjí výroba neuročipů a neurokontrolérů (NC) .

V určitém smyslu je ANN imitátorem mozku, který má schopnost učit se a orientovat se v podmínkách nejistoty. Umělá neuronová síť je podobná mozku ve dvou aspektech. Síť získává znalosti v procesu učení a k ukládání znalostí nepoužívá objekty samotné, ale jejich spojení - hodnoty koeficientů interneuronálních spojení, nazývané synaptické váhy nebo synaptické koeficienty [15] .

V úlohách neurokontroly se k reprezentaci řídicího objektu používá model černé skříňky, ve kterém jsou pozorovatelné aktuální vstupní a výstupní hodnoty. Stav objektu je považován za nepřístupný pro vnější pozorování, ačkoli rozměr vektoru stavu je obvykle považován za pevný. Dynamika chování řídicího objektu může být reprezentována v diskrétní formě:

{\begin{matrix}S(k+1)=\Phi (S(k),u(k)))\\y(k+1)=\Psi (S(k))\end{ matice}}

kde: je stav objektu řízení objednávky v cyklu ; je hodnota -rozměrného řídicího vektoru cyklu , je hodnota -rozměrného výstupu řídicího objektu v cyklu . ${\displaystyle S(k)\in \mathbb {R} ^{N))$ $N$ $k$ ${\displaystyle u(k)\in \mathbb {R} ^{P))$ $P$ $k$ ${\displaystyle y(k+1)\in \mathbb {R} ^{V))$ $PROTI$ $k+1$

K odhadu aktuálního stavu řídicího objektu lze použít model NARX, který se skládá z minulých poloh objektu a zpožděných řídicích signálů : $S(k)$ $y$ $u$

S(k)=[y(k)~y(k-1)~y(k-2)~\ldots ~y(kN)~u(k-1)~u(k-2)~ \ldots ~u(kQ)]^{T}

Vektor odhadu stavu lze také reprezentovat bez použití zpožděných signálů: $S$

{\displaystyle S(k)=[y(k)~y(k-1)~y(k-2)~\ldots ~y(kN)]^{T))

Je také možné znázornit stav objektu jako snímek jeho fázové trajektorie:

{\displaystyle S(k)=[y(k)~y(k)'~\ldots ~y(k)^{(N)}]^{T))

Mimická neurofeedback

Imitativní neurokontrola [16] [17] [18] (učení neurokontroly založené na mimice, modelování regulátoru, učení pod dohledem pomocí existujícího regulátoru) pokrývá systémy neurokontroly, ve kterých je neurokontrolér trénován na příkladech dynamiky konvenčního zpětnovazebního regulátoru postaveného, např. například na základě konvenčního regulačního schématu PID . Po trénování neuronová síť přesně reprodukuje funkce původního ovladače. Záznam chování lidského operátora lze použít jako příklady dynamiky regulátoru. Konvenční zpětnovazební regulátor (nebo lidský operátor) řídí řídicí objekt v normálním režimu. Zaznamenávají se hodnoty na vstupu a výstupu regulátoru a na základě protokolu se vytvoří trénovací vzorek pro neuronovou síť obsahující dvojice vstupních hodnot a očekávané reakce neuronové sítě: ${\displaystyle U=\{P_{i},T_{i}\}_{i=1}^{M))$ $M$ $P_{i}$ $T_{i}$

{\begin{matrix}P_{i}=[r(i+1)~S(i)]^{T}\\T_{i}=u(i)\end{matrix))

Po naučení např. backpropagation se neuronová síť připojí na místo původního řadiče. Výsledný neurokontrolér může nahradit osobu při správě zařízení a je také cenově výhodnější než původní ovladač.

Generalizovaná inverzní neurokontrola

Ve schématu zobecněného inverzního neurořízení (přímé inverzní neurořízení, adaptivní inverzní řízení) [19] [20] je jako regulátor použit neurální model inverzní dynamiky řídicího objektu, nazývaný inverzní neuroemulátor . Inverzní neuroemulátor je neuronová síť cvičená offline k simulaci zpětné dynamiky řídicího objektu na základě zaznamenaných trajektorií chování dynamického objektu. K získání takových trajektorií je do řídicího objektu přiváděn nějaký náhodný proces jako řídicí signál. Hodnoty řídicích signálů a odezvy objektu jsou zaznamenány a na tomto základě je vytvořen trénovací vzorek : ${\displaystyle U=\{P_{i},T_{i}\}_{i=1}^{M))$

{\begin{matrix}P_{i}=[y(i)~S(i-1)]^{T}\\T_{i}=u(i)\end{matrix))

V průběhu tréninku musí neuronová síť zachytit a zapamatovat si závislost hodnot řídicího signálu na následné hodnotě reakce řídicího objektu , který byl předtím ve stavu . Při ovládání objektu je jako regulátor zapojen inverzní neuroemulátor, který přijímá na vstupu hodnoty žádané hodnoty (určitá hodnota nebo parametr, při jehož dosažení se stav systému změní) a stav přicházejícího ovládacího objektu. kanál zpětné vazby : $u(k-1)$ $y(k)$ $S(k-1)$ $x(k)$ $r(k+1)$ $S(k)$

{\displaystyle x(k)=[r(k+1)~S(k)]^{T))

Předpokládá se, že inverzní model řídicího objektu vytvořený při tréninku je adekvátní, proto řídicí signál vydaný neuronovou sítí zajistí přechod objektu do polohy určené nastavením.

Specializovaná inverzní neurofeedback

Specializované inverzní neurokontrola [19] [20] využívá metodu trénování neurokontroléru online pomocí aktuální chyby odchylky polohy objektu od žádané hodnoty . Schéma zapojení neurokontroléru je stejné jako u metody generalizovaného inverzního neurokontrolu . Vektor je přiveden na vstup sítě : $e(k)=r(k)-y(k)$ $x(k)$

{\displaystyle x(k)=[r(k+1)~S(k)]^{T))

Neuronová síť generuje řídicí vektor , který přesune řídicí objekt do polohy . Dále se vypočítá aktuální chyba neurokontroléru $u(k)$ $y(k+1)$

e(k)=r(k+1)-y(k+1)

Vypočítá se gradient změny hmotnosti

\Delta w=e(k){\frac {\částečné y(k+1)}{\částečné u(k))){\frac {\částečné u(k)}{\částečné w(k )}}

Potom jsou hmotnosti neurokontroléru korigovány metodou nejstrmějšího klesání nebo jinou metodou gradientu .

Derivace je jakobián řídicího objektu, jehož hodnota je nastavena analyticky podle daného matematického modelu řídicího objektu. V praxi však k získání přijatelné kvality kontroly často postačí vypočítat pouze znak jakobiánu. Iterace korekcí hodnot koeficientů pokračují, dokud není dosaženo přijatelné kvality řízení. ${\displaystyle {\frac {\částečné y(k+1)}{\částečné u(k)))))$

Metoda zpětného přeskakování chyb prostřednictvím přímého neuroemulátoru

Backpropagation through time, model reference adaptive control, internal model control method [8] [21] [22] [23] je založeno na myšlence použití tandemu dvou neuronových sítí , z nichž jedna funguje jako kontrolér , a druhý je model řídicího objektu , který se nazývá přímý neuroemulátor . Přímý neuroemulátor slouží k výpočtu chybového gradientu neurokontroléru při jeho trénování a dále se nepoužívá. Dá se říci, že neurokontrolér a neuroemulátor představují jednu neuronovou síť a když je neurokontrolér trénován, váhy přímého neuroemulátoru „zmrazí“. Jako první se trénuje přímý neuroemulátor. Za tímto účelem se na vstup řídicího objektu přivede náhodný řídicí signál , který změní polohu řídicího objektu , a vytvoří se trénovací vzorek : $u$ $y$ ${\displaystyle U=\{P_{i},T_{i}\}_{i=1}^{M))$

{\begin{matrix}P_{i}=[u(i)~S(i-1)]^{T}\\T_{i}=y(i)\end{matrix))

Trénink přímého neuroemulátoru se provádí offline. Přímý neuroemulátor se považuje za trénovaný, pokud se při stejných hodnotách na vstupech neuroemulátoru a skutečného objektu rozdíl mezi hodnotami jejich výstupů stane nevýznamným. Po dokončení trénování přímého neuroemulátoru je trénován neurokontrolér. Školení probíhá online podle stejného schématu jako v případě specializovaného inverzního neurofeedbacku . Nejprve (v cyklu ) je na vstupu neurokontroléru přijata požadovaná poloha řídicího objektu pro další cyklus . Neurokontrolér generuje řídicí signál , který je přiváděn na vstupy řídicího objektu a neuroemulátoru. V důsledku toho se ovládaný objekt přesune do polohy a neuroemulátor generuje reakci . Dále se vypočítá chyba řízení a předá se v opačném směru podle pravidla zpětného šíření. Váhové koeficienty neuroemulátorových spojení nejsou v tomto případě korigovány. Mechanismus zpětné chyby procházející přímým neuroemulátorem implementuje lokální inverzní model v aktuálním bodě ve stavovém prostoru řídicího objektu. Po průchodu neuroemulátorem se chyba dále šíří neurokontrolérem, ale nyní je její průchod doprovázen korekcí váhových koeficientů neurokontroléru. V tomto případě přímý neuroemulátor plní funkce dalších vrstev neuronové sítě neurokontroléru, ve kterých nejsou korigovány váhy spojení. $k$ $r(k+1)$ $u(k)$ $y(k+1)$ ${\hat {y}}(k+1)$ $e(k)={\widehat {y}}(k+1)-y(k+1)$

Metoda neurokontroly s referenčním modelem

Metoda neurokontroly s referenčním modelem (model reference adaptive control, neural adaptive control) [23] [24] [25] je variantou neurokontroly metodou zpětného přeskakování chyb přes přímý neuroemulátor s přídavným referenčním modelem (referenční model) dynamického systému zabudovaného v obvodu, pro simulaci, jehož chování je trénováno neurokontrolérem. To se provádí za účelem zlepšení kvality procesu přechodu: v případě, že přechod objektu do cílové polohy v jednom cyklu není možný, trajektorie pohybu a doba procesu přechodu se stávají špatně předvídatelnými hodnotami. a může vést k nestabilitě procesu přechodu. Pro snížení této nejistoty je zaveden referenční model, který je zpravidla stabilním lineárním dynamickým systémem prvního nebo druhého řádu. V průběhu trénování referenční model přijímá na vstupu požadovanou hodnotu a generuje referenční trajektorii , která je porovnávána s polohou řídicího objektu , aby se získala chyba řízení , aby se minimalizovala, kterou je neurokontrolér trénován. $k$ $r(k+1)$ $y'(k+1)$ $y(k+1)$ $e(k+1)$

Metoda filtrování vnějších rušení neuronovou sítí

Ke zkvalitnění regulátoru v regulačním obvodu slouží metoda filtrování vnějších rušení neuronovou sítí (adaptivní inverzní řízení založené na lineární a nelineární adaptivní filtraci, řízení vnitřního modelu) [26] . Toto schéma původně navrhl B. Widrow pro použití ve spojení s neurokontroléry trénovanými metodou generalizované inverzní neurokontroly [27] . V pozdější práci [28] použil neurokontroléry trénované metodou zpětného šíření chyb prostřednictvím přímého neuroemulátoru . V zásadě lze filtrování chyb neuronové sítě použít ke zlepšení výkonu libovolného typu řadiče, ne nutně neuronové sítě . Toto schéma používá dvě předtrénované neuronové sítě: inverzní neuroemulátor trénovaný stejným způsobem, jako se to dělá v metodě zobecněné inverzní neurokontroly, a přímý neuroemulátor trénovaný stejným způsobem, jako se to dělá v metodě zpětného šíření prostřednictvím přímého neuroemulátoru . Nechte řídicí signál dorazit k řídicímu objektu , který je výsledkem sečtení signálu regulátoru a korekčního signálu systému externího filtrování poruch , vypočítaného v předchozím kroku. Signál je odeslán do přímého neuroemulátoru řídicího objektu a reakce přímého neuroemulátoru je porovnána se skutečným stavem systému . Rozdíl mezi těmito hodnotami je interpretován jako nežádoucí odchylka systému způsobená vnější poruchou. K potlačení nežádoucího účinku je signál odeslán do inverzního neuroemulátoru, který vypočítává korekční signál pro korekci řídicího signálu neurokontroléru v dalším cyklu. ${\hat {u}}_{F}(k)$ ${\hat {u}}(k)$ ${\hat {u}}_{C}(k)$ $y(k)$ $e(k)$ ${\hat {u}}_{C}(k+1)$ ${\hat {u}}(k+1)$

Pro použití této metody musí mít řídicí objekt reverzibilní dynamiku a dále je nutné mít adekvátní matematický nebo simulační model řídicího objektu pro trénování přímých a inverzních neuroemulátorů.

Prediktivní model neurofeedback

Prediktivní model neurokontroly (NN prediktivní řízení, model prediktivního řízení, neurální zobecněné prediktivní řízení) [29] [30] minimalizuje integrální chybový funkcionál , predikovaný pro , cykly dopředu: $Q(k)$ $L=max(L_{2},L_{3})$ ${\displaystyle 0\leq L_{1}\leq L_{2))$

$Q(k)=\sum _{i=L_{1}}^{L_{2}}e(k+i)^{2}+\rho \sum _{i=0}^{L_ {3}}(u(k+i)-u(k+i-1))^{2}.$

Zde je chyba výstupu systému, je příspěvek změny řídicího signálu k celkovým nákladům na funkcionalitu . K predikci budoucího chování systému a výpočtu chyb se používá přímý neuroemulátor, trénovaný stejně jako v metodě zpětného šíření chyb přes přímý neuroemulátor . Zvláštností uvažované metody je, že nemá trénovatelný neurokontrolér. Jeho místo zaujímá modul optimalizace v reálném čase , ve kterém lze použít např. simplexovou metodu [31] nebo kvazi-newtonský algoritmus [32] . $e(k)$ $\rho$ $Q(k)$

Optimalizační modul přijímá cílovou trajektorii pro cykly vpřed v cyklu, a pokud tam není, pak duplikuje hodnotu aktuální požadované hodnoty a používá ji jako cílovou trajektorii. Dále, pro výběr optimální řídicí akce, probíhají výpočty ve vnitřní smyčce neuroregulačního systému (jeho iterace jsou označeny jako ). Během jednoho řídicího cyklu optimalizační modul přivádí řadu různých akcí na vstup neuroemulátoru , kde je hloubka predikce ,, přijímá různé možnosti chování systému, vypočítává pro ně nákladovou funkci a určuje nejlepší strategii řízení . V důsledku toho je na objekt aplikován řídicí signál . V dalším cyklu se strategie přepočítá. $L$ $L$ $r(k+1)$ $j$ ${\hat {u}}(k+t,j)$ $t$ $0\leq t\leq L-1$ $Q(k)$ $ST=\{{\hat {u}}(k,j_{1})~{\hat {u}}(k,j_{2})~\ldots ~~{\hat {u}} (k,j_{L})\}$ ${\hat {u}}(k,j_{1})$ $SVATÝ$

Adaptivní kritici

Metody neurofeedbacku založené na adaptivní kritice , známé také jako aproximované dynamické programování ( ADP ) , jsou v posledních letech velmi populární [33] [34] [35] [36] . Systémy adaptivní kritiky volí řídicí signál založený na minimalizaci funkčnosti budoucích odhadů chyb s nekonečným horizontem:

J(k)=\sum _{i=0}^{\infty }\gamma ^{i}e(k+i)^{2}.

Zde je faktor zapomínání, , je odchylka trajektorie řídicího objektu od nastavené hodnoty, vypočítaná v každém cyklu systému. Systém obsahuje dva neuronové moduly: neurokontrolér a modul kritiky ( kritický ). Modul kritiky provádí aproximaci hodnot nákladového funkcionálu , neurokontrolér je vyškolen k minimalizaci nákladového funkcionálu . $\gamma$ $0<\gamma \leq 1$ $e(k)=r(k+1)-y(k+1)$ $J(k)$ $J(k)$

V režimu řízení objektu přijímá vstup neurokontroléru vektor , který na jeho výstupu způsobí výskyt řídicího signálu , v důsledku čehož se řídicí objekt přesune do polohy . Dále se vypočítá hodnota aktuální chyby řízení . Modul kritiky, který přijímá vektor jako vstup , vyhodnocuje nákladovou funkci . V dalším cyklu se proces opakuje: nové hodnoty a jsou vypočteny . Školení neurokontrolního systému probíhá online a skládá se ze dvou fází: školení modulu kritiky a školení neurokontroléru. Nejprve se vypočítá chyba časového rozdílu . Potom se podle metody nejstrmějšího klesání opraví váha vazeb pro modul kritiky : ${\displaystyle x(k)=[r(k+1)~S(k)]^{T))$ $u(k)$ $y(k+1)$ $e(k)$ ${\displaystyle z(k)=[r(k+1)~u(k)~S(k)]^{T))$ $J(k)$ $e(k+1)$ $J(k+1)$ $\delta w(k)=e(k)+\gamma J(k+1)-J(k)$ $w_{critic}$

\Delta w_{critic}(k)=-{\alpha }_{1}\delta (k){\frac {\partial J(k)}{\partial w_{critic}(k)))

Hodnota gradientu se vypočítá pomocí metody zpětného šíření . Korekce hmotnosti spojů neurokontroléru se provádí stejným způsobem: ${\frac {\partial J(k)}{\partial w_{critic}(k)))$ $\Delta w_{control}$

$\Delta w_{control}(k)=-{\alpha }_{2}{\frac {\partial J(k)}{\partial u(k))){\frac {\partial u( k)}{\částečné w_{kontrola}(k)))$

Hodnota derivace je nalezena zpětným šířením hodnoty přes modul kritiky a hodnota gradientu je nalezena zpětným šířením chyby přes modul ovladače. Korekce hmotnosti pokračuje, dokud systém nedosáhne požadované úrovně kvality kontroly. V každém kroku se tedy zákon kontroly zlepšuje tréninkem neurokontroléru (iterace strategií, iterace politiky) a schopnost systému vyhodnotit situaci se také zvyšuje tréninkem kritika (iterace podle hodnot, iterace hodnot). Specifické schéma pro konstrukci systému adaptivní kritiky se může lišit od výše popsaného , které se nazývá heuristické dynamické programování ( HDP ) . V metodě duálního heuristického programování ( DHP ) počítá kritický modul derivaci funkcionálu globálních nákladů a v metodě globálního duálního heuristického programování ( GHDP ) počítá kritik samotný i jeho derivaci . Jsou známy modifikace metody, kdy se kritický modul rozhoduje pouze na základě řídícího signálu. Jejich anglické zkratky mají předponu AD ( action dependent ): ADHDP , ADDHP , ADGDHP . V některých verzích adaptivní kritiky se modul kritiky skládá ze dvou částí: samotného modulu kritiky a přímého neuroemulátoru. Ten poskytuje předpovědi chování řídicího objektu, na základě kterých kritik tvoří odhad nákladové funkce . Takové verze se nazývají založené na modelu . ${\frac {\částečné J(k)}{\částečné u(k)))$ ${\frac {\partial u(k)}{\partial w_{control}(k)))$ ${\frac {\partial J}{\partial t))$ $J$ ${\frac {\partial J}{\partial t))$ $J$

Hybridní neuro-PID řízení

Hybridní neuro-PID řízení (NNPID auto-tuning, neuromorphic PID self-tuning) [37] [38] umožňuje samočinné ladění PID regulátoru online pomocí neuronových sítí . PID regulátor je naladěn online podle aktuální chyby regulace . Neuronová síť v cyklu přijímá požadovanou hodnotu a generuje regulační koeficienty PID regulátoru (proporcionální), (integrální), (diferenciální), které jsou přiváděny do PID regulátoru spolu s hodnotou aktuální chyby zpětné vazby . Během provozu PID regulátor vypočítává aktuální řídicí signál podle rekurzivního vzorce: $e(k)=r(k+1)-y(k+1)$ $k$ $r(k+1)$ $K_1$ $K_{2}$ $K_{3}$ $e(k)$ $u(k)$

u(k)=u(k-1)+K_{1}(k)(e(k)-e(k-1))+K_{2}(k)e(k)+K_{ 3}(k)(e(k)-2e(k-1)+e(k-2))

používá se pro diskrétní PID regulátory a přivádí je do řídicího objektu.

Neuronová síť je trénována v reálném čase chybou zpětné vazby pomocí metody nejstrmějšího sestupu .

\Delta w(k)=-\alpha e(k){\frac {\částečné y(k+1)}{\částečné u(k))){\frac {\částečné u(k)} {\částečné K(k)}}{\frac {\částečné K(k)}{\částečné w(k)))

Zde je výstupní vektor neuronové sítě přiváděný do PID regulátoru. ${\displaystyle K(k)=[K_{1}(k)~K_{2}(k)~K_{3}(k)]^{T))$

{\frac {\částečné u(k)}{\částečné K_{i}(k)))={\Bigg \{}{\begin{matrix}e(k)-e(k-1) &for~i=1;\\e(k)&for~i=2;\\e(k)-2e(k-1)+e(k-2)&for~i=3.\end{matrix}}

Gradienty se vypočítávají pomocí metody zpětného šíření . Jakobián řídicího objektu, zda je jeho znaménko nalezeno analyticky, na základě matematického modelu řídicího objektu. ${\frac {\partial K_{i}(k)}{\partial w(k)))$ ${\displaystyle {\frac {\částečné y(k+1)}{\částečné u(k)))))$

Hybridní paralelní neurokontrola

Metody hybridního paralelního neurořízení (paralelní neurokontrola, stabilní přímé adaptivní řízení, aditivní dopředné řízení) [26] [29] umožňují paralelní použití neurokontrolérů a konvenčních kontrolérů pro řízení dynamických objektů. V tomto případě dostávají neurokontrolér a konvenční regulátor, kterým je například PID regulátor , stejné požadované hodnoty. Pro společné připojení konvenčního ovladače a neurokontroléru jsou možné následující možnosti:

konvenční ovladač je připojen k řídicímu objektu, načež se neurokontrolér naučí ovládat systém již uzavřený konvenčním ovladačem. Po zaškolení se neurokontrolér připojí k systému a sečtou se řídící signály obou ovladačů;
neurokontrolér se naučí ovládat ovládací objekt, po zaškolení začne normálně fungovat. Dále, pro ovládání systému uzavřeného neurokontrolérem je konfigurován konvenční ovladač. Po nastavení je běžný regulátor připojen k systému, řídicí signál obou regulátorů je sečten;
oblasti působení konvenčního regulátoru a neurokontroléru jsou vymezeny. Například ve stavovém prostoru řídicího objektu je neurokontroléru přidělena samostatná oblast : $LS$

LS=[(y_{1}-d_{1};y_{1}+d_{1})~\ldots ~(y_{N}-d_{N};y_{N}+d_{N })]^{T}

V tomto případě je konvenční regulátor vypočítán pro řízení objektu mimo tuto oblast stavového prostoru. Když oba ovladače pracují paralelně, řídicí signál přichází k objektu buď z neurokontroléru, pokud je aktuální stav systému v oblasti , nebo v opačném případě z konvenčního ovladače. Hybridní paralelní neurokontrola představuje kompromisní řešení pro zavedení neurokontroly v průmyslu a přechod od konvenčních kontrolérů k neuronovým sítím. $LS$

Poznámky

↑ Voronovsky G.K., Genetické algoritmy, umělé neuronové sítě, 1997 (nepřístupný odkaz) . Získáno 3. září 2011. Archivováno z originálu 19. srpna 2011. (neurčitý)
↑ Werbos, PJ Backpropagation and neurocontrol: a review and prospectus // International Joint Conference on Neural Networks, Vol. 1. - S. 209-216. — Washington, DC, USA, 18.–22. června 1989
↑ Gundy-Burlet K., Krishnakumar K., Limes G., Bryant D. Rozšíření inteligentního systému řízení letu pro simulovaný letoun C-17 // J. of Aerospace Computing, Information and Communication. - 2004. - Sv. 1, č. 12. - str. 526-542 . Získáno 26. srpna 2011. Archivováno z originálu dne 6. března 2016. (neurčitý)
↑ Kondratiev A. I., Tyumentsev Yu. V. Neuronová síť adaptivní na poruchu tolerantní řízení pohybu manévrovatelného letadla // XII. Všeruská vědecká a technická konference "Neuroinformatika - 2010": Část 2. - M .: NRNU MEPhI, 2010 - str. 262 - 273. . Získáno 28. října 2011. Archivováno z originálu dne 4. března 2016. (neurčitý)
↑ Nikiforova L. N., Petrosyan E. A., Yakemenko G. V. Neuropočítače v řízení vrtulníků // Umělá inteligence. - 2000. - č. 3. - S. 290-298 . Získáno 28. října 2011. Archivováno z originálu 10. října 2015. (neurčitý)
↑ D. Gu a H. Hu. Neural Predictive Control pro mobilní robot podobný autu // International Journal of Robotics and Autonomous Systems, Vol. 39, č. 2-3, květen 2002
↑ [Terekhov V. A., Efimov D. V., Tyukin I. Yu. Systémy řízení neuronové sítě: Proc. příspěvek na vysoké školy. - M .: Vyšší. škola 2002. - 183 s.]
↑ 1 2 Danil V. Prochorov. Neurokontrola a diagnostika Toyota Prius HEV // Neuronové sítě. - 2008. - Ne. 21. - str. 458-465 . Získáno 2. září 2011. Archivováno z originálu 31. července 2009. (neurčitý)
↑ Dias FM, Mota AM Porovnání různých strategií řízení pomocí neuronových sítí // 9. středomořská konference o řízení a automatizaci. — Dubrovník, Chorvatsko, 2001 . Získáno 26. srpna 2011. Archivováno z originálu dne 27. září 2016. (neurčitý)
↑ Venayagamoorthy GK, Harley RG, Wunsch DC Implementace Adaptive Critic-based Neurocontrollers for Turbogenerators in a Multimachine Power System, IEEE Transactions on Neural Networks. - 2003. - Sv. 14, Číslo 5. - S. 1047-1064. (nedostupný odkaz) . Získáno 26. srpna 2011. Archivováno z originálu 12. června 2010. (neurčitý)
↑ D'Emilia G., Marrab A., Natalea E. Využití neuronových sítí pro rychlé a přesné automatické ladění PID regulátoru // Robotika a počítačově integrovaná výroba. - 2007. - Sv. 23. - S. 170-179.
↑ Zmeu K. V., Markov N. A., Shipitko I. A., Notkin B. S. Prediktivní inverzní neurokontrola bez modelu s regenerovaným referenčním přechodem // Intelligent Systems. - 2009. - č. 3. - S. 109-117. . Získáno 26. srpna 2011. Archivováno z originálu dne 27. září 2016. (neurčitý)
↑ Kuznetsov B. I., Vasilets T. E., Varfolomeev A. A. Syntéza neurokontroléru s predikcí pro dvouhmotový elektromechanický systém // Elektrotechnika a elektromechanika. - 2008. - V. 3. - S. 27 - 32. (nepřístupný odkaz) . Datum přístupu: 28. října 2011. Archivováno z originálu 26. října 2015. (neurčitý)
↑ D. A. Dzyuba, A. N. Černodub. Aplikace metody řízené poruchy pro modifikaci neurokontrolérů v reálném čase // Mathematical Machines and Systems. - 2010. - č. 4. - S. 20 - 28. . Získáno 26. srpna 2011. Archivováno z originálu dne 28. dubna 2011. (neurčitý)
↑ Sabania V.R. Automatické řídicí systémy založené na technologiích neuronových sítí / V.R. Sabanin, N.I. Smirnov, A.I. Repin // Sborník příspěvků z mezinárodní vědecké konference Control-2003. M.: Nakladatelství MEI, 2003.S. 45-51.
↑ [Widrow B., Smith FW Řídicí systémy rozpoznávající vzory // Proceedings of Computer and Information Sciences. - Washington, USA - 1964. - Sv. 12. - S. 288-317.]
↑ Omidvar O., Elliott DL ed. Neural Systems for Control // Academic Press, New York, 1997. - 358 s.
↑ Ronco E. Sítě inkrementálních polynomických regulátorů: Dva samoorganizující se nelineární regulátory // Ph.D. Disertační práce, Glasgow, 1997. - 207 s.
↑ 1 2 [Omatu S., Khalid M., Yusof R. Neurofeedback a jeho aplikace: přel. z angličtiny. — M.: IPRZhR, 2000. — 272 s.]
↑ 1 2 Psaltis D., Sideris A., Yamamura AA A Multilayered Neural Network Controller // IEEE Control Systems Magazine - 1988. - Vol. 8, Číslo 2. - S. 17 - 21. (nepřístupný odkaz)
↑ Werbos P. Backpropagation through time: co to dělá a jak to udělat // Proceedings of the IEEE. - Říjen 1990. - Sv. 78, N. 10. - S. 1550-1560 (nepřístupný odkaz) . Získáno 24. září 2011. Archivováno z originálu 13. června 2010. (neurčitý)
↑ [Jordan MI a Rumelhart DE Forwardmodels: Učení pod dohledem s distálním učitelem // Cognitive Science - 1990. - Vol. 16. - S. 313-355.]
↑ 1 2 [Narendra KS, Parthasarathy KK Identifikace a řízení dynamických systémů pomocí neuronových sítí // IEEE Transactions on Neural Networks. - 1990. - N 1. - S. 4 - 27.]
↑ Venelinov Topalov, A. Kaynak. Online učení v adaptivních neurokontrolních schématech s algoritmem klouzavého režimu // IEEE Transactions on Systems, Man, and Cybernetics, Part B: Kybernetika. - 2001. - V. 31. - I. 3. - S. 445-450 . Získáno 28. října 2011. Archivováno z originálu 18. listopadu 2017. (neurčitý)
↑ A. N. Černodub. Trénink neuroemulátorů pomocí pseudoregularizace pro metodu neurokontroly s referenčním modelem // Umělá inteligence. - 2012. - Ne. 4. - C. 602-614 (nedostupný odkaz)
↑ 1 2 Dias FM, Mota AM Porovnání různých řídicích strategií pomocí neuronových sítí // 9. středomořská konference o řízení a automatizaci. — Dubrovník, Chorvatsko, 2001. . Získáno 26. srpna 2011. Archivováno z originálu dne 27. září 2016. (neurčitý)
↑ Widrow B., Adaptive Inverse Control // Proceedings of 2nd IFAC Workshop on Adaptive Systems in Control and Signal Processing - Lund, Švédsko, červenec 1986. - S. 1 - 5. . Získáno 24. září 2011. Archivováno z originálu 6. března 2016. (neurčitý)
↑ Widrow B., Plett GL Adaptivní inverzní řízení založené na lineárním a nelineárním adaptivním filtrování // Proceedings of International Workshop on Neuron Networks for Identification, Control, Robotics and Signal/Image Processing - 21. 23 August 1996, Venice, Italy. - str. 30 - 38.
↑ 1 2 Neuronové sítě pro řízení // Proceedings of the 1999 American Control Conference (Cat. No. 99CH36251). - 1999. - ISBN 0780349903 . - doi : 10.1109/ACC.1999.786109 .
↑ Rossiter JA Model-Based Predictive Control . - 2017. - 12. července. — ISBN 9781315272610 . - doi : 10.1201/9781315272610 .
↑ Takahashi Y. Adaptivní prediktivní řízení nelineárních časově proměnných systémů pomocí neuronových sítí // IEEE International Conference on Neural Networks. — ISBN 0780309995 . - doi : 10.1109/ICNN.1993.298772 .
↑ Soloway D. , Haley PJ Neural generalizované prediktivní řízení // Proceedings of the 1996 IEEE International Symposium on Intelligent Control. — ISBN 0780329783 . - doi : 10.1109/ISIC.1996.556214 .
↑ Prokhorov D. a Wunsch D. Adaptive Critic Designs // Transakce IEEE na neuronových sítích. - 1997. - Sv. 8, č. 5. - S. 997-1007. . Získáno 25. září 2011. Archivováno z originálu 8. července 2013. (neurčitý)
↑ Venayagamoorthy GK, Harley RG, Wunsch DC Implementation of Adaptive Critic-based Neurocontrollers for Turbogenerators in a Multimachine Power System", IEEE Transactions on Neural Networks. - 2003. - Vol. 14, Issue 5. - S. 106447 . nedostupný odkaz) Načteno 26. srpna 2011. Archivováno z originálu 12. června 2010. (neurčitý)
↑ Ferrari S., Stengel RF Model-Based Adaptive Critic Designs // Learning and Approximated Dynamic Programming, J. Si, A. Barto, W. Powell a D. Wunsch, Eds. New York: Wiley, 2004, kapitola. 3 . Získáno 25. září 2011. Archivováno z originálu 17. dubna 2012. (neurčitý)
↑ Redko V. G., Prokhorov D. V. Kritici adaptivní neuronové sítě // VI Všeruská vědecká a technická konference „Neuroinformatika-2004“. Sborník vědeckých prací. Část 2. M.: MEPhI, 2004. - C. 77 - 84. . Získáno 25. září 2011. Archivováno z originálu 11. května 2011. (neurčitý)
↑ D'Emilia Giulio , Marra Antonio , Natale Emanuela. Použití neuronových sítí pro rychlé a přesné automatické ladění PID regulátoru // Robotika a počítačově integrovaná výroba. - 2007. - Duben ( roč. 23 , č. 2 ). - S. 170-179 . — ISSN 0736-5845 . - doi : 10.1016/j.rcim.2006.04.001 .
↑ Akhyar S. , Omatu S. Neuromorphic self-tuning PID controller (anglicky) // IEEE International Conference on Neural Networks. — ISBN 0780309995 . - doi : 10.1109/ICNN.1993.298617 .

Odkazy

Literatura

Shigeru Omatu, Marzuki Khalid, Rubia Yusof. Neurocontrol and its Applications = Neuro-Control and its Applications. - 2. - M .: IPRZhR , 2000. - S. 272. - ISBN ISBN 5-93108-006-6 .
V. A. Terekhov, D. V. Efimov, I. Yu. Tyukin. Řídicí systémy neuronových sítí. - 1. - Vyšší škola , 2002. - S. 184. - ISBN 5-06-004094-1 .
Khaykin S. Neuronové sítě: kompletní kurz = Neuronové sítě: Komplexní základ. - 2. - M .: "Williams" , 2006. - S. 1104 . — ISBN 0-13-273350-1 .
Omidvar O., Elliott DL ed. Neuronové systémy pro řízení. - New York: Academic Press , 1997. - S. 358. - ISBN 0-12-526430-5 .