Identifikace systému

Systémová identifikace  je soubor metod pro konstrukci matematických modelů dynamického systému na základě pozorovaných dat. Matematickým modelem se v této souvislosti rozumí matematický popis chování systému nebo procesu ve frekvenční nebo časové oblasti, např. fyzikální procesy (pohyb mechanického systému působením gravitace), ekonomický proces (reakce zásob atd.). citace k externím poruchám) atd. V současné době je tato oblast teorie řízení dobře prostudována a v praxi široce využívána.

Historie

Počátek identifikace systémů jako předmětu konstrukce matematických modelů na základě pozorování je spojen s prací Carla Friedricha Gausse „Theoria motus corporum coelestium in sectionibus conicis solem ambientium“, ve které použil jím vyvinutou metodu nejmenších čtverců předpovídat trajektorii planet. Následně tato metoda našla uplatnění v mnoha dalších aplikacích, včetně konstrukce matematických modelů řízených objektů používaných v automatizaci (motory, pece, různé akční členy). Velká část rané práce na identifikaci systému byla provedena statistiky, ekonometrii (obzvláště se zájmem o aplikace identifikace související s časovými řadami) a vytvořili oblast nazývanou statistický odhad. Statistický odhad byl také založen na práci Gausse (1809) a Fishera (1912) [1] .

Zhruba do 50. let 20. století byla většina identifikačních postupů v automatizaci založena na pozorování reakcí řízených objektů za přítomnosti určitých řídících akcí (nejčastěji akce tvaru: stupňovitá ( ), harmonická ( ), generovaná barva nebo bílý šum ) a podle toho, jaký typ informace byl o objektu použit, byly identifikační metody rozděleny na frekvenční a časové. Problém byl v tom, že rozsah těchto metod byl omezen nejčastěji na skalární systémy (SISO, Single-input, single-output). V roce 1960 představil Rudolf Kalman popis řízeného systému ve formě stavového prostoru, který umožnil pracovat s vícerozměrnými (MIMO, Many-input, many-output) systémy a položil základ pro optimální filtraci a optimální ovládání založené na tomto typu popisu.

Speciálně pro řídicí problémy byly v roce 1965 vyvinuty metody pro identifikaci systémů v pracích Ho a Kalmana [2] , Ostroma a Bolina [3] . Tyto práce připravily cestu pro vývoj dvou metod identifikace, které jsou dodnes populární: metoda podprostoru a metoda predikční chyby. První je založen na použití projekcí v euklidovském prostoru a druhý na minimalizaci kritéria, které závisí na parametrech modelu.

Práce Ho a Kalmana se věnuje nalezení stavového modelu studovaného objektu, který má nejmenší řád stavového vektoru, na základě informace o impulsní odezvě. Tento problém, ale již za přítomnosti implementací náhodného procesu, kde se tvoří Markovův model , byl vyřešen v 70. letech v pracích Forre [4] a Akaika [5] . Tyto práce položily na počátku 90. let základ pro vytvoření subprostorové metody.

Práce Åströma a Bolina představila identifikační komunitě metodu maximální věrohodnosti, která byla vyvinuta odborníky na časové řady pro odhad parametrů modelu ve formě diferenčních rovnic [6] [7] . Tyto modely, které jsou ve statistické literatuře známé jako ARMA (autoregresivní klouzavý průměr) a ARMAX (autoregresní klouzavý průměr se vstupem), později vytvořily základ pro metodu chyby predikce. V roce 1970 vydali Box a Jenkins knihu [8] , která dala významný impuls k aplikaci identifikačních metod ve všech možných oblastech. Tato práce poskytla, jinými slovy, kompletní recept na identifikaci od okamžiku, kdy začnete sbírat informace o objektu, až po příjem a ověření modelu. Již 15 let je tato kniha hlavním zdrojem pro identifikaci systému. Významnou prací té doby byla také recenze [9] o identifikaci systému a analýze časových řad, publikovaná v IEEE Transactions on Automatic Control v prosinci 1974. Jednou z otevřených otázek pak byla otázka identifikace uzavřených systémů, u kterých metoda založená na vzájemné korelaci vede k neuspokojivým výsledkům [10] . Od poloviny 70. let 20. století nově vynalezená metoda predikčních chyb ovládla teorii a, což je důležitější, identifikační aplikace. Většina výzkumné činnosti se soustředila na problémy identifikace vícerozměrných a uzavřených systémů. Klíčovým úkolem pro tyto dvě třídy systémů bylo najít podmínky pro experiment a způsoby parametrizace problému, za kterých by se nalezený model přiblížil jedinému přesnému popisu reálného systému. O veškeré tehdejší činnosti lze říci, že to byla doba hledání „pravého modelu“, řešení problémů identifikovatelnosti, konvergence k přesným parametrům, statistické účinnosti odhadů a asymptotické normality odhadovaných parametrů. V roce 1976 byl učiněn první pokus považovat identifikaci systémů za aproximační teorii, ve které je problémem co nejlepší aproximace reálného systému v rámci dané třídy modelů [11] [12] , [13] . Převládající názor mezi specialisty na identifikaci se tak změnil z hledání popisu skutečného systému na hledání popisu nejlepší možné aproximace. K důležitému průlomu také došlo, když L. Ljung zavedl pro odhad přenosových funkcí objektů koncept chyby zkreslení a rozptylu [14] . Práce se zkreslením a analýza rozptylu výsledných modelů během 80. let vedla k perspektivě považovat identifikaci za problém syntézy. Na základě pochopení vlivu experimentálních podmínek, struktury modelu a identifikačního kritéria založeného na odchylce a odchylce chyb je možné přizpůsobit tyto syntetické proměnné objektu tak, aby se získal nejlepší model. v této třídě modelů [15] [16] . Touto ideologií je prodchnuta kniha Lennarta Ljunga [17] , která má velký vliv na komunitu specialistů na identifikaci.

Myšlenka, že kvalitu modelu lze změnit výběrem proměnných syntézy, vedla v 90. letech k výbuchu aktivity, který trvá dodnes. Hlavní aplikací nového paradigmatu je identifikace pro MBC (Model Based Control). V souladu s tím identifikace problémů s řízením od svého počátku rozkvetla s nebývalou silou a aplikace identifikačních metod pro řízení vdechla druhý život do již známých oblastí výzkumu, jako je návrh experimentu, identifikace v uzavřené smyčce, frekvenční identifikace, robustní řízení v přítomnost nejistoty.

Identifikace systémů v SSSR a Rusku

Hlavní událostí ve vývoji identifikace systémů v SSSR bylo v roce 1968 otevření laboratoře č. 41 („Identifikace řídicích systémů“) ​​v Ústavu automatizace a telemechaniky (nyní Ústavu problémů řízení Ruské akademie věd) za asistence N. S. Raibmana. Naum Semenovich Raibman byl jedním z prvních v zemi, který si uvědomil praktické výhody a teoretický zájem identifikace systému. Vyvinul teorii identifikace disperze pro identifikaci nelineárních systémů [18] a také napsal knihu nazvanou "Co je identifikace?" [19] vysvětlit základní principy nového předmětu a popsat okruh úloh řešených systémovou identifikací. Také následně se o teorii identifikace zajímal Jakov Zalmanovič Tsypkin , který vyvinul teorii identifikace informace [20].

Obecný přístup

Vytvoření matematického modelu vyžaduje 5 základních věcí:

Vstupně-výstupní informace se obvykle zaznamenávají během předem naplánovaného identifikačního experimentu, během kterého si výzkumník může vybrat, které signály bude měřit, kdy je bude měřit a které vstupní signály použije. Disciplína "Návrh experimentů" může navrhnout, jak učinit experimentální informace co nejinformativnější, s přihlédnutím k omezením, která lze na experiment uložit. Ale bohužel není vzácná situace, kdy výzkumník nemá možnost provést experiment, ale pracuje s informacemi, které jsou mu poskytnuty. Soubor kandidátských modelů se získá na základě rozhodnutí o třídě modelů, ve kterých bude vyhledávání provedeno. Tato volba je bezpochyby nejdůležitější a nejobtížnější v procesu identifikace. Právě v této fázi musí být všechny apriorní informace, inženýrská intuice, kombinovány s formálními vlastnostmi pravděpodobných modelů, aby bylo možné učinit rozhodnutí. Také mnoho navrhovaných modelů může být postaveno na základě známých fyzikálních zákonů nebo je možné použít standardní lineární modely bez jakéhokoli spoléhání se na fyziku. Takové modely, postavené ne na základě známých fyzikálních zákonů a mající parametry, jejichž změnou je možné dosáhnout přiblížení ke studovanému objektu, se nazývají modely černé skříňky. Modely, které mají nastavitelné parametry a spoléhají na známé fyzikální zákony, se nazývají šedé boxy. Obecně řečeno, struktura modelu je parametrizované mapování od množiny vstupů a výstupů až po množinu výstupů aktuálního času včetně : Kritériem pro výběr modelu je jeho schopnost opakovat data získaná z experimentu, tedy odpovídat chování studovaného objektu. Ale je třeba mít na paměti, že model nemůže být nikdy přijat jako „skutečný“ nebo „skutečný“ popis objektu kvůli jeho vrozené aproximaci.

Identifikační procedura jako uzavřený systém

Postup identifikace má přirozený logický řád: nejprve shromáždíme data, poté vytvoříme sadu modelů a poté vybereme nejlepší model. Je běžné, že první vybraný model neprojde testem na shodu s experimentálními daty. Poté byste se měli vrátit a vybrat jiný model nebo změnit kritéria vyhledávání. Model může být nevyhovující z následujících důvodů:

Přístupy k identifikaci

Při identifikaci se předpokládá experimentální studium a porovnání vstupních a výstupních procesů a identifikační úkol spočívá ve výběru vhodného matematického modelu. Model musí být takový, aby si jeho reakce a reakce objektu na stejný vstupní signál byly v určitém smyslu blízké. Výsledkem řešení identifikačního problému jsou výchozí data pro návrh řídicích systémů, optimalizaci, analýzu parametrů systému atd.

V současné době se pro stanovení dynamických vlastností regulovaných objektů používají následující metody:

  1. Metody založené na umělém dopadu na systém neperiodickým signálem, jehož síla je velká ve srovnání s úrovní rušení v systému. Jako akce se obvykle volí náhlá změna v řídicí akci a v důsledku toho jsou určeny časové charakteristiky.
  2. Metody založené na umělém dopadu na systém periodickými signály různých frekvencí, jejichž amplituda je velká ve srovnání s úrovní rušení v systému. V důsledku toho jsou určeny frekvenční charakteristiky.
  3. Metody založené na umělém působení na systém sinusovými signály úměrnými hluku v systému. V důsledku toho jsou také určeny frekvenční charakteristiky.
  4. Metody, které nevyžadují umělé vlivy, využívající rušení, které jsou přítomny při běžném provozu. [23]

Statické matematické modely systémů se získávají třemi způsoby: experimentálně-statistickým, deterministickým a smíšeným.

Experimentálně-statistické metody vyžadují aktivní nebo pasivní experimenty na provozním objektu. Stochastické modely se používají k řešení různých problémů souvisejících s výzkumem a řízením procesů. Ve většině případů jsou tyto modely získány ve formě lineárních regresních rovnic.

Na základě vlastností reálných procesů lze tvrdit, že rovnice pro vztah procesních proměnných by měly mít jinou, možná složitější strukturu. Čím více je struktura regresních rovnic „vzdálenější“ od „pravdy“, tím menší bude přesnost prognózy s nárůstem rozsahu změn procesních proměnných. To zhoršuje kvalitu ovládání a následně snižuje kvalitu fungování objektu v optimálním režimu.

Deterministické modely jsou „založeny na fyzikálních zákonech a představách o procesech“. Proto je lze získat ve fázi návrhu procesu. V současnosti bylo na základě deterministického přístupu vyvinuto několik metod pro konstrukci matematických modelů spojitých procesů. Takže například při matematickém modelování řady procesů v chemické technologii se používá metoda vícerozměrného fázového prostoru. Podstata metody spočívá v tom, že tok simulovaného technologického procesu je uvažován jako pohyb nějakých „reprezentujících bodů“ ve vícerozměrném fázovém prostoru. Tento prostor je definován jako prostor kartézského souřadnicového systému, podél jehož os jsou vyneseny prostorové souřadnice aparatury a vnitřní souřadnice reagujících pevných částic. Každý bod ve vícerozměrném fázovém prostoru popisuje určitý stav simulovaného procesu. Počet těchto bodů se rovná počtu částic v aparatuře. Tok technologického procesu je charakterizován změnou toku reprezentativních bodů.

Metoda vícerozměrného fázového prostoru se nejvíce používá k vytváření matematických modelů. Tato metoda má však také nevýhody, které omezují její rozsah:

Vzhledem k výše uvedeným vlastnostem metody vícerozměrného fázového prostoru je tedy velmi obtížné ji použít k sestavení matematických modelů technologických procesů na základě informací získaných bez provádění experimentů v průmyslových zařízeních.

Zpravidla lze na základě teoretické analýzy procesu získat matematický model, jehož parametry je nutné v procesu řízení technologického objektu zpřesňovat. Na Obr. 1 ukazuje obecné schéma řešení identifikačních problémů.

Přes velké množství publikací o parametrické identifikaci dynamických objektů není identifikaci nestacionárních parametrů věnována dostatečná pozornost. Při zvažování známých přístupů k nestacionární parametrické identifikaci lze rozlišit dvě skupiny [1] .

Do první skupiny patří díla, která významně využívají apriorní informace o zjištěných parametrech. První přístup této skupiny je založen na hypotéze, že identifikované parametry jsou řešením známých homogenních systémů diferenčních rovnic nebo jsou reprezentovány jako náhodný proces generovaný Markovovým modelem, tj. jsou řešením známých systémů diferenciálních nebo diferenčních rovnic. s poruchami typu bílý šum, vyznačující se Gaussovým rozdělením, známými prostředky a intenzitou. Tento přístup je opodstatněný za přítomnosti velkého množství apriorních informací o požadovaných parametrech a pokud se skutečné parametry převzatého modelu neshodují, vede ke ztrátě konvergence algoritmu.

Druhý přístup, patřící do první skupiny, je založen na parametrizaci nestacionárních parametrů a využívá hypotézu o možnosti přesné reprezentace nestacionárních identifikovatelných parametrů v celém identifikačním intervalu nebo jednotlivých dílčích intervalech ve formě konečná, zpravidla lineární kombinace známých časových funkcí s neznámými konstantními váhovými koeficienty, zejména ve formě konečného součtu členů Taylorovy řady , harmonické Fourierovy řady , zobecněné Fourierovy řady vzhledem k soustavám ortogonálních funkce Laguerre , Walsh .

Nejjednodušším případem parametrizace je znázornění nestacionárních parametrů konstantními hodnotami na posloupnosti jednotlivých dílčích intervalů pokrývajících identifikační interval.

S aktuální identifikací se doporučuje přejít na klouzavý časový interval [ t  -  T, t ] trvání T a uvažovat požadované parametry konstantní na tomto intervalu nebo přesně reprezentovatelné jako interpolační polynom konečného stupně, nebo zadaný konečný lineární kombinace. Tento přístup může zahrnovat práce založené na použití iterativní metody nejmenších čtverců. V těchto pracích se díky použití exponenciálního (se záporným exponentem) váhového faktoru v kvadratickém funkcionálu, který má být minimalizován, definovaném na aktuálním časovém intervalu [0,  t ] „ vymazávají“ staré informace o souřadnicích objektu. přesčas. Tato situace v podstatě odpovídá myšlence stálosti identifikovaných parametrů na určitém klouzavém časovém intervalu, přičemž se berou v úvahu informace o stavu objektu na tomto intervalu s exponenciální váhou.

Tento přístup umožňuje přímo rozšířit metody identifikace stacionárních parametrů na případ identifikace nestacionárních parametrů. V praxi se však základní hypotéza tohoto přístupu nenaplňuje a lze hovořit pouze o přibližné reprezentaci (aproximaci) požadovaných parametrů konečnou lineární kombinací známých časových funkcí s neznámými konstantními váhovými koeficienty. Tato situace vede ke vzniku metodologické identifikační chyby, která zásadně mění podstatu diskutovaného přístupu, neboť v tomto případě se trvání T aproximačního intervalu a počet členů lineární kombinace stávají regularizačními parametry. Tato metodická chyba se zpravidla nebere v úvahu. Zejména za předpokladu přímočarého zákona změny požadovaných parametrů ve velkých dílčích seTčasových intervalech

Do druhé skupiny patří metody, které využívají mnohem menší množství informací o požadovaných parametrech a tyto informace se využívají až ve fázi výběru parametrů identifikačního algoritmu.

První přístup patřící do této skupiny je založen na použití gradientních samonastavitelných modelů. Takový přístup byl diskutován v pracích na parametrické identifikaci lineárních a nelineárních dynamických objektů. Hlavní výhodou tohoto přístupu je, že vede k uzavřenému identifikačnímu systému a má tak určité výhody z hlediska odolnosti proti šumu ve srovnání s otevřenými metodami identifikace. Nevýhody tohoto přístupu souvisejí s potřebou měřit gradientní složky ladícího kritéria, které jsou funkčními derivacemi, s požadavkem dostatečně přesné apriorní informace o počátečních hodnotách identifikovaných parametrů (pro výběr počátečních hodnot ​​parametrů modelu, které zaručují stabilitu identifikačního systému) a chybějící kompletní teoretická analýza dynamiky identifikačního systému daného typu. To je vysvětleno složitostí systému integro-diferenciálních rovnic popisujících procesy v samoladící smyčce, v důsledku čehož je teoretická analýza prováděna pouze za předpokladu pomalé změny parametrů objektu. a modelovat. V tomto ohledu není možné plně posoudit oblast stability, rychlost a přesnost provozu gradientních samonastavovacích modelů, a tím jednoznačně určit oblast použitelnosti systémů tohoto typu při současné identifikaci ne stacionární parametry. Je však třeba poznamenat, že s nárůstem stupně nestacionárnosti požadovaných parametrů výrazně narůstají metodické chyby při určování složek gradientu kritéria ladění, v důsledku čehož se chyba identifikace zvyšuje za zónu minimalizace globálního extrému kritéria.

Tento efekt je umocněn zejména zvýšením počtu identifikovaných parametrů díky propojení identifikačních kanálů. Proto je použití gradientních samonastavitelných modelů zásadně omezeno na případ pomalé změny požadovaných parametrů.

Druhý přístup je založen na použití Kaczmarzova algoritmu. Je známo, že hlavní algoritmus tohoto typu má špatnou odolnost proti šumu a nízkou rychlost. Tato situace podnítila vytvoření různých modifikací tohoto algoritmu, vyznačujících se zvýšenou rychlostí. Výkon těchto modifikací je však stále nízký, což a priori omezuje rozsah použitelnosti druhého přístupu na případ identifikace pomalu se měnících parametrů.

Do druhé skupiny lze zařadit i metody určené k identifikaci pouze lineárních dynamických objektů a vyznačují se dalšími omezeními (nutnost použití testovacích vstupních signálů ve formě množiny harmonických nebo pseudonáhodného periodického binárního signálu, konečnost identifikace intervalu, dostupnost kompletní informace o vstupních a výstupních signálech objektu na celém identifikačním intervalu a možnost identifikace koeficientů pouze levé strany diferenciální rovnice). Z tohoto důvodu jsou možné významné chyby identifikace na jednotlivých konečných časových podintervalech a je také nutné řešit složitý okrajový problém.

V automatizaci jsou typické testovací vstupní signály:

Řadu metod (reprezentace parametrů ve formě řešení známých soustav diferenciálních nebo diferenčních rovnic) lze použít pouze v konkrétních případech, zatímco jiné metody (gradientové samonastavovací modely, Kachmarzův algoritmus) se a priori vyznačují významnými omezení na stupeň nestacionarity požadovaných parametrů. Zmíněné nedostatky jsou způsobeny samotnou podstatou uvedených metod, a proto není téměř žádná možnost znatelného snížení těchto nedostatků. Metody založené na parametrizaci nestacionárních parametrů, jak bylo uvedeno výše, jsou zcela neprozkoumané a v prezentované podobě mohou najít omezené praktické uplatnění. Na rozdíl od jiných metod však posledně jmenovaný přístup neobsahuje vnitřní omezení na míru nestacionárnosti identifikovaných parametrů a je zásadně použitelný pro identifikaci široké třídy dynamických objektů v režimu jejich běžného provozu v dlouhých časových intervalech. .

Uvedené obtíže při identifikaci reálně fungujících systémů určují nejpoužívanější přístup k modelování nelineárních objektů, který spočívá ve volbě typu matematického modelu v podobě evoluční rovnice a následné identifikaci parametrů, případně neparametrické identifikaci modelu. Model je považován za adekvátní, pokud je odhad daného kritéria přiměřenosti vypočítaný jako závislost rezidua modelu na experimentálních datech v přijatelných mezích.

Poznámka

  1. R.A. Fisher.   Na absolutním kritériu pro přizpůsobení frekvenčních křivek. - Statistická věda, vol. 12, No. 1 (únor, 1997). - str. 39-41. 
  2. BL Ho a RE Kalman.   Efektivní konstrukce lineárních stavově proměnných modelů ze vstupně-výstupních funkcí. - Regelungstechnik, vol. 12, 1965. - str. 545-548. 
  3. KJ Astrom a T. Bohlin.   Numerická identifikace lineárních dynamických systémů z běžných provozních záznamů. — Proc. IFAC Symp. Self-Adaptive System, 1965. - pp. 96-111. 
  4. P. Faurre,   Realizace markoviennes de processus stationnaires. — Rapport La-boria č. 13, IRIA, Rocquencourt, Francie, Tech. Rep. 1973. 
  5. H. Akaike,   Stochastická teorie minimální realizace. — IEEE Trans. automat. Kontrola, sv. 26, str. 667-673, prosinec. 1974. 
  6. TC Koopmans, H. Rubin a RB Leipnik,   Měření systémů rovnic dynamické ekonomie. — (Cowles Commission Monograph, sv. 10, TCKoopmans, Ed.). New York: Wiley, 1950. 
  7. EJ Hannan,   Analýza časových řad. — New York: Methuen, 1960  
  8.   Analýza, prognóza a kontrola časových řad GEP Box a GM Jenkins . — Oakland, CA: Holden-Day, 1970. 
  9. KJ Astrom a P. Eykhoff   Identifikace systému - Průzkum. Automatica, sv. 7, str. 123-162, 1971. 
  10. H. Akaike   Některé problémy v aplikaci křížové spektrální metody, - in Spectral Analysis of Time Series, B. Harris, Ed. New York: Wiley, 1967, str. 81-107.  
  11. L. Ljung   O konzistenci a identifikovatelnosti, Math. program. Studie, sv. 5, str. 169-190, 1976.  
  12. BDO Anderson, JB Moore a RMHawkes, Aproximace   modelu pomocí identifikace chyb predikce, - Automatica, sv. 14, str. 615-622, 1978. 
  13. L. Ljung a P. E. Caines,   Asymptotická normalita odhadů chyb predikce pro aproximativní modely systémů, - Stochastics, sv. 3, str. 29-46, 1979. 
  14. L. Ljung,   Asymptotické variační výrazy pro identifikované modely přenosových funkcí černé skříňky, "IEEE Trans. Automat. Contr., sv. AC-30, str. 834-844, 1985.  
  15. B. Wahlberg a L. Ljung   Návrh proměnných pro distribuci zkreslení při odhadu přenosových funkcí, IEEE Trans. automat. Contr., sv. AC-31, str. 134-144, 1986. 
  16. M. Gevers a L. Ljung,   Optimální návrhy experimentů s ohledem na zamýšlenou modelovou aplikaci, Automatica, sv. 22, str. 543-554, 1986. 
  17. L. Ljung,   Identifikace systému, teorie pro uživatele, 2. vydání. - NJ: PTR Prentice Hall, 1999. - ISBN 0-13-656695-2  
  18. N. S. Raibman,   Identifikace disperze, - Moskva: Nauka, 1981.  
  19. N. S. Reibman,   Co je identifikace?. - Moskva: Nauka, 1970. 
  20. Ya.Z. Tsypkin,   Informační teorie identifikace, M., Nauka, 1995, 336 s.  
  21. Rastrigin, 1977 , s. 17.
  22. Rastrigin, 1977 , s. 33.
  23. Shidlovsky S.V. Automatizace technologických procesů a výroby: Učebnice. -Tomsk: Nakladatelství NTL, 2005. -s. jedenáct
  24. A.V. Andryushin, V. R. Sabanin, N. I. Smirnov. Management a inovace v tepelné energetice. - M: MPEI, 2011. - S. 15. - 392 s. - ISBN 978-5-38300539-2 .

Literatura