Informačně-fluktuační složitost je informačně-teoretická hodnota definovaná jako fluktuace informace s ohledem na informační entropii . Je odvozen z kolísání převahy řádu a chaosu v dynamickém systému a používá se v různých oblastech znalostí k měření složitosti . Teorie byla představena v práci Batese a Sheparda v roce 1993 [1] .
Informačně-fluktuační složitost diskrétního dynamického systému je funkcí rozdělení pravděpodobnosti stavů tohoto systému vystavených náhodným datovým vstupům. Cílem řízení systému s bohatým zdrojem informací, jako je generátor náhodných čísel nebo signál bílého šumu , je prozkoumat vnitřní dynamiku systému v podstatě stejným způsobem , jako se při zpracování signálu používá frekvenčně bohatý pulz .
Pokud má systém možné stavy a jsou známy pravděpodobnosti stavů , pak je jeho informační entropie rovna
kde je vlastní státní informace .
Informačně-fluktuační složitost systému je definována jako standardní odchylka nebo fluktuace od jeho střední hodnoty :
nebo
Kolísání stavových informací je v maximálně neuspořádaném systému nulové se všemi ; systém jednoduše simuluje náhodné datové vstupy. je také nula, když je systém dokonale uspořádaný a má pouze jeden pevný stav , bez ohledu na vstupy. je nenulová mezi těmito dvěma extrémy, kdy stavy s vysokou pravděpodobností i stavy s nízkou pravděpodobností vyplňují stavový prostor.
Jak se složitý dynamický systém vyvíjí v čase, přechází z jednoho stavu do druhého. Jak k těmto přechodům dochází, závisí nepravidelně na vnějších podnětech. V některých případech může být systém citlivější na vnější podněty (nestabilní), zatímco v jiných může být méně citlivý (stabilní). Pokud má určitý stav několik možných dalších stavů, externí informace určují, který z nich bude další, a systém tuto informaci získá sledováním určité trajektorie ve stavovém prostoru. Pokud ale několik různých stavů vede ke stejnému dalšímu stavu, pak při jeho vstupu systém ztratí informaci o tom, který stav mu předcházel. Tak, jak se vyvíjí v průběhu času, komplexní systém vykazuje střídavé zisky a ztráty informací. Střídání nebo kolísání informací se rovná zapamatování a zapomenutí – dočasnému uložení informace nebo paměti – to je základní rys netriviálních výpočtů.
Zisk nebo ztráta informace, která doprovází stavové přechody, může být spojena s vlastní stavovou informací. Čistý informační zisk během přechodu ze stavu do stavu je informace získaná při opuštění stavu mínus ztráta informace při vstupu do stavu :
Zde je přímá podmíněná pravděpodobnost , že pokud je aktuální stav , bude další stav a je inverzní podmíněná pravděpodobnost , že pokud je aktuální stav , byl předchozí stav . Podmíněné pravděpodobnosti souvisejí s pravděpodobností přechodu , pravděpodobností, že dojde k přechodu ze stavu do stavu :
Odstraněním podmíněných pravděpodobností dostaneme:
Čistá informace získaná systémem v důsledku přechodu tedy závisí pouze na nárůstu stavové informace z výchozího stavu do konečného stavu. Lze ukázat, že to platí i pro několik po sobě jdoucích přechodů [1] .
Vzorec připomíná vztah mezi silou a potenciální energií . je podobná potenciální energii a je to síla ve vzorci . Vnější informace „tlačí“ systém „nahoru“, do stavu s vyšším informačním potenciálem pro uchování paměti, stejně jako vytlačování tělesa s nějakou hmotou do kopce, do stavu s vyšším gravitačním potenciálem, vede k akumulaci energie. Množství akumulované energie závisí pouze na konečné výšce, nikoli na cestě do kopce. Stejně tak množství uložených informací je nezávislé na přechodové cestě mezi dvěma stavy. Jakmile systém dosáhne vzácného stavu vysokého informačního potenciálu, může „spadnout“ zpět do normálního stavu a ztratit dříve uložené informace.
Může být užitečné vypočítat směrodatnou odchylku od jejího průměru (který je nulový), konkrétně fluktuaci čistého informačního zisku [1] , ale bere v úvahu cykly vícepřechodové stavové paměti , a proto by měl být přesnější indikátor výpočetního výkonu systému. Navíc se to snadněji počítá, protože přechodů může být mnohem více než stavů.
Dynamický systém citlivý na vnější informace (nestabilní) vykazuje chaotické chování, zatímco systém, který je necitlivý na vnější informace (stabilní), vykazuje uspořádané chování. Pod vlivem bohatého zdroje informací vykazuje složitý systém obě chování a osciluje mezi nimi v dynamické rovnováze. Stupeň fluktuace se kvantitativně měří pomocí ; zachycuje střídání převahy chaosu a řádu ve složitém systému, jak se vyvíjí v čase.
Je prokázáno , že varianta elementárního celulárního automatu podle pravidla 110 je schopna univerzálních výpočtů . Důkaz je založen na existenci a interakci propojených a sebezáchovných buněčných konfigurací známých jako „kluzáky“ nebo „ kosmické lodě “, fenomén vynoření , který implikuje schopnost skupin buněk automatu zapamatovat si, že jimi prolétá kluzák. Proto je třeba očekávat, že ve stavovém prostoru budou docházet k paměťovým smyčkám, a to v důsledku střídání získávání a ztráty informací, nestability a stability, chaosu a řádu.
Uvažujme skupinu tří sousedních buněk buněčného automatu, které se řídí pravidlem 110:end-center-end. Další stav centrální buňky závisí na jejím aktuálním stavu a buňkách listu, jak je uvedeno v pravidle:
3 buněčné skupiny | 1-1-1 | 1-1-0 | 1-0-1 | 1-0-0 | 0-1-1 | 0-1-0 | 0-0-1 | 0-0-0 |
---|---|---|---|---|---|---|---|---|
další středová buňka | 0 | jeden | jeden | 0 | jeden | jeden | jeden | 0 |
Pro výpočet složitosti informační fluktuace tohoto systému by bylo možné připojit buňku řidiče ke každému konci skupiny 3 buněk, aby poskytly náhodný vnější podnět, např.driver→end-center-end←driver, takže pravidlo lze aplikovat na dvě koncové buňky. Poté potřebuje určit, jaký je další stav pro každý možný aktuální stav a pro každou možnou kombinaci obsahu řídicí buňky, aby vypočítal přímé podmíněné pravděpodobnosti.
Stavový diagram tohoto systému je uveden níže. V něm kruhy představují stavy a šipky představují přechody mezi stavy. Osm stavů tohoto systému, od1-1-1před0-0-0jsou číslovány desetinnými ekvivalenty 3bitového obsahu skupiny 3 buněk: od 7 do 0. V blízkosti šipek přechodu jsou zobrazeny hodnoty přímých podmíněných pravděpodobností. Schéma ukazuje variabilitu v divergenci a konvergenci šipek, která odpovídá variabilitě v chaosu a řádu, citlivosti a necitlivosti, získávání a ztrátě externích informací z buněk řidiče.
Přímé podmíněné pravděpodobnosti jsou určeny podílem možného obsahu buňky řidiče, která řídí konkrétní přechod. Například pro čtyři možné kombinace obsahu dvou buněk ovladače vede stav 7 ke stavům 5, 4, 1 a 0, tedy , , a jsou 1/4 nebo 25 %. Podobně stav 0 vede ke stavům 0, 1, 0 a 1, takže 1/2 nebo 50 % odpovídá . A tak dále.
Stavové pravděpodobnosti jsou vztaženy vzorcem
aTyto lineární algebraické rovnice lze řešit ručně nebo pomocí počítačového programu pro stavové pravděpodobnosti s následujícími výsledky:
p0 _ | p1 _ | p2 _ | p 3 | p4 _ | p5 _ | p6 _ | p 7 |
2/17 | 2/17 | 1/34 | 5/34 | 2/17 | 2/17 | 2/17 | 4/17 |
Informační entropii a složitost lze vypočítat z pravděpodobností stavu:
netopýr, bit.Je třeba poznamenat, že maximální možná entropie pro osm stavů je rovna bitu, což odpovídá případu, kdy je všech osm stavů stejně pravděpodobných, s pravděpodobnostmi 1/8 (chaotické). Proto má pravidlo 110 relativně vysokou entropii nebo využití stavu 2,86 bitů. To však nevylučuje výrazné kolísání stavové informace s ohledem na entropii a tím i vysokou míru složitosti. Zatímco maximální entropie by vylučovala složitost .
Pokud výše popsaná analytická metoda není proveditelná, lze k získání pravděpodobností stavu použít alternativní metodu. Spočívá v řízení systému přes jeho vstupy (buňky ovladače) náhodným zdrojem po mnoho generací a empirickém sledování pravděpodobnosti stavu. Po provedení počítačových simulací pro 10 milionů generací jsou výsledky následující: [2]
počet buněk | 3 | čtyři | 5 | 6 | 7 | osm | 9 | deset | jedenáct | 12 | 13 |
---|---|---|---|---|---|---|---|---|---|---|---|
(bit) | 2,86 | 3,81 | 4,73 | 5.66 | 6.56 | 7,47 | 8.34 | 9.25 | 10.09 | 10,97 | 11,78 |
(bit) | 0,56 | 0,65 | 0,72 | 0,73 | 0,79 | 0,81 | 0,89 | 0,90 | 1,00 | 1.01 | 1.15 |
0,20 | 0,17 | 0,15 | 0,13 | 0,12 | 0,11 | 0,11 | 0,10 | 0,10 | 0,09 | 0,10 |
Protože oba parametry a , rostou s velikostí systému, pro lepší srovnání systémů různých velikostí je navržen bezrozměrný vztah , relativní informačně-fluktuační složitost. Všimněte si, že empirické a analytické výsledky jsou konzistentní pro 3článkový automat.
V práci Batese a Sheparda [1] se počítá pro všechna pravidla elementárních buněčných automatů a bylo zjištěno, že ty, které vykazují pomalu se pohybující „kluzáky“ a případně stacionární objekty, například pravidlo 110, jsou úzce spojeny s velkými hodnotami . Proto jej lze použít jako filtr při výběru pravidel schopných univerzálního výpočtu, což je únavné dokazovat.
Přestože odvození vzorce složitosti fluktuace informace je založeno na fluktuacích informací v dynamickém systému, samotný vzorec závisí pouze na pravděpodobnosti stavu, a proto může být také aplikován na libovolné rozdělení pravděpodobnosti, včetně těch odvozených ze statických obrázků nebo textu.
V průběhu let se na původní článek [1] odkazovali výzkumníci z mnoha různých oblastí: teorie složitosti [3] , věda o komplexních systémech [4] , chaotická dynamika [5] , environmentální inženýrství [6] , ekologická složitost [7] , analýza ekologických časových řad [8] , odolnost ekosystémů [9] , znečištění ovzduší [10] a vody [11] , hydrologická vlnková analýza [12] , modelování vodních toků v půdě [13] , půdní vlhkost [14] , povodí odtok [15] , hloubka podzemní vody [16] , řízení letového provozu [17] , schéma proudění [18] , topologie [19] , tržní prognózy cen kovů [20] a elektřiny [21] , zdravotnická informatika [22] , lidská kognice [23] , kinematika lidské chůze [24] neurologie [25] analýza EEG [26] analýza řeči [27] vzdělávání [28] investování [29] estetika [30] .