Karhunen-Loeveova věta

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 19. října 2020; ověření vyžaduje 1 úpravu .

Důležitým základním problémem diskretizační teorie je otázka objemu diskrétního popisu signálů, tedy počtu základních funkcí používaných k reprezentaci:

.

Chcete-li najít optimální základ, musíte určit třídu signálů, pro kterou se hledá, a také nastavit přesnost obnovení pro tuto třídu. Ve statistickém přístupu k popisu signálů se za optimální  rozměrovou základnu pro reprezentaci jednotlivých realizací signálů obvykle považuje základ, při kterém je chybovost, zprůměrovaná na soubor realizací, minimální. V tomto případě jsou nutné a postačující podmínky pro minimum chybové normy reprezentace signálu jako součtu bázových funkcí určeny Karhunen-Loevovou větou.

Populární formulace

Minimální hodnoty normy chyby v reprezentaci signálů v intervalu délek je dosaženo při použití vlastních funkcí operátora jako základu, jehož jádrem je korelační funkce signálů :

,

odpovídající největším vlastním číslům. V tomto případě je chybovost:

.

Takovým rozkladem je Karhunen-Loeveův rozklad [1] [2] .

Aplikace

V teorii náhodných procesů je Karhunen-Loeve teorém (pojmenovaný po Kari Karhunen a Michel Loeve ) reprezentací náhodného procesu jako nekonečné lineární kombinace ortogonálních funkcí , podobně jako reprezentace Fourierovy řady  - sekvenční reprezentace funkcí. na ohraničeném intervalu. Na rozdíl od Fourierových řad, kde jsou koeficienty reálná čísla a reprezentační báze se skládá ze sinusových funkcí (tj. sinusových a kosinových funkcí s různými frekvencemi), jsou koeficienty v Karhunen-Loeveově teorému náhodné veličiny a reprezentační báze závisí na proces. Funkce ortogonální báze použité v této reprezentaci definují funkci kovariance procesu . Pokud považujeme stochastický proces za náhodnou funkci F , tedy proces, ve kterém funkce na intervalu [ a , b ] nabývá hodnoty F , pak lze na tuto větu nahlížet jako na náhodný ortonormální rozvoj F.

Náhodný proces se středem { X t } t ∈ [ a , b ] (kde centrování znamená, že matematická očekávání E( X t ) existují a jsou rovna nule pro všechny hodnoty parametru t z [ a , b ]) , který splňuje technickou podmínku návaznosti, připouští rozklad následující podoby:

kde Z k  jsou vzájemně nekorelované náhodné proměnné a funkce e k  jsou spojité reálné funkce na [ a , b ] ortogonální v L ² [ a , b ]. V případě necentrovaného procesu dochází k podobné expanzi získané rozšířením funkce očekávání v bázi e k .

Je-li proces Gaussovský , pak náhodné veličiny Z k  jsou také Gaussovské a jsou nezávislé . Tento výsledek zobecňuje Karhunen-Loeve transformace . Důležitým příkladem centrovaného stochastického procesu na intervalu [0,1] je Wienerův proces a Karhunen-Loeveův teorém lze použít k získání kanonické ortogonální reprezentace. V tomto případě se expanze skládá ze sinusových funkcí.

Výše uvedené rozklady v jsou také známé jako Karhunen-Loeve rozklady nebo rozklad (empirická verze, tj. s koeficienty z původních numerických dat), jako analýza hlavních komponent , správný ortogonální rozklad nebo Hotellingova transformace .

Formulace

Zformulujme výsledek z hlediska komplexně hodnocených stochastických procesů. Výsledky mohou být aplikovány na procesy s reálnou hodnotou bez modifikace, přičemž je třeba mít na paměti, že komplexní konjugát reálného čísla je stejný jako on sám.

Pro náhodné prvky X a Y je skalární součin definován vzorcem

kde * označuje operaci komplexní konjugace .

Statistika druhého řádu

Bodový součin je dobře definovaný, pokud oba a mají konečné sekundové momenty, nebo ekvivalentně, pokud jsou oba integrovatelné se čtvercem . Všimněte si, že tečkový součin souvisí s kovariancí a korelací . Zejména pro náhodné proměnné s průměrem nula jsou kovariance a bodový součin stejné. Autokovarianční funkce

Pokud je proces { X t } t vycentrován, pak

pro všechny t . Autokovariance K XX je tedy rovna autokorelaci R XX :

Všimněte si, že pokud je { X t } t vystředěno a t 1 , ≤ t 2 , …, ≤ t N jsou body na intervalu [ a , b ], proto

Prohlášení věty

Věta . Uvažujme centrovaný stochastický proces indexovaný na intervalu s kovarianční funkcí . Předpokládejme, že kovarianční funkce je spojitá v množině proměnných . Pak  je kladně definitní jádro a podle Mercerovy věty má integrální operátor v (blízko Lebesgueovy míry na ) ortonormální základ vlastních vektorů. Nechť jsou vlastní vektory odpovídající nenulovým vlastním číslům a

Pak  jsou centrované ortogonální náhodné proměnné a

řada konverguje ve střední čtverci a také rovnoměrně v . kromě

kde je vlastní hodnota odpovídající vlastnímu vektoru .

Cauchyovy součty

Při formulaci věty lze integrál v definici chápat jako limitu průměru Cauchyho součtů náhodných veličin

kde

Speciální případ: Gaussovo rozdělení

Protože střední čtvercová mez společně Gaussových náhodných proměnných je Gaussovská a společně Gaussovské (centrované) náhodné proměnné jsou nezávislé právě tehdy, jsou-li ortogonální, můžeme také dojít k závěru:

Věta . Náhodné proměnné mají gaussovské rozdělení a jsou nezávislé, pokud je počáteční proces { X t } t také gaussovský.

V Gaussově případě, protože náhodné proměnné jsou nezávislé, můžeme si být jisti, že:

téměř jistě.

Všimněte si, že zobecněním Mercerovy věty můžeme interval nahradit jinými kompaktními prostory a Lebesgueovu míru na  Borelově míře podporovanou v .

Wienerův proces

Wienerův proces v teorii náhodných procesů je matematický model Brownova pohybu nebo náhodné procházky se spojitým časem. Zde jej definujeme jako centrovaný Gaussův proces B ( t ) s kovarianční funkcí

Je snadné vidět, že kovarianční vlastní vektory jsou

a odpovídající vlastní hodnoty

To nám umožňuje získat následující reprezentaci Wienerova procesu:

Věta . Existuje posloupnost { W i } i nezávislých Gaussových náhodných proměnných s nulovým středním a jednotkovým rozptylem tak, že

Konvergence je stejnoměrná v t v normě L² taková, že

jednotně v t .

Použití

Bylo navrženo, že projekt SETI by měl používat Karhunen-Loeveovy transformace k detekci signálů s velmi širokým spektrem. Podobně systémy adaptivní optiky někdy používají funkce Karhunen-Loeve k obnovení informací o fázi čela vlny. (Dai 1996, JOSA A).

Viz také

Odkazy

Poznámky

  1. Úvod do digitálního zpracování obrazu, 1979 , str. 68.
  2. Teorie signálů, 1974 , s. 115.

Literatura