Rayleighův vztah

V matematice je pro danou komplexní hermitovskou matici a nenulový vektor Rayleighův vztah [1] definován následovně [2] [3] :

Pro skutečné matice je podmínka pro hermitovskou matici redukována na její symetrii a hermitovská konjugace vektorů se změní na běžnou transpozici . Všimněte si, že pro jakoukoli skutečnou konstantu . Připomeňme, že hermitovská (stejně jako symetrická reálná) matice má skutečné vlastní hodnoty . Lze ukázat, že pro matici dosahuje Rayleighův poměr své minimální hodnoty (nejmenší vlastní hodnota matice ), když je roven (odpovídající vlastní vektor). Podobným způsobem lze ukázat, že a . Rayleighův vztah se používá v Courant-Fisherově minimaxové větě k získání všech hodnot vlastních hodnot [4] . Používá se také v algoritmech pro hledání vlastních hodnot matice k získání aproximace vlastních hodnot z aproximace vlastních vektorů. Relace je totiž základem pro iterace s Rayleighovým vztahem [5] [6] .

Množina hodnot Rayleighova vztahu se nazývá číselný obraz matice [7] [8] .

Speciální případ kovariančních matic

Kovarianční matici M pro vícerozměrný statistický vzorek A (matici pozorování) lze reprezentovat jako součin A' A [9] [10] . Jako symetrická reálná matice má M nezáporná vlastní čísla a ortogonální (nebo redukovatelné na ortogonální) vlastní vektory.

Za prvé, že vlastní hodnoty nejsou záporné:

A za druhé, že vlastní vektory jsou navzájem ortogonální:

(pokud se vlastní hodnoty liší - v případě stejných hodnot můžete najít ortogonální základ).

Ukažme nyní, že Rayleighův poměr nabývá maximální hodnoty na vektoru odpovídajícím největšímu vlastnímu číslu. Rozšiřme libovolný vektor z hlediska báze vlastních vektorů v i :

, kde je průmět x na

Tedy rovnost

lze přepsat do následující podoby:

Protože jsou vlastní vektory ortogonální, stane se poslední rovností

Poslední rovnost ukazuje, že Rayleighův poměr je součtem čtverců cosinus úhlů mezi vektorem a každým z vlastních vektorů , vynásobených odpovídající vlastní hodnotou.

Jestliže vektor maximalizuje , pak všechny vektory získané z násobení skalárem ( for ) také maximalizují R . Problém lze tedy zredukovat na nalezení maxima za podmínky .

Protože všechna vlastní čísla jsou nezáporná, problém se redukuje na nalezení maxima konvexní funkce a lze ukázat, že je dosaženo v a (vlastní hodnoty jsou seřazeny v sestupném pořadí).

Rayleighův poměr tedy dosáhne svého maxima na vlastním vektoru odpovídajícím maximální vlastní hodnotě.

Stejný výsledek s použitím Lagrangeových multiplikátorů

Stejný výsledek lze získat pomocí Lagrangeových multiplikátorů . Problém je najít kritické body funkce

,

při konstantní hodnotě To znamená, že potřebujete najít kritické body funkce

kde je Lagrangeův multiplikátor. Pro stacionární body funkce rovnost

a

Vlastní vektory matice M jsou tedy kritickými body Rayleighova vztahu a jejich vlastní hodnoty jsou odpovídající stacionární hodnoty.

Tato vlastnost je základem analýzy hlavních komponent a kanonické korelace .

Použití v teorii Sturm-Liouville

Sturm-Liouvilleova teorie spočívá ve studiu lineárního operátoru

s tečkovým produktem

,

kde funkce splňují některé specifické okrajové podmínky v bodech aab . Rayleighův vztah zde nabývá formy

Někdy je tento poměr reprezentován v ekvivalentní podobě pomocí integrace po částech [11] :

Generalizace

Pro jakýkoli pár reálných symetrických kladně určitých matic a nenulový vektor je zobecněný Rayleighův vztah definován jako

Zobecněný Rayleighův vztah lze transformací redukovat na Rayleighův vztah , kde je rozklad Choleského matice .

Viz také

Poznámky

  1. také známý jako vztah Rayleigh-Ritz , pojmenovaný po Walteru Ritzovi a lordu Rayleighovi .
  2. Horn, R. A. a C. A. Johnson. 1985. Maticová analýza . Cambridge University Press. str. 176–180.
  3. Parlet BN The symmetric eigenvalue problem , SIAM, Classics in Applied Mathematics, 1998
  4. Beckenbach, 1965 , §26 Fischerova věta o minimaxu.
  5. Parlett, 1983 , §4.6 Iterace s Rayleighovým vztahem, str. 87).
  6. Verbitsky, 2000 , §4.3 Reverzní iterace, str. 115.
  7. Gevorgyan .
  8. Prasolov, 2008 , 2.2 Jádro a obraz operátora. Faktorový prostor., str. 114.
  9. Korshunov, 2008 , Úvod.
  10. ACTA, 2005 .
  11. Haberman, 1987 .

Literatura