Kanonická korelační analýza

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 27. března 2021; ověření vyžaduje 1 úpravu .

Canonical Correlation Analysis ( CCA ) je způsob  , jak získat informace z křížových korelačních matic . Pokud máme dva vektory a náhodné proměnné a mezi těmito proměnnými existují korelace , pak kanonická korelační analýza najde lineární kombinaci X a Y , která má maximální korelaci [1] . T. R. Knapp poznamenal, že „prakticky všechny běžně používané testy parametrické významnosti lze považovat za speciální případ kanonické korelační analýzy, což je obecný postup pro zkoumání vztahů mezi dvěma soubory proměnných“ [2] . Metodu poprvé představil Harold Hotelling v roce 1936 [3] .

Definice

Dané dva sloupcové vektory a náhodné proměnné s konečnými sekundovými momenty , lze definovat vzájemnou korelaci jako matici, jejíž prvky jsou kovariance . V praxi odhadujeme kovarianční matici na základě vzorových dat z a (tj. z dvojice datových matic).

Kanonická korelační analýza hledá vektory ( ) a ( ) takové, že náhodné proměnné a maximalizují korelaci . Náhodné proměnné a jsou první dvojicí kanonických proměnných . Pak se hledají vektory, které maximalizují stejnou korelaci s omezením, že nekorelují s prvním párem kanonických proměnných, což dává druhý pár kanonických proměnných . Tento postup může pokračovat až několikrát.

( A ' , b ' ) = argmax A , b kor ⁡ ( A T X , b T Y ) {\displaystyle (a',b')={\underset {a,b}{\operatorname {argmax} }}\operatorname {corr} (a^{T}X,b^{T}Y)}

Výpočet

Závěr

Nechte a . Maximalizovaný parametr

V prvním kroku změníme základ a určíme

Pak máme

Cauchyho -Bunyakovského nerovností dostáváme

Nerovnice se stane rovností, pokud jsou vektory a kolineární . Navíc maximální korelace je dosažena, když je vlastní vektor s maximální vlastní hodnotou pro matici (viz Rayleighův vztah ). Další pár je nalezen pomocí další největší vlastní hodnoty . Ortogonalita je zaručena symetrií korelačních matic.

Řešení

Řešení:

Podle toho také

Při obrácené změně souřadnic dostaneme

Kanonické proměnné jsou definovány rovností:

Implementace

CCA lze vypočítat pomocí singulárního rozkladu korelační matice [4] . Kanonická korelace je k dispozici jako funkce v následujících systémech [5] .

Testování hypotéz

Každý řádek je testován na významnost pomocí následující metody. Protože jsou korelace seřazeny, tvrzení, že řádek je nulový, znamená, že všechny další korelace jsou také nulové. Pokud máme ve vzorku nezávislá pozorování a je to odhadovaná korelace pro , pro -tý řádek bude kritériem významnosti:

který je asymptoticky distribuován jako chí-kvadrát se stupni volnosti pro velké [6] . Protože všechny korelace od do jsou nulové, součin členů za tímto bodem je irelevantní.

Praktické použití

Typickým použitím kanonické korelace v experimentálním kontextu je zvažování dvou souborů proměnných a zkoumání toho, co mají tyto dva soubory společného [7] . Například v psychologickém výzkumu lze provést dva zavedené vícerozměrné testy osobnosti , jako je Minnesota Multidimensional Personality Inventory (MMPI-2) a NEO . Když se podíváme na to, jak souvisí faktory MMPI-2 s faktory NEO, lze zjistit, které charakteristiky byly mezi těmito dvěma testy společné a do jaké míry jsou proměnné společné. Dalo by se například zjistit, že charakteristiky jako extraverze nebo neuroticismus tvoří podstatnou část společných proměnných pro oba testy.

Můžete také použít kanonickou korelační analýzu k získání rovnosti, která souvisí se dvěma sadami proměnných, jako je sada měření výkonu a sada vysvětlujících proměnných nebo výstupní sada a vstupní sada. Na takový model lze uložit omezující podmínky, aby byly zajištěny teoretické nebo intuitivně zřejmé požadavky. Tento typ modelu je známý jako model maximální korelace [8] .

Vizualizace výsledků kanonické korelace se obvykle provádí prostřednictvím sloupcového grafu koeficientů dvou sad proměnných pro dvojice kanonických proměnných, které vykazují významnou korelaci. Někteří autoři navrhují, že je lepší vizualizovat výsledky na heliografu, což je koláčový graf s pruhy jako paprsky, z nichž polovina představuje jednu sadu proměnných a druhá polovina druhou sadu [9] .

Příklady

Nechť s nulovým matematickým očekáváním , tzn. . Pokud , tj. a jsou plně korelované, potom například a , takže první (pouze pro tento příklad) pár kanonických proměnných je a . Pokud , tj. a jsou zcela antikorelované, then a , takže první (pouze pro tento příklad) pár kanonických proměnných je a . Všimněte si, že v obou případech , což ukazuje, že kanonická korelační analýza funguje přesně stejně s korelovanými proměnnými jako s antikorelovanými.

Vztah s hlavními úhly

Předpokládejme, že a mějme nulová matematická očekávání , tzn. . Jejich kovarianční matice a lze je považovat za Gramovy matice s vnitřním součinem pro resp . V této interpretaci jsou náhodné proměnné, prvky vektoru a prvky vektoru považovány za prvky vektorového prostoru se skalárním součinem daným kovariancí .

Definice kanonických proměnných a je pak ekvivalentní definici kořenových vektorů pro dvojice podprostorů překlenutých a , přičemž se bere v úvahu tento skalární součin . Kanonická korelace je rovna kosinu úhlu mezi podprostory.

Bělení a pravděpodobnostní kanonická korelační analýza

CCA lze také považovat za speciální bělící transformaci [10] , kdy jsou náhodné vektory a současně transformovány tak, že matice křížové korelace mezi bělenými vektory a je diagonální [11] .

Kanonické korelace jsou pak interpretovány jako regresní koeficienty týkající se , a , a mohou být záporné. Pohled na CCA jako na regresi poskytuje způsob, jak vytvořit latentní proměnný generativní pravděpodobnostní model pro CCA s nekorelovanými latentními proměnnými reprezentujícími celkový a částečný rozptyl.

Viz také

Poznámky

  1. Härdle, Simar, 2007 , str. 321–330.
  2. Knapp, 1978 , str. 410–416.
  3. Hotelling, 1936 , str. 321–377.
  4. Hsu, Kakade, Zhang, 2012 , str. 1460.
  5. Huang, Lee, Hsiao, 2009 , str. 2162.
  6. Mardia, Kent, Bibby, 1979 .
  7. Sieranoja, Sahidullah, Kinnunen, Komulainen, Hadid, 2018 .
  8. Tofallis, 1999 , str. 371–378.
  9. Degani, Shafto, Olson, 2006 , str. 93.
  10. Whitening transform převádí vektor náhodných proměnných pomocí lineární transformace na bílý šum
  11. Jendoubi, Strimmer, 2018 .

Literatura

Odkazy