Vícenásobný korelační koeficient

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 23. března 2019; ověření vyžaduje 1 úpravu .

Vícenásobný korelační koeficient - Charakterizuje těsnost lineární korelace mezi jednou náhodnou veličinou a nějakou množinou náhodných veličin. Přesněji, jestliže (ξ 1 ,ξ 2 ,...,ξ k ) je náhodný vektor z R k , pak je koeficient vícenásobné korelace mezi ξ 1 a ξ 2 ,...,ξ k číselně roven páru lineární korelační koeficient mezi hodnotou ξ 1 a její nejlepší lineární aproximací v proměnných ξ 2 ...,ξ k , což je lineární regrese ξ 1 na ξ 2 ,...,ξ k .

Vlastnosti

Vícenásobný korelační koeficient má vlastnost, že za podmínky

kdy je regrese ξ 1 na ξ 2 ,...,ξ k ,

ze všech lineárních kombinací proměnných ξ 2 ,...,ξ k bude mít proměnná ξ 1 maximální korelační koeficient s ξ 1 * , který se shoduje s . V tomto smyslu je vícenásobný korelační koeficient speciálním případem kanonického korelačního koeficientu . Při k = 2 se vícenásobný korelační koeficient v absolutní hodnotě shoduje s párovým lineárním korelačním koeficientem ρ 12 mezi ξ 1 a ξ 2 .

Výpočet

Vícenásobný korelační koeficient se vypočítá pomocí korelační matice podle vzorce

,

kde je determinant korelační matice a je algebraický doplněk prvku ρ 11 = 1 ; zde . Jestliže , pak s pravděpodobností 1 se hodnoty ξ 1 shodují s lineární kombinací ξ 2 ,...,ξ k , proto společné rozdělení ξ 1 ,ξ 2 ,...,ξ k leží na nadrovině v prostor R k . Na druhou stranu pro všechny párové korelační koeficienty jsou ρ 12 = ρ 13 = ... = ρ 1k = 0 rovny nule, proto hodnoty ξ 1 nekorelují s hodnotami ξ 2 , ...,ξ k . Opak je také pravdou. Vícenásobný korelační koeficient lze také vypočítat pomocí vzorce

,

kde je rozptyl ξ 1 a je rozptyl ξ 1 vzhledem k regresi.

Vzorový vícenásobný korelační koeficient

Vzorovou obdobou vícenásobného korelačního koeficientu je hodnota , kde a jsou odhady pro a získané ze vzorku o velikosti n . Rozdělení statistiky se používá k testování nulové hypotézy o žádném vztahu . Za předpokladu, že je vzorek odebrán z vícerozměrného normálního rozdělení , bude mít hodnota rozdělení beta s parametry if . Pro případ je typ rozvodu znám, ale pro svou těžkopádnost se prakticky nepoužívá.

Viz také

Literatura