Faktorová analýza

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 3. února 2022; kontroly vyžadují 5 úprav .

Faktorová analýza  je vícerozměrná metoda používaná ke studiu vztahů mezi hodnotami proměnných. Předpokládá se, že známé proměnné závisí na menším počtu neznámých proměnných a náhodné chybě.

Historie

Faktorová analýza se poprvé objevila v psychometrice a v současné době je široce používána nejen v psychologii , ale také v neurofyziologii , sociologii , politologii , ekonomii , statistice a dalších vědách. Hlavní myšlenky faktorové analýzy byly položeny anglickým psychologem a antropologem , zakladatelem eugeniky , Galtonem , který také významně přispěl ke studiu individuálních rozdílů. Spearman (1904, 1927, 1946), Thurstone (1935, 1947, 1951), Cattell (1946, 1947, 1951), Pearson , Eysenck také přispěli k rozvoji faktorové analýzy . Matematický aparát faktorové analýzy vyvinuli Hotelling , Harman, Kaiser, Thurstone, Tucker. Ve druhé polovině 20. století byla faktorová analýza zahrnuta do všech hlavních balíků pro zpracování statistických dat, včetně R , SAS , SPSS , Statistica , Stata .

Úlohy a možnosti faktorové analýzy

Faktorová analýza umožňuje řešit dva důležité problémy výzkumníka: popsat objekt měření komplexně a zároveň kompaktně. Pomocí faktorové analýzy je možné identifikovat skryté proměnné faktory odpovědné za přítomnost lineárních statistických korelací mezi pozorovanými proměnnými.

Dva hlavní cíle faktorové analýzy jsou:

Při analýze jsou proměnné, které spolu silně korelují, sloučeny do jednoho faktoru, v důsledku toho se rozptyl přerozdělí mezi komponenty a získá se nejjednodušší a nejpřehlednější struktura faktorů. Po zkombinování bude vzájemná korelace složek v rámci každého faktoru vyšší než jejich korelace se složkami jiných faktorů. Tento postup vám také umožňuje zvýraznit latentní proměnné , což je zvláště důležité při analýze sociálního vnímání a hodnot. Například při analýze skóre získaných na několika škálách si výzkumník všimne, že jsou si navzájem podobné a mají vysoký korelační koeficient, může předpokládat, že existuje nějaká latentní proměnná, která může vysvětlit pozorovanou podobnost získaných skóre. Tato latentní proměnná se nazývá faktor. Tento faktor ovlivňuje řadu ukazatelů jiných proměnných, což nás vede k možnosti a nutnosti vyčlenit jej jako nejobecnější, vyšší řád. Pro identifikaci nejvýznamnějších faktorů a v důsledku toho i faktorové struktury je nanejvýš oprávněné použít metodu hlavních komponent (PCA). Podstatou této metody je nahrazení korelovaných složek nekorelovanými faktory. Další důležitou vlastností metody je schopnost omezit nejinformativnější hlavní složky a zbytek z analýzy vyloučit, což zjednodušuje interpretaci výsledků. Výhodou PCA je také to, že jde o jedinou matematicky podloženou metodu faktorové analýzy [1] [3] . Podle řady výzkumníků není PCA metodou faktorové analýzy, protože nerozděluje rozptyl indikátorů na společné a jedinečné [4] než proměnné patřící do různých skupin.

Faktorová analýza může být:

Podmínky pro aplikaci faktorové analýzy

Praktická implementace faktorové analýzy začíná kontrolou jejích podmínek. Předpoklady pro faktorovou analýzu zahrnují:

Základní pojmy faktorové analýzy

Dva základní pojmy faktorové analýzy: faktor  – latentní proměnná a zátěž  – korelace mezi původní proměnnou a faktorem. Hlavním požadavkem na faktory je ovladatelnost. Kontrolovatelností se rozumí stanovení požadované hodnoty faktoru a její udržení po celou dobu experimentu. To je zvláštnost aktivního experimentu. Faktory mohou být kvantitativní a kvalitativní“ . Příklady kvantitativních faktorů jsou teplota , koncentrace atd. Jejich úrovně odpovídají číselné škále. Příklady kvalitativních faktorů jsou různé katalyzátory, konstrukce přístrojů, úpravy, vyučovací metody . Úrovně těchto faktorů neodpovídají číselné škále a na jejich pořadí nezáleží. Výstupní proměnné jsou reakce (odpovědi) na dopad vstupních proměnných. Odezva závisí na specifikách studie a může být ekonomická (zisk, ziskovost), technologická (výnos, spolehlivost), psychologická, statistická atd . Optimalizační parametr musí být efektivní z hlediska dosažení cíle , univerzální, kvantitativní, vyjádřený číslem, které má fyzikální význam, musí být jednoduché a snadno vypočítatelné. Kromě požadavku na ovladatelnost vybraných faktorů existuje několik dalších požadavků: pro každou dvojici faktorů musí být splněna podmínka kompatibility ; faktory musí být nezávislé a jednoznačné; faktory by měly přímo ovlivňovat parametr optimalizace; faktory musí být stanoveny operativně; přesnost stanovení hraničních hodnot faktorů je co nejvyšší.

Graficko-analytická metoda stanovení významnosti faktorů umožňuje provádět screeningový experiment s minimálním počtem experimentů. Umožňuje pouze na základě experimentálních dat určit nejen míru vlivu faktorů na výslednou funkci, ale také vyvodit předběžné závěry o tom, jak faktory ovlivňují (ve směru zvyšování či snižování výsledné funkce).

U prvního typu rotace je každý následující faktor určen tak, aby se maximalizovala variabilita zbývající z předchozích, takže se faktory ukazují jako nezávislé, nekorelované na sobě (do tohoto typu patří PCA). Druhým typem je transformace, ve které faktory vzájemně korelují . Výhoda šikmé rotace spočívá v tom, že když se jako výsledek získají ortogonální faktory, můžeme si být jisti, že tato ortogonalita je jim skutečně vlastní a není uměle zavedena. V obou režimech je asi 13 rotačních metod, ve statistickém programu SPSS 10 jich je k dispozici pět: tři ortogonální, jedna šikmá a jedna kombinovaná, ze všech je však nejrozšířenější ortogonální metoda " varimax ". Metoda varimax maximalizuje rozložení kvadrátu zatížení pro každý faktor, což vede ke zvýšení velkých a snížení malých hodnot faktorového zatížení. Výsledkem je jednoduchá struktura pro každý faktor zvlášť [1] [3] [2] .

Hlavním problémem faktorové analýzy je výběr a interpretace hlavních faktorů. Při výběru komponent naráží výzkumník obvykle na značné potíže, protože neexistuje jednoznačné kritérium pro výběr faktorů, a proto je zde nevyhnutelná subjektivní interpretace výsledků. Existuje několik často používaných kritérií pro určení počtu faktorů. Některá z nich jsou alternativou k jiným a některá z těchto kritérií lze použít společně, takže jedno doplňuje druhé:

Praxe ukazuje, že pokud rotace nevyvolala významné změny ve struktuře faktorového prostoru, svědčí to o jeho stabilitě a stabilitě dat. Jsou možné další dvě možnosti:

To druhé je možné například tehdy, když je na přítomnost určité vlastnosti kontrolováno několik sociálních skupin, ale pouze jedna z nich má požadovanou vlastnost.

Faktory mají dvě charakteristiky: množství vysvětleného rozptylu a zatížení. Pokud je vezmeme v úvahu z hlediska geometrické analogie, pak pokud jde o první z nich, zjistíme, že faktor ležící podél osy OX může vysvětlit až 70 % rozptylu (první hlavní faktor), faktor ležící podél osy OX osa OY nemůže určit více než 30 % (druhý hlavní faktor). To znamená, že v ideální situaci lze celý rozptyl vysvětlit dvěma hlavními faktory s uvedenými podíly [5] . V typické situaci mohou existovat dva nebo více hlavních faktorů a existuje také část neinterpretovatelného rozptylu (geometrické zkreslení), která je z analýzy vyloučena z důvodu nevýznamnosti. Zatížení, opět z pohledu geometrie, jsou průměty z bodů na osy OX a OY (s tří a více faktoriální strukturou i na osu OZ). Projekce jsou korelační koeficienty, body jsou pozorování, takže faktorová zatížení jsou mírou asociace. Vzhledem k tomu, že korelace s Pearsonovým koeficientem R ≥ 0,7 je považována za silnou, je třeba věnovat pozornost pouze silným spojům v zátěžích. Faktorové zatížení může mít vlastnost bipolarity  - přítomnost pozitivních a negativních indikátorů v jednom faktoru. Pokud je přítomna bipolarita, pak jsou indikátory, které tvoří faktor, dichotomické a jsou v opačných souřadnicích [1] .

Metody faktorové analýzy

Poznámky

  1. 1 2 3 4 5 6 7 8 9 Kim J.-O., Muller C. W. "Faktorová analýza: statistické metody a praktické otázky" / soubor prací "Faktorová, diskriminační a shluková analýza": přel. z angličtiny; Pod. vyd. I. S. Enyuková. - M .: "Finance a statistika", 1989. - 215 s.
  2. 1 2 Elektronická učebnice statistiky. Moskva, StatSoft. WEB: www.statsoft.ru/home/textbook/default.htm.
  3. 1 2 3 4 Shumetov V. G., Shumetova L. V. „Faktorová analýza: počítačově podporovaný přístup“. OrelGTU, Orel, 1999. - 88 s.
  4. Brown, Timothy A. Konfirmační faktorová analýza pro aplikovaný výzkum. Guilford Press, 2006.
  5. Stránky J.-P. „Konflikty a veřejné mínění. Nový pokus o spojení sociologů a matematiků“ // Sociologický výzkum, 1991, č. 7. - s. 107-115.

Literatura

Odkazy