Moderování ve statistice

Moderování ve statistice a regresní analýze  je závislost vztahu mezi dvěma proměnnými na třetí proměnné, která se nazývá moderátor [1] . Moderátorský efekt je statisticky charakterizován jako interakce ; tj. kategoriální (pohlaví, etnikum , třída ) nebo kvantitativní (úroveň mzdy) proměnná, která ovlivňuje směr a/nebo sílu vztahu mezi závislými a nezávislými proměnnými . Zejména v korelační analýze je moderátor třetí proměnnou, která ovlivňuje korelaci nultého řádu mezi dalšími dvěma proměnnými nebo sklon závislé proměnné k nezávislé proměnné. Při analýze rozptylu lze hlavní redukční efekt reprezentovat jako interakci mezi hlavní nezávislou proměnnou a faktorem, který nastavuje vhodné podmínky pro její fungování [2] .

Příklady

Moderovaná analýza v behaviorálních vědách zahrnuje použití lineární vícenásobné regresní analýzy nebo kauzálního modelování . Pro kvantifikaci vlivu moderátoru ve vícenásobné regresní analýze regrese náhodné proměnné na , je do modelu přidán další člen, který představuje interakci mezi a moderátorem.

Závislost cílové proměnné na moderující proměnné tedy bude vypadat takto:

.

V tomto případě je role moderátora dosažena vyhodnocením , parametru pro interakční člen [2] .

Multikolinearita v regresi

Při moderované regresní analýze se vypočítá nový prediktor interakce , který bude vztažen ke dvěma hlavním proměnným použitým k jeho výpočtu. Toto je problém multikolinearity v mírné regresi. Multikolinearita má za následek, že koeficienty jsou odhadnuty s vyššími standardními chybami , a tedy s větší nejistotou .

Střední centrování se používá jako náprava multikolinearity , ale není vyžadováno v regresní analýze, protože data jsou již vycentrována v korelační matici poté, co jsou korelace vypočteny. Korelace jsou odvozeny z křížového součinu dvou standardních skóre (Z-skóre) nebo statistických momentů.

Dvě kategorické nezávislé proměnné

Pokud jsou obě vysvětlující proměnné kategorické , můžeme analyzovat regresní výsledky pro jednu vysvětlující proměnnou na určité úrovni druhé vysvětlující proměnné. Předpokládejme, že A a B jsou jednoduše kódované fiktivní proměnné (0,1) a že A představuje etnický původ (0=bělošský, 1=asijský) a B představuje stav ve studii (0=kontrola, 1=trénink). Interakční efekt pak ukazuje, zda je vliv podmínky na závisle proměnnou Y odlišný u bělochů a Asiatů a zda je u těchto dvou podmínek rozdílný vliv etnicity . Koeficient A ukazuje vliv etnického původu na Y pro kontrolní podmínku, zatímco koeficient B ukazuje vliv superponování experimentální podmínky na evropské účastníky.

Abychom otestovali, zda existuje nějaký významný rozdíl mezi Evropany a Asiaty za experimentálních podmínek, můžeme jednoduše spustit analýzu s proměnnou stavu kódovanou v opačném pořadí (0=experimentální, 1=kontrola), takže koeficient etnicity představuje vliv etnicity. na Y za experimentálních podmínek. Podobně, pokud chceme zjistit, zda jsou ovlivněni asijští účastníci, můžeme změnit kód pro proměnnou etnicity (0=asijský, 1=evropský).

Jedna kategorická a jedna spojitá nezávislá proměnná

Pokud je první nezávislá proměnná kategorická proměnná (např. pohlaví) a druhá je spojitá proměnná (např. skóre na škále životní spokojenosti ), pak b1 je rozdíl v závislé proměnné mezi muži a ženami, když je životní spokojenost nula. Nulové skóre na škále spokojenosti však nedává smysl, protože rozsah skóre je od 7 do 35 [3] . Pokud odečtete průměrné skóre SWLS pro vzorek od skóre každého účastníka, pak je průměr výsledného vycentrovaného skóre SWLS nula. Při opětovné analýze představuje b1 rozdíl mezi muži a ženami v průměrném SWLS skóre vzorku .

Pro zkoumání jednoduchého vlivu pohlaví na závislou proměnnou (Y) je možné ji rozdělit do tří kategorií: vysoká, střední a nízká SWLS [4] . Pokud skóre spojité proměnné není standardizováno, lze tyto tři hodnoty jednoduše vypočítat přičtením nebo odečtením jedné směrodatné odchylky od původních skóre; pokud jsou skóre spojité proměnné standardizována, lze vypočítat tři hodnoty následovně: vysoká = standardizované skóre - 1, střední (průměr = 0), nízká = standardizované skóre + 1. Stejně jako u dvou kategorických vysvětlujících proměnných, b2 představuje dopad skóre SWLS na závislou proměnnou pro ženy. Zpětným kódováním proměnné pohlaví lze získat vliv skóre SWLS na závislou proměnnou u mužů.

Kódování v moderované regresi

Při zvažování kategoriálních proměnných , jako jsou etnické skupiny a experimentální léčby, jako nezávislých proměnných v moderované regresi, je nutné kódovat proměnné tak, aby každá kódující proměnná představovala konkrétní nastavení kategoriální proměnné. Existují tři hlavní způsoby kódování: variabilní fiktivní kódování, kódování efektů a kontrastní kódování [5] .

Falešné kódování se používá, když existuje referenční skupina nebo jedna konkrétní podmínka (například kontrolní skupina v experimentu), která musí být porovnána s každou jinou experimentální skupinou pomocí průměru referenční skupiny a každé z ne standardizované regresní koeficienty je rozdíl v závislé proměnné mezi jednou z léčených skupin a průměrem referenční skupiny (nebo kontrolní skupiny). Tento systém kódování je podobný analýze ANOVA a je vhodný, když výzkumníci mají specifickou referenční skupinu a chtějí s ní porovnat každou z ostatních skupin.

Kódování efektů se používá, když osoba nemá definovanou srovnávací nebo kontrolní skupinu a žádné plánované ortogonální kontrasty. V tomto případě je regresní koeficient rozdílem mezi průměrem jedné skupiny a průměrem všech skupin (například průměr skupiny A mínus průměr všech skupin). Tento systém kódování je vhodný, když skupiny představují přirozené kategorie.

Kontrastní kódování se používá, když je třeba zkoumat množství ortogonálních kontrastů nebo skupinových srovnání. V tomto případě je nestandardizovaný regresní koeficient rozdílem mezi neváženým průměrem jedné skupiny (A) a neváženým průměrem druhé skupiny (B), kde A a B jsou dvě sady skupin v kontrastu. Tento systém kódování je vhodný, když výzkumníci mají apriorní hypotézu o specifických rozdílech mezi průměry skupin [6] .

Dvě spojité nezávislé proměnné

Pokud jsou obě vysvětlující proměnné spojité, je pro interpretaci užitečné buď vycentrovat, nebo standardizovat vysvětlující proměnné X a Z. (Vystředění zahrnuje odečtení celkového průměrného skóre vzorku od původního skóre; standardizace provede totéž a následuje dělení celkovým standardem vzorku odchylka.) Centrováním nebo standardizací nezávislých proměnných lze koeficient X nebo Z interpretovat jako vliv této proměnné na Y na průměrné úrovni jiné nezávisle proměnné [7] .

Ke zkoumání účinku interakce je často užitečné vykreslit vliv X na Y při nízkých a vysokých hodnotách Z. Často se k tomu volí hodnoty Z, které jsou o jednu směrodatnou odchylku nad a pod průměrem, ale jakékoli lze použít přiměřenou hodnotu (a v některých případech jsou na výběr smysluplnější hodnoty). Graf se obvykle zobrazuje vyhodnocením hodnot Y pro vysoké a nízké hodnoty X i Z a vytvořením dvou čar, které reprezentují vliv X na Y při dvou hodnotách Z. To je někdy doplněno jednoduchou analýzou sklonu. který určuje, zda je účinek X na Y statisticky významný při určitých hodnotách Z. Existují různé nástroje, které výzkumníkům pomáhají konstruovat a interpretovat takové dvoucestné interakce [8] .

Interakce na vysoké úrovni

Principy obousměrných interakcí platí, když chceme prozkoumat třícestné nebo vysokoúrovňové interakce. Například, pokud máme třícestnou interakci mezi A, B a C, regresní rovnice by vypadala takto:

Vedlejší účinky vyššího řádu

Stojí za zmínku, že spolehlivost podmínek vyšší úrovně závisí na spolehlivosti podmínek nižší úrovně. Pokud je například spolehlivost pro proměnnou A 0,70 a spolehlivost pro proměnnou B je 0,80, pak spolehlivost pro proměnnou interakce AxB je 0,70 × 0,80 = 0,56. V tomto případě vede nízká spolehlivost interakčního členu k nízkému výkonu; takže nemůžeme najít interakční efekty mezi A a B, které skutečně existují. Řešením tohoto problému je použití vysoce spolehlivých měření pro každou nezávislou proměnnou.

Dalším vysvětlením pro interpretaci interakčních efektů je, že když proměnná A a proměnná B silně korelují, pak výraz AxB bude silně korelovat s vynechanou proměnnou A2; proto to, co se zdá být významným zmírňujícím efektem, může být ve skutečnosti významným nelineárním efektem samotného A. Pokud je tomu tak, pak stojí za to otestovat nelineární regresní model přidáním nelineárních členů do jednotlivých proměnných do moderované regresní analýzy, aby se zjistilo, zda interakce zůstávají významné. Pokud je interakční efekt AxB stále významný, budeme si více jisti, že skutečně existuje mírný efekt; pokud však interakční efekt po přidání nelineárního členu již není významný, budeme si méně jisti mírným efektem a bude preferován nelineární model, protože je šetrnější.

Poznámky

  1. Anna Širokanová. Když se dvě nezávislé proměnné vzájemně ovlivňují: Účinky moderování v sociálním  výzkumu .
  2. ↑ 12 Cohen , Jacob; Cohen, Patricia; Leona S. Aiken; West, Stephen H. (2003). Aplikovaná vícenásobná regresní/korelační analýza pro behaviorální vědy . Hillsdale, NJ: L. Erlbaum Associates. ISBN0-8058-2223-2.
  3. Škála životní spokojenosti - Psylab.info . psylab.info . Získáno 5. března 2021. Archivováno z originálu 10. prosince 2019.
  4. Cohen Jacob; Patricia Cohen; West Stephen G.; Aiken Leona S. Aplikovaná vícenásobná regresní/korelační analýza pro behaviorální vědy (3. ed.). Mahwah, NJ [ua]: Erlbaum. str. 255-301. ISBN0-8058-2223-2.
  5. Aiken LS, West., SG (1996). Vícenásobné regresní testování a interpretace (1. brožovaný tisk. ed.). Newbury Park, Kalifornie [ua]: Sage Publications, Inc. ISBN0-7619-0712-2.
  6. Cohen Jacob; Patricia Cohen; West Stephen G.; Aiken Leona S. (2003). Aplikovaná vícenásobná regresní/korelační analýza pro behaviorální vědy (3. ed.). Mahwah, NJ [ua]: Erlbaum. str. 302-353. ISBN0-8058-2223-2.
  7. Dawson, JF (2013). Moderování v manažerském výzkumu: Co, proč, kdy a jak. Journal of Business and Psychology.
  8. Interpretace interakčních efektů . www.jeremydawson.co.uk . Získáno 8. března 2021. Archivováno z originálu dne 1. listopadu 2020.