Kauzální model , kauzální model je konceptuální model , který popisuje kauzální mechanismy systému. Kauzální modely mohou zlepšit kvalitu výzkumu poskytnutím jasných pravidel pro zahrnutí nezávislých proměnných do analýzy [2] . Mohou umožnit, aby některé otázky byly zodpovězeny na základě existujících pozorovacích dat bez potřeby intervenční studie, jako je randomizovaná kontrolovaná studie . Některé intervenční studie nejsou vhodné z etických nebo praktických důvodů, to znamená, že bez kauzálního modelu nelze některé hypotézy testovat [3] .
Kauzální modely mohou pomoci vyřešit otázku externí validity (zda se výsledky jedné studie vztahují na neprozkoumané skupiny). Kauzální modely mohou umožnit kombinaci dat z více studií k zodpovězení otázek, na které nemůže odpovědět žádný soubor dat. Kauzální modely jsou falzifikovatelné , a pokud neodpovídají datům, musí být odmítnuty jako neplatné. Měly by být srozumitelné i těm, kterým jsou blízké jevy, které hodlá model vysvětlit [4] .
Kauzální modely mají aplikace ve zpracování signálů , epidemiologii a strojovém učení . Podle Judah Pearl , vyjádřené v The Book of Why , 2018, jsou kauzální modely nezbytným prvkem ve vývoji silné umělé inteligence [5] .
Kauzální modely jsou matematické modely, které představují kauzální vztahy v rámci určitého systému nebo skupiny. Usnadňují vyvozování kauzálních vztahů ze statistických dat. Mohou nám hodně říci o epistemologii kauzality a vztahu mezi kauzalitou a pravděpodobností . Oni také byli aplikováni na témata zájmu k filozofům, takový jako teorie rozhodování a analýza faktické kauzality [6] .
Judah Pearl definuje kauzální model jako uspořádaný triple , kde je soubor exogenních proměnných, jejichž hodnoty jsou určeny faktory mimo model; — soubor endogenních proměnných, jejichž hodnoty jsou určeny faktory v rámci modelu; a je souborem strukturních rovnic vyjadřujících hodnotu každé endogenní proměnné jako funkci hodnot jiných proměnných v a [7] .
Aristoteles definoval taxonomii příčinných souvislostí , včetně materiálních, formálních, účinných a konečných příčin. Hume odmítl Aristotelův přístup ve prospěch kontrafaktuálního myšlení. V jednom bodě popřel, že by předměty měly „síly“, které z jednoho činí příčinu az druhého následek. Později však přijal výrok: „kdyby první předmět neexistoval, druhý by nikdy neexistoval“ (nezbytná podmínka kauzality) [8] .
Koncem 19. století se statistika začala formovat jako vědní disciplína. Po letech úsilí o identifikaci kauzálních pravidel pro oblasti, jako je biologická dědičnost , zavedl Galton koncept regrese k průměru (pozorování syndromu druhého ročníku ve sportu), což ho později přivedlo k nekauzálnímu konceptu korelace .
Karl Pearson , být pozitivista , vyloučil koncept kauzality z většiny vědy jako neprokazatelný speciální případ asociace a zavedl korelační koeficient jako metriku asociace. Napsal: „Síla jako příčina pohybu je přesně stejná jako u boha stromu jako příčina růstu“ a že kauzalita byla pouze „fetišem mezi nepochopitelnými záhadami moderní vědy“. Pearson založil společnost Biometrika a biometrickou laboratoř na University College London , která se stala světovou jedničkou ve statistickém výzkumu.
V roce 1908 Hardy a Weinberg vyřešili problém stability rysů a jejich řešení vedlo Galtona k opuštění kauzality a oživení mendelovské dědičnosti [9] .
V roce 1921 se analýza cesty stala teoretickým předchůdcem kauzálního modelování a kauzálních grafů. Tento přístup vyvinul ve snaze odhalit relativní vliv dědičnosti , vývoje a prostředí na vzory srsti morčat . Svá teoretická tvrzení podpořil tím, že ukázal, jak by taková analýza mohla vysvětlit vztah mezi porodní hmotností morčete, gestačním věkem a velikostí vrhu. Odpor zavedených statistiků k těmto myšlenkám vedl k tomu, že během následujících 40 let byly ignorovány (s výjimkou chovatelů zvířat ). Místo toho se vědci spoléhali na korelace, částečně díky Wrightovu kritiku Ronaldu Fisherovi [10] .
V roce 1923 představil Jerzy Neumann koncept potenciálního výsledku, ale jeho práce byla přeložena z polštiny do angličtiny až v roce 1990.
V roce 1958 David Cox varoval, že proměnná Z by měla být řízena pouze tehdy, pokud je extrémně nepravděpodobné, že by byla ovlivněna nezávislými proměnnými. V 60. letech 20. století Duncan , Blalock a Goldberger znovu objevili analýzu cest.
Sociologové původně označovali kauzální modely jako modelování strukturálních rovnic ale jakmile se staly mechanickou metodou, ztratily svou užitečnost, což vedlo některé praktiky k odmítnutí jakékoli souvislosti s příčinnou souvislostí. Ekonomové přijali algebraickou část analýzy cesty a nazvali ji simultánní modelování rovnic. Stále se však vyhýbali tomu, aby svým rovnicím připisovali kauzální význam.
Šedesát let po svém prvním článku Wright publikoval článek, ve kterém shrnul první, po kritice Carlina a dalších, kteří namítali, že se zabývá pouze lineárními vztahy a že robustní reprezentace dat bez modelů jsou více odhalující.
V roce 1973 David Lewis obhajoval nahrazení korelace kauzalitou (kontrafaktuály). Odkazoval na schopnost lidí představit si alternativní světy, ve kterých se příčina vyskytuje nebo ne, a ve kterých se účinek objevuje až po její příčině. V roce 1974 Rubin zavedl koncept „potenciálních výsledků“ jako jazyk pro kladení kauzálních otázek.
V roce 1983 Nancy Cartwright navrhla, že jakýkoli faktor, který je "příčinně spjatý" s nějakým účinkem, by měl být podmíněn, přesahující pouhou pravděpodobnost jako jediné vodítko.
V roce 1986 Baron a Kenny představili principy detekce a hodnocení mediace v systému lineárních rovnic [11] . Od roku 2014 byl jejich článek 33. nejcitovanější všech dob. Ve stejném roce zavedli Grónsko a Robins přístup „zastupitelnosti“, aby se vypořádali s matoucími faktory zvážením srovnávacích skutečností. Navrhli vyhodnotit, co by se stalo se skupinou pacientů, kdyby nedostali léčbu, a porovnat tento výsledek s výsledkem kontrolní skupiny . Pokud se výsledky shodují, pak k žádnému zapletení nedochází [9] .
V současné době provádí laboratoř umělé inteligence Kolumbijské univerzity výzkum aplikace teorie kauzálního modelování na umělé neuronové sítě [12] .
Pearlův kauzální metamodel zahrnuje tříúrovňovou abstrakci, kterou nazývá žebřík kauzality. Nejnižší úroveň, asociativní (vidět/pozorovat), zahrnuje vnímání vzorů nebo vzorů ve vstupních datech, vyjádřených jako korelace. Střední úroveň, intervence, předpovídá důsledky úmyslného jednání, vyjádřené jako příčinné vztahy. Nejvyšší úroveň, kontrafaktuální, zahrnuje konstrukci teorie, která vysvětluje, proč mají konkrétní akce specifické účinky a co se stane, když takové akce neexistují [9] .
Jeden objekt je spojen s druhým, pokud pozorování jednoho změní pravděpodobnost pozorování druhého. Příklad: Zákazníci, kteří si kupují zubní pastu, si s větší pravděpodobností koupí také dentální nit . Asociace lze také měřit výpočtem korelace dvou událostí. Asociace nemají žádný kauzální význam. Jedna událost může způsobit druhou, opak může být pravdou nebo obě události mohou být způsobeny nějakou třetí událostí.
Tato úroveň prosazuje určité kauzální vztahy mezi událostmi. Kauzalita se posuzuje experimentálním provedením nějaké akce, která ovlivňuje jednu z událostí. Příklad: Pokud bychom zdvojnásobili cenu zubní pasty, jaká by byla pravděpodobnost nového nákupu? Zkoumáním historie cenových změn nelze stanovit příčinnou souvislost, protože změna ceny mohla být způsobena nějakou jinou příčinou, která sama mohla ovlivnit druhou událost (tarif, který zvyšuje cenu obou statků) [13] .
Nejvyšší úroveň, kontrafaktuální, zahrnuje zvážení alternativní verze minulé události nebo toho, co se mohlo stát za různých okolností pro stejné experimentální nastavení. Jaká je například pravděpodobnost, že kdyby obchod zdvojnásobil cenu zubní nitě, zákazník zubní pasty by si ji přesto koupil?
Kontrafaktuály mohou naznačovat existenci kauzálního vztahu. Modely, které zahrnují kontrafaktuální skutečnosti, umožňují přesné zásahy, jejichž důsledky lze předvídat. V extrémním případě jsou takové modely přijímány jako fyzikální zákony, například zákon setrvačnosti říká, že pokud na nehybný objekt nepůsobí síla, nepohne se [9] .
Statistika se točí kolem analýzy vztahů mezi více proměnnými. Tradičně jsou tyto vztahy popisovány jako korelace , asociace bez jakékoli implikované kauzality . Kauzální modely se pokoušejí rozšířit tento rámec přidáním konceptu kauzality, ve kterém změny jedné proměnné způsobují změny v jiných [7] .
Definice kauzality ve dvacátém století byly založeny pouze na pravděpodobností/asociacích. Bylo řečeno, že jedna událost (X) způsobuje další, pokud zvyšuje pravděpodobnost další (Y). Matematicky je to vyjádřeno jako
Takové definice jsou nedostatečné, protože jiné vztahy (například společná příčina pro X a Y) mohou podmínku splňovat. Kauzalita má co do činění s druhou příčkou žebříčku. Asociace jsou v první fázi a poskytují důkazy pouze pro druhou fázi. Pozdější definice se pokusila vyřešit tuto nejednoznačnost tím, že byla podmíněna faktory pozadí. Matematicky je to vyjádřeno jako
kde K je množina proměnných pozadí a k jsou hodnoty těchto proměnných v určitém kontextu. Požadovaný soubor proměnných pozadí však není definován, pokud je jediným kritériem pravděpodobnost, protože pravděpodobnost může zvýšit více souborů.
Mezi další pokusy určit kauzalitu patří Grangerova kauzalita , statistický test hypotézy, že kauzalitu v ekonomii lze hodnotit měřením schopnosti předpovídat budoucí hodnoty jedné časové řady pomocí předchozích hodnot jiné časové řady.
Příčina může být nezbytná, dostatečná, napomáhající nebo může mít několik z těchto vlastností [14] .
NutnostAby událost x byla nezbytnou příčinou y, přítomnost y musí implikovat předchozí výskyt x. Přítomnost x však neznamená, že nastane y. To znamená, že y by se nestalo, kdyby nenastalo x.
Dostatečné důvodyAby událost x byla dostatečnou příčinou y, musí přítomnost x implikovat následný výskyt y. Jiná příčina z však může nezávisle způsobit y. Přítomnost y tedy nevyžaduje předchozí výskyt x [15] .
Přidružené příčinyAby x bylo průvodní příčinou y, přítomnost x musí zvýšit pravděpodobnost y. Pokud je pravděpodobnost 100 %, pak se říká, že místo toho stačí x. Může být také nutná současná příčina [16] .
Kauzální diagram je orientovaný graf , který zobrazuje kauzální vztahy mezi proměnnými v kauzálním modelu. Zahrnuje sadu proměnných (nebo uzlů ). Každý uzel je spojen šipkou s jedním nebo více dalšími uzly, na které má kauzální účinek. Šipka definuje směr kauzality , například šipka spojující proměnné A a B se šipkou v bodě B ukazuje, že změna v A způsobí změnu v B (s vhodnou pravděpodobností). Cesta je procházení grafu mezi dvěma uzly podle kauzálních šipek.
Kauzální diagramy zahrnují cyklické diagramy , řízené acyklické grafy a Ishikawovy diagramy [9] .
Kauzální diagramy nezávisí na kvantitativních pravděpodobností. Změny těchto pravděpodobností (např. v důsledku technologických vylepšení) nevyžadují změny modelu.
Kauzální modely mají formální struktury s prvky se specifickými vlastnostmi.
Vzory připojeníExistují 3 typy připojení tří uzlů - lineární obvody, vidlice a urychlovače .
ŘetězyŘetězce jsou přímé komunikační linie se šipkami směřujícími od příčiny k následku. V tomto modelu je B prostředníkem v tom smyslu, že zprostředkovává dopad, který by měl A na C.
Vidlice
Ve vidlicích má jedna příčina mnoho důsledků. Mezi A a C existuje nekauzální, falešná korelace , kterou lze eliminovat podmíněním na B pro konkrétní hodnotu B.
Vývoj vidlice vypadá takto:
V takových modelech je B společnou příčinou A a C (což také způsobuje A), takže B je prostředníkem.
ColliderU colliderů ovlivňuje stejný výsledek více příčin. Kondicionování pro konkrétní hodnotu B často odhalí nekauzální negativní korelaci mezi A a C. Tato negativní korelace se nazývá collider fallacy : B vysvětluje korelaci mezi A a C. Korelace může být pozitivní, když jsou příspěvky obou A a C potřebné k ovlivnění B:
Zástupná proměnná mění vliv jiných příčin na výsledek (na rozdíl od pouhého ovlivňování výsledku). Například ve výše uvedeném příkladu je obvod B prostředníkem, protože mění vliv A (nepřímá příčina C) na C (výsledek).
Zavádějící proměnnáMatoucí proměnná ( matoucí ) ovlivňuje více výsledků tím, že mezi nimi vytváří pozitivní korelaci.
Proměnná nástrojeProměnná nástroje:
Regresní koeficienty mohou měřit kauzální účinek instrumentální proměnné na výsledek, pokud tento účinek není zapleten.[ specifikovat ] . Instrumentální proměnné tedy umožňují kvantifikaci kauzálních faktorů bez údajů o matoucích proměnných.
Například v modelu:
kde Z je instrumentální proměnná, protože má cestu k výsledku Y a nemá základ, například pro U.
Přesnost modelu můžete zlepšit úpravou další proměnné tak, aby blokovala cesty mezi nástrojem a matoucím zařízením, a kombinací více proměnných do jednoho nástroje.
Podmínky nezávislosti jsou pravidla pro rozhodování, zda jsou dvě proměnné na sobě nezávislé. Proměnné jsou nezávislé, pokud hodnoty jedné přímo neovlivňují hodnoty druhé. Několik kauzálních modelů může sdílet podmínky nezávislosti. Například modelky
a
mají stejné podmínky nezávislosti, protože podmíněnost na B ponechává A a C nezávislé. Tyto dva modely však nemají stejnou hodnotu a mohou být na základě dat zfalšovány (tj. pokud pozorovací data ukazují vztah mezi A a C po podmínění na B, pak jsou oba modely špatné). Data naopak nemohou ukázat, který z těchto dvou modelů je správný, protože mají stejné podmínky nezávislosti. Podmiňování proměnné je mechanismus pro provádění hypotetických experimentů. Podmiňování proměnné zahrnuje zkoumání hodnot jiných proměnných pro danou hodnotu podmíněné proměnné. V prvním příkladu podmínění na B znamená, že pozorování pro danou hodnotu B by neměla vykazovat žádný vztah mezi A a C. Pokud takový vztah existuje, pak je model špatný. Nekauzální modely nemohou dělat takové rozdíly, protože nevytvářejí kauzální tvrzení.
Důležitým prvkem korelačního výzkumu je identifikovat potenciálně konfliktní vlivy na zkoumanou proměnnou, jako je demografie . Správný seznam matoucích proměnných však nelze předem určit. Je tedy možné, že studie může kontrolovat irelevantní proměnné nebo dokonce (nepřímo) zkoumanou proměnnou.
Kauzální modely nabízejí spolehlivou metodu pro identifikaci relevantních matoucích proměnných. Formálně je Z matoucí, pokud je Y spojeno se Z cestami, které neprocházejí přes X. Ty lze často určit pomocí dat shromážděných pro jiné studie.
Aby bylo možné analyzovat kauzální vliv X na Y v kauzálním modelu, musí být upraveny všechny zmatené proměnné.