Kauzální model

Kauzální model , kauzální model je konceptuální model , který popisuje kauzální mechanismy systému. Kauzální modely mohou zlepšit kvalitu výzkumu poskytnutím jasných pravidel pro zahrnutí nezávislých proměnných do analýzy [2] . Mohou umožnit, aby některé otázky byly zodpovězeny na základě existujících pozorovacích dat bez potřeby intervenční studie, jako je randomizovaná kontrolovaná studie . Některé intervenční studie nejsou vhodné z etických nebo praktických důvodů, to znamená, že bez kauzálního modelu nelze některé hypotézy testovat [3] .

Kauzální modely mohou pomoci vyřešit otázku externí validity (zda se výsledky jedné studie vztahují na neprozkoumané skupiny). Kauzální modely mohou umožnit kombinaci dat z více studií k zodpovězení otázek, na které nemůže odpovědět žádný soubor dat. Kauzální modely jsou falzifikovatelné , a pokud neodpovídají datům, musí být odmítnuty jako neplatné. Měly by být srozumitelné i těm, kterým jsou blízké jevy, které hodlá model vysvětlit [4] .

Kauzální modely mají aplikace ve zpracování signálů , epidemiologii a strojovém učení . Podle Judah Pearl , vyjádřené v The Book of Why , 2018, jsou kauzální modely nezbytným prvkem ve vývoji silné umělé inteligence [5] .

Definice

Kauzální modely jsou matematické modely, které představují kauzální vztahy v rámci určitého systému nebo skupiny. Usnadňují vyvozování kauzálních vztahů ze statistických dat. Mohou nám hodně říci o epistemologii kauzality a vztahu mezi kauzalitou a pravděpodobností . Oni také byli aplikováni na témata zájmu k filozofům, takový jako teorie rozhodování a analýza faktické kauzality [6] .

Judah Pearl definuje kauzální model jako uspořádaný triple , kde je soubor exogenních proměnných, jejichž hodnoty jsou určeny faktory mimo model; — soubor endogenních proměnných, jejichž hodnoty jsou určeny faktory v rámci modelu; a je souborem strukturních rovnic vyjadřujících hodnotu každé endogenní proměnné jako funkci hodnot jiných proměnných v a [7] . $\langle U,V,E\rangle$ $U$ $PROTI$ $E$ $U$ $PROTI$

Historie

Aristoteles definoval taxonomii příčinných souvislostí , včetně materiálních, formálních, účinných a konečných příčin. Hume odmítl Aristotelův přístup ve prospěch kontrafaktuálního myšlení. V jednom bodě popřel, že by předměty měly „síly“, které z jednoho činí příčinu az druhého následek. Později však přijal výrok: „kdyby první předmět neexistoval, druhý by nikdy neexistoval“ (nezbytná podmínka kauzality) [8] .

Koncem 19. století se statistika začala formovat jako vědní disciplína. Po letech úsilí o identifikaci kauzálních pravidel pro oblasti, jako je biologická dědičnost , zavedl Galton koncept regrese k průměru (pozorování syndromu druhého ročníku ve sportu), což ho později přivedlo k nekauzálnímu konceptu korelace .

Karl Pearson , být pozitivista , vyloučil koncept kauzality z většiny vědy jako neprokazatelný speciální případ asociace a zavedl korelační koeficient jako metriku asociace. Napsal: „Síla jako příčina pohybu je přesně stejná jako u boha stromu jako příčina růstu“ a že kauzalita byla pouze „fetišem mezi nepochopitelnými záhadami moderní vědy“. Pearson založil společnost Biometrika a biometrickou laboratoř na University College London , která se stala světovou jedničkou ve statistickém výzkumu.

V roce 1908 Hardy a Weinberg vyřešili problém stability rysů a jejich řešení vedlo Galtona k opuštění kauzality a oživení mendelovské dědičnosti [9] .

V roce 1921 se analýza cesty stala teoretickým předchůdcem kauzálního modelování a kauzálních grafů. Tento přístup vyvinul ve snaze odhalit relativní vliv dědičnosti , vývoje a prostředí na vzory srsti morčat . Svá teoretická tvrzení podpořil tím, že ukázal, jak by taková analýza mohla vysvětlit vztah mezi porodní hmotností morčete, gestačním věkem a velikostí vrhu. Odpor zavedených statistiků k těmto myšlenkám vedl k tomu, že během následujících 40 let byly ignorovány (s výjimkou chovatelů zvířat ). Místo toho se vědci spoléhali na korelace, částečně díky Wrightovu kritiku Ronaldu Fisherovi [10] .

V roce 1923 představil Jerzy Neumann koncept potenciálního výsledku, ale jeho práce byla přeložena z polštiny do angličtiny až v roce 1990.

V roce 1958 David Cox varoval, že proměnná Z by měla být řízena pouze tehdy, pokud je extrémně nepravděpodobné, že by byla ovlivněna nezávislými proměnnými. V 60. letech 20. století Duncan , Blalock a Goldberger znovu objevili analýzu cest.

Sociologové původně označovali kauzální modely jako modelování strukturálních rovnic ale jakmile se staly mechanickou metodou, ztratily svou užitečnost, což vedlo některé praktiky k odmítnutí jakékoli souvislosti s příčinnou souvislostí. Ekonomové přijali algebraickou část analýzy cesty a nazvali ji simultánní modelování rovnic. Stále se však vyhýbali tomu, aby svým rovnicím připisovali kauzální význam.

Šedesát let po svém prvním článku Wright publikoval článek, ve kterém shrnul první, po kritice Carlina a dalších, kteří namítali, že se zabývá pouze lineárními vztahy a že robustní reprezentace dat bez modelů jsou více odhalující.

V roce 1973 David Lewis obhajoval nahrazení korelace kauzalitou (kontrafaktuály). Odkazoval na schopnost lidí představit si alternativní světy, ve kterých se příčina vyskytuje nebo ne, a ve kterých se účinek objevuje až po její příčině. V roce 1974 Rubin zavedl koncept „potenciálních výsledků“ jako jazyk pro kladení kauzálních otázek.

V roce 1983 Nancy Cartwright navrhla, že jakýkoli faktor, který je "příčinně spjatý" s nějakým účinkem, by měl být podmíněn, přesahující pouhou pravděpodobnost jako jediné vodítko.

V roce 1986 Baron a Kenny představili principy detekce a hodnocení mediace v systému lineárních rovnic [11] . Od roku 2014 byl jejich článek 33. nejcitovanější všech dob. Ve stejném roce zavedli Grónsko a Robins přístup „zastupitelnosti“, aby se vypořádali s matoucími faktory zvážením srovnávacích skutečností. Navrhli vyhodnotit, co by se stalo se skupinou pacientů, kdyby nedostali léčbu, a porovnat tento výsledek s výsledkem kontrolní skupiny . Pokud se výsledky shodují, pak k žádnému zapletení nedochází [9] .

V současné době provádí laboratoř umělé inteligence Kolumbijské univerzity výzkum aplikace teorie kauzálního modelování na umělé neuronové sítě [12] .

Žebříček kauzality

Pearlův kauzální metamodel zahrnuje tříúrovňovou abstrakci, kterou nazývá žebřík kauzality. Nejnižší úroveň, asociativní (vidět/pozorovat), zahrnuje vnímání vzorů nebo vzorů ve vstupních datech, vyjádřených jako korelace. Střední úroveň, intervence, předpovídá důsledky úmyslného jednání, vyjádřené jako příčinné vztahy. Nejvyšší úroveň, kontrafaktuální, zahrnuje konstrukci teorie, která vysvětluje, proč mají konkrétní akce specifické účinky a co se stane, když takové akce neexistují [9] .

Sdružení

Jeden objekt je spojen s druhým, pokud pozorování jednoho změní pravděpodobnost pozorování druhého. Příklad: Zákazníci, kteří si kupují zubní pastu, si s větší pravděpodobností koupí také dentální nit . Asociace lze také měřit výpočtem korelace dvou událostí. Asociace nemají žádný kauzální význam. Jedna událost může způsobit druhou, opak může být pravdou nebo obě události mohou být způsobeny nějakou třetí událostí.

Rušení

Tato úroveň prosazuje určité kauzální vztahy mezi událostmi. Kauzalita se posuzuje experimentálním provedením nějaké akce, která ovlivňuje jednu z událostí. Příklad: Pokud bychom zdvojnásobili cenu zubní pasty, jaká by byla pravděpodobnost nového nákupu? Zkoumáním historie cenových změn nelze stanovit příčinnou souvislost, protože změna ceny mohla být způsobena nějakou jinou příčinou, která sama mohla ovlivnit druhou událost (tarif, který zvyšuje cenu obou statků) [13] .

Kontrafaktuální

Nejvyšší úroveň, kontrafaktuální, zahrnuje zvážení alternativní verze minulé události nebo toho, co se mohlo stát za různých okolností pro stejné experimentální nastavení. Jaká je například pravděpodobnost, že kdyby obchod zdvojnásobil cenu zubní nitě, zákazník zubní pasty by si ji přesto koupil?

Kontrafaktuály mohou naznačovat existenci kauzálního vztahu. Modely, které zahrnují kontrafaktuální skutečnosti, umožňují přesné zásahy, jejichž důsledky lze předvídat. V extrémním případě jsou takové modely přijímány jako fyzikální zákony, například zákon setrvačnosti říká, že pokud na nehybný objekt nepůsobí síla, nepohne se [9] .

Kauzalita

Kauzalita versus korelace

Statistika se točí kolem analýzy vztahů mezi více proměnnými. Tradičně jsou tyto vztahy popisovány jako korelace , asociace bez jakékoli implikované kauzality . Kauzální modely se pokoušejí rozšířit tento rámec přidáním konceptu kauzality, ve kterém změny jedné proměnné způsobují změny v jiných [7] .

Definice kauzality ve dvacátém století byly založeny pouze na pravděpodobností/asociacích. Bylo řečeno, že jedna událost (X) způsobuje další, pokud zvyšuje pravděpodobnost další (Y). Matematicky je to vyjádřeno jako

$P(Y|X)>P(Y)$

Takové definice jsou nedostatečné, protože jiné vztahy (například společná příčina pro X a Y) mohou podmínku splňovat. Kauzalita má co do činění s druhou příčkou žebříčku. Asociace jsou v první fázi a poskytují důkazy pouze pro druhou fázi. Pozdější definice se pokusila vyřešit tuto nejednoznačnost tím, že byla podmíněna faktory pozadí. Matematicky je to vyjádřeno jako

$P(Y|X,K=k)>P(Y|K=k),$

kde K je množina proměnných pozadí a k jsou hodnoty těchto proměnných v určitém kontextu. Požadovaný soubor proměnných pozadí však není definován, pokud je jediným kritériem pravděpodobnost, protože pravděpodobnost může zvýšit více souborů.

Mezi další pokusy určit kauzalitu patří Grangerova kauzalita , statistický test hypotézy, že kauzalitu v ekonomii lze hodnotit měřením schopnosti předpovídat budoucí hodnoty jedné časové řady pomocí předchozích hodnot jiné časové řady.

Typy

Příčina může být nezbytná, dostatečná, napomáhající nebo může mít několik z těchto vlastností [14] .

Nutnost

Aby událost x byla nezbytnou příčinou y, přítomnost y musí implikovat předchozí výskyt x. Přítomnost x však neznamená, že nastane y. To znamená, že y by se nestalo, kdyby nenastalo x.

Dostatečné důvody

Aby událost x byla dostatečnou příčinou y, musí přítomnost x implikovat následný výskyt y. Jiná příčina z však může nezávisle způsobit y. Přítomnost y tedy nevyžaduje předchozí výskyt x [15] .

Přidružené příčiny

Aby x bylo průvodní příčinou y, přítomnost x musí zvýšit pravděpodobnost y. Pokud je pravděpodobnost 100 %, pak se říká, že místo toho stačí x. Může být také nutná současná příčina [16] .

Model

Kauzální diagram

Kauzální diagram je orientovaný graf , který zobrazuje kauzální vztahy mezi proměnnými v kauzálním modelu. Zahrnuje sadu proměnných (nebo uzlů ). Každý uzel je spojen šipkou s jedním nebo více dalšími uzly, na které má kauzální účinek. Šipka definuje směr kauzality , například šipka spojující proměnné A a B se šipkou v bodě B ukazuje, že změna v A způsobí změnu v B (s vhodnou pravděpodobností). Cesta je procházení grafu mezi dvěma uzly podle kauzálních šipek.

Kauzální diagramy zahrnují cyklické diagramy , řízené acyklické grafy a Ishikawovy diagramy [9] .

Kauzální diagramy nezávisí na kvantitativních pravděpodobností. Změny těchto pravděpodobností (např. v důsledku technologických vylepšení) nevyžadují změny modelu.

Prvky modelu

Kauzální modely mají formální struktury s prvky se specifickými vlastnostmi.

Vzory připojení

Existují 3 typy připojení tří uzlů - lineární obvody, vidlice a urychlovače .

Řetězy

Řetězce jsou přímé komunikační linie se šipkami směřujícími od příčiny k následku. V tomto modelu je B prostředníkem v tom smyslu, že zprostředkovává dopad, který by měl A na C.

$A\rightarrow B\rightarrow C$

Vidlice

Ve vidlicích má jedna příčina mnoho důsledků. Mezi A a C existuje nekauzální, falešná korelace , kterou lze eliminovat podmíněním na B pro konkrétní hodnotu B.

$A\leftarrow B\rightarrow C$

Vývoj vidlice vypadá takto:

$A\leftarrow B\rightarrow C\rightarrow A$

V takových modelech je B společnou příčinou A a C (což také způsobuje A), takže B je prostředníkem.

Collider

U colliderů ovlivňuje stejný výsledek více příčin. Kondicionování pro konkrétní hodnotu B často odhalí nekauzální negativní korelaci mezi A a C. Tato negativní korelace se nazývá collider fallacy : B vysvětluje korelaci mezi A a C. Korelace může být pozitivní, když jsou příspěvky obou A a C potřebné k ovlivnění B:

$A\rightarrow B\leftarrow C$

Typy uzlů

Mediátor

Zástupná proměnná mění vliv jiných příčin na výsledek (na rozdíl od pouhého ovlivňování výsledku). Například ve výše uvedeném příkladu je obvod B prostředníkem, protože mění vliv A (nepřímá příčina C) na C (výsledek).

Zavádějící proměnná

Matoucí proměnná ( matoucí ) ovlivňuje více výsledků tím, že mezi nimi vytváří pozitivní korelaci.

Proměnná nástroje

Proměnná nástroje:

má cestu k výsledku
nemá jinou cestu ke kauzálním proměnným
nemá přímý vliv na výsledek

Regresní koeficienty mohou měřit kauzální účinek instrumentální proměnné na výsledek, pokud tento účinek není zapleten.[ specifikovat ] . Instrumentální proměnné tedy umožňují kvantifikaci kauzálních faktorů bez údajů o matoucích proměnných.

Například v modelu:

$Z\rightarrow X\rightarrow Y\leftarrow U\rightarrow X,$

kde Z je instrumentální proměnná, protože má cestu k výsledku Y a nemá základ, například pro U.

Přesnost modelu můžete zlepšit úpravou další proměnné tak, aby blokovala cesty mezi nástrojem a matoucím zařízením, a kombinací více proměnných do jednoho nástroje.

Asociace

Podmínky nezávislosti

Podmínky nezávislosti jsou pravidla pro rozhodování, zda jsou dvě proměnné na sobě nezávislé. Proměnné jsou nezávislé, pokud hodnoty jedné přímo neovlivňují hodnoty druhé. Několik kauzálních modelů může sdílet podmínky nezávislosti. Například modelky

$A\rightarrow B\rightarrow C$ a $A\leftarrow B\rightarrow C$

mají stejné podmínky nezávislosti, protože podmíněnost na B ponechává A a C nezávislé. Tyto dva modely však nemají stejnou hodnotu a mohou být na základě dat zfalšovány (tj. pokud pozorovací data ukazují vztah mezi A a C po podmínění na B, pak jsou oba modely špatné). Data naopak nemohou ukázat, který z těchto dvou modelů je správný, protože mají stejné podmínky nezávislosti. Podmiňování proměnné je mechanismus pro provádění hypotetických experimentů. Podmiňování proměnné zahrnuje zkoumání hodnot jiných proměnných pro danou hodnotu podmíněné proměnné. V prvním příkladu podmínění na B znamená, že pozorování pro danou hodnotu B by neměla vykazovat žádný vztah mezi A a C. Pokud takový vztah existuje, pak je model špatný. Nekauzální modely nemohou dělat takové rozdíly, protože nevytvářejí kauzální tvrzení.

Confounder a deconfounder

Důležitým prvkem korelačního výzkumu je identifikovat potenciálně konfliktní vlivy na zkoumanou proměnnou, jako je demografie . Správný seznam matoucích proměnných však nelze předem určit. Je tedy možné, že studie může kontrolovat irelevantní proměnné nebo dokonce (nepřímo) zkoumanou proměnnou.

Kauzální modely nabízejí spolehlivou metodu pro identifikaci relevantních matoucích proměnných. Formálně je Z matoucí, pokud je Y spojeno se Z cestami, které neprocházejí přes X. Ty lze často určit pomocí dat shromážděných pro jiné studie.

Nastavení zadních vrátek

Aby bylo možné analyzovat kauzální vliv X na Y v kauzálním modelu, musí být upraveny všechny zmatené proměnné.

Poznámky

↑ Karl Friston (únor 2009). „Kauzální modelování a konektivita mozku ve funkčním zobrazování magnetickou rezonancí“ . Biologie PLOS . 7 (2): e1000033. doi : 10.1371/journal.pbio.1000033 . PMC2642881 . _ PMID 19226186 .
↑ KAUZÁLNÍ (PŘÍČINA A NÁSLEDEK) MODELOVÁNÍ. Kauzální modelování je dnes nejdůmyslnější a matematicky nejsložitější kvantitativní předpovědní metoda . www.bibliotekar.ru _ Získáno 9. března 2021. Archivováno z originálu dne 26. července 2020. (neurčitý)
↑ Kauzální modely v regresní analýze . Studme . Získáno 9. března 2021. Archivováno z originálu dne 25. února 2017. (neurčitý)
↑ Barlas, Yaman; Carpenter, Stanley (1990). „ Filozofické kořeny validace modelu: Dvě paradigmata “. Revize systémové dynamiky . 6 (2): 148-166. doi:10.1002/sdr.4260060203.
↑ Pearl J., Mackenzie D. (2018) Kniha proč. Nová věda o příčině a následku. NY: Základní knihy. S. 362–363.
↑ Christopher Hitchcock. Kauzální modely . — 2018-08-07. Archivováno z originálu 21. července 2020.
↑ 1 2 Judea Pearl. Úvod do kauzální inference // The International Journal of Biostatistics. — 26. 2. 2010. - T. 6 , ne. 2 . — ISSN 1557-4679 . - doi : 10.2202/1557-4679.1203 . Archivováno z originálu 1. února 2021.
↑ Karpenko Alexandr Stěpanovič. Kontrafaktové myšlení // Logický výzkum. - 2017. - T. 23 , no. 2 . — ISSN 2074-1472 .
↑ 1 2 3 4 5 Pearl, Judea ; Mackenzie, Dana (2018-05-15). The Book of Why: The New Science of Cause and Effect Archived 13. června 2021 na Wayback Machine . Základní knihy. ISBN9780465097616.
↑ Okasha, Samir (2012-01-12). „ Příčinnost v biologii archivována 11. dubna 2019 na Wayback Machine “. V Beebee, Helena; Hitchcock, Christopher; Menzies, Peter (eds.). Oxfordská příručka kauzality . 1 . OU Oxford. doi:10.1093/oxfordhb/9780199279739.001.0001 . ISBN9780191629464.
↑ Metoda barona a Kennyho pro mediaci . Řešení statistiky (30. srpna 2017). Získáno 9. března 2021. Archivováno z originálu dne 7. dubna 2021. (neurčitý)
↑ Co AI stále neumí . MIT Technology Review . Získáno 9. března 2021. Archivováno z originálu dne 11. března 2021.
↑ Pearl, Judea (29. října 2019). "Kauzální a kontrafaktuální závěr" Archivováno 20. září 2021 na Wayback Machine (PDF).
↑ Susanna S. Epp. Diskrétní matematika s aplikacemi . - Thomson-Brooks/Cole, 2004. - 936 s. — ISBN 978-0-534-49096-6 .
↑ Kauzální uvažování . Získáno 16. března 2021. Archivováno z originálu dne 24. února 2021. (neurčitý)
↑ Riegelman, R. (1979). " Přispívající příčina: Zbytečná a nedostatečná ". postgraduální medicína . 66 (2): 177-179.