• Non ci sono risultati.

Anàlisi causal: estudi de les relacions causa-efecte i aplicació a l’anàlisi de dades

N/A
N/A
Protected

Academic year: 2021

Condividi "Anàlisi causal: estudi de les relacions causa-efecte i aplicació a l’anàlisi de dades"

Copied!
60
0
0

Testo completo

(1)

DOBLE GRAU DE MATEM `

ATIQUES I

ENGINYERIA INFORM `

ATICA

Treball final de grau

AN `

ALISI CAUSAL

ESTUDI DE LES RELACIONS CAUSA-EFECTE

I APLICACI ´

O A L’AN `

ALISI DE DADES

Autor: Aleix R`

amia Rodr´ıguez

Director:

Dr. Jordi Vitri`

a Marca

Realitzat a: (Departament de Matem`

atiques i Inform`

atica)

(2)

Abstract

Causal inference is a branch of mathematical analysis that has been poorly studied until recently. The difficulties involved its research and the high number of personal decisions the researcher has to make in these types of studies have often moved it away from the statistical side, although much of the mathematical basis is shared. In this work, we review the formal definition of causality, analyze the problems involved in the lack of complete information from the two worlds we observe (with treatment and without), explain the theory that allows us to eliminate some of these problems and seek practical methodologies for causal study both of observational and non-observatory experiments. Finally, we have a practice with the analysis of the impact of adverse weather conditions (moderate and intense rainfall) on the use of bicycles in the city of Barcelona. We conclude that moderate rain reduces the use of the bicycle by 40% on average, although it varies depending on the month, with months when the impact is almost zero and others reaching 70%.

Resum

La infer`encia causal ´es una branca d’an`alisi matem`atica que fins recentment s’ha man-tingut poc estudiada. Les dificultats que en comporta la recerca i l’elevat nombre de de-cisions pr`opies que ha de prendre l’investigador en aquests tipus d’estudis l’han allunyat molts cops del vessant estad´ıstic, tot i compartir-hi gran part del fonament matem`atic. En aquest treball repassem la definici´o formal de causalitat, analitzem els problemes que comporta la manca d’informaci´o completa dels dos mons que observem (amb tractament i sense), expliquem la teoria que ens permet eliminar alguns d’aquests problemes i busquem metodologies pr`actiques per a l’estudi causal tant d’experiments observacionals com no observacionals. Finalment realitzem una pr`actica amb l’an`alisi de l’afectaci´o de les con-dicions meteorol`ogiques adverses (pluja moderada i intensa) en l’´us de la bicicleta a la ciutat de Barcelona. Arribem a la conclusi´o que una pluja moderada redueix l’´us de la bicicleta un 40% de mitjana, tot i que varia en funci´o del mes, havent-hi mesos en qu`e l’afectaci´o ´es gaireb´e nul·la i altres en qu`e arriba al 70%.

(3)

Agra¨ıments

La llista de gent que ha influ¨ıt a fer que hagi pogut desenvolupar aquest treball ocuparia probablement m´es que el treball en si. Sigui per`o aquesta petita nota un reconeixement m´es enll`a fins i tot de l’abast d’aquest document.

Al meu tutor, Jordi Vitri`a, per saber trobar d’entre la meva manca d’idees un te-ma fascinant i que se m’escau tant. Gr`acies per l’orientaci´o i per la guia concisa per`o incre¨ıblement necess`aria i efectiva.

A la Marina, pel suport, els riures i sempre la nota d’alegria durant la carrera. Al Xavi, per ser el fil que uneix (no casualment) els millors anys viscuts i posar sempre la racionalitat en els moments baixos i el punt de bogeria quan ´es necess`aria. Al Mart´ı, per la paci`encia inacabable, per creure en molts moments m´es en mi que jo mateix i per ser l’ajuda impagable sense la qual nom´es hi hagu´es hagut caos. No existeixen millors companys de viatge.

Als meus pares, per ser la base de tot all`o de qu`e avui puc estar orgull´os. Per transme-tre’m els valors b`asics per ser millor persona, la llibertat per encertar i per equivocar-me per mi sol, i per donar-me un amor del qual mai en podr´e estar prou agra¨ıt. Us estimo.

I de nou, quan considero la influ`encia d’aquesta conjunci´o constant, percebo que mai podria ser objecte de raonament una relaci´o tal, i que en cap cas podria operar sobre la ment sin´o per mitj`a del costum, que determina a la imaginaci´o a fer una transici´o de la idea d’un objecte a la del seu acompanyant habitual. - David Hume, Tractat sobre la naturalesa humana

(4)

´

Index

1 Introducci´o 1

1.1 Objectius . . . 2

2 El concepte de causalitat. Nocions b`asiques per a la infer`encia causal. 3 2.1 Notaci´o gr`afica . . . 4

2.1.1 Tipus de camins . . . 5

2.2 Xarxes bayesianes . . . 6

2.3 Equacions Estructurals . . . 8

2.4 El Model Causal Estructural . . . 9

3 Intervencions en Models Causals 11 3.1 Efecte Causal . . . 11

3.2 El problema fonamental de la infer`encia causal . . . 11

3.2.1 Efecte Causal Mitj`a . . . 12

3.3 Assumpcions causals . . . 13

3.3.1 Assumpci´o d’additivitat pel tractament individual . . . 13

3.3.2 Assumpci´o de consist`encia . . . 13

3.3.3 Assumpci´o d’ignorabilitat . . . 13

3.3.4 Assumpci´o de positivitat . . . 14

3.4 Identificabilitat . . . 14

3.4.1 L’efecte de les assumpcions causals . . . 15

3.5 La paradoxa de Simpson . . . 16

3.6 Control de variables de confusi´o . . . 18

3.6.1 Formes de condicionament . . . 18

3.6.2 Associacions a partir de camins . . . 19

3.6.3 Criteri de pas posterior . . . 21

3.7 Criteri de pas endavant . . . 23

4 M`etodes d’an`alisi causal 24 4.1 Les proves aleat`ories controlades (RCT) . . . 24

4.1.1 Els experiments naturals . . . 25

4.2 Marc d’estudi: models causals i resultats potencials . . . 25

4.2.1 Efecte individual del tractament . . . 26

4.2.2 Efecte mitj`a del tractament . . . 27

4.2.3 El problema de l’efecte mitj`a . . . 29

(5)

4.2.5 Comparativa amb l’an`alisi estructural . . . 31

4.3 Aparellament (matching) . . . 31

4.4 Etapes de l’aparellament . . . 32

4.4.1 Definici´o de proximitat . . . 33

4.4.2 Implementaci´o del m`etode d’aparellament . . . 35

4.4.3 Validaci´o de la qualitat de l’aparellament . . . 37

5 Cas pr`actic 39 5.1 Objecte d’estudi i motivaci´o . . . 39

5.2 Model causal . . . 39

5.3 Fonts de dades i extracci´o . . . 40

5.4 An`alisi de dades, assumpcions i identificaci´o . . . 41

5.5 An`alisi causal . . . 45

5.5.1 Estudi amb l’eina DoWhy . . . 47

6 Conclusions 51 7 Annex 1: variables a les taules de dades 54

´

Index de figures

1 Exemple de gr`afic causal . . . 5

2 Exemple de forca inversa i condicionament . . . 6

3 Exemple de xarxa bayesana amb cinc variables . . . 8

4 Graf d’un exemple basat en equacions estructurals . . . 9

5 Dos models causals per les mateixes dades . . . 18

6 Exemple de col·lisionador . . . 21

7 Exemples d’identificabilitat pel criteri de pas posterior . . . 22

8 Esquema de les principals t`ecniques d’aparellament . . . 32

9 Gr`afic de la difer`encia de mitjanes estandarditzades de 10 covariants abans i despr´es de l’aparellament. (Stuart, Green, 2008) . . . 38

10 Model causal del nostre estudi . . . 39

11 Camins posteriors al graf d’estudi . . . 41

12 Resum estad´ıstic de les nostres dades . . . 41

13 Distribuci´o de les dades entre bicis agafades i precipitaci´o . . . 42

14 Bicicletes agafades per hora de mitjana . . . 42

15 Diagrama de caixa de la retirada de bicicletes . . . 42

(6)

17 Intensitat de precipitaci´o hor`aria en funci´o del mes . . . 43

18 Gr`afic de dispersi´o entre la precipitaci´o i la nuvolositat del cel . . . 44

19 Mitjana de bicicletes en funci´o de la nuvolositat . . . 44

20 Histograma d’intensitat de pluja amb escala logar´ıtmica . . . 44

21 Histograma del n´umero de parelles per cada estaci´o . . . 45

22 N´umero de parelles per cada mes . . . 46

23 ATE absolut i percentual per mes . . . 46

24 ATE controlat per mesos de l’any . . . 47

´

Index de taules

1 Fila d’observaci´o en ITE . . . 26

(7)

1

Introducci´

o

Des de sempre l’´esser hum`a ha intentat explicar el seu entorn, sent aquesta cerca un dels principals causants de l’evoluci´o en el coneixement cient´ıfic que ha experimentat l’home. I d’entre les preguntes que ens formulem, una ´es clau en el nostre dia a dia: ’per qu`e?’. Quina ´es la causa d’un fet emp´ıric que veiem? En el fons, els humans tenim desenvolupada de forma innata la noci´o de l’estudi de les relacions causals. Entenem l’efecte que poden tenir part de les nostres accions o manipulacions sobre l’entorn i quin en ser`a el resultat. I fins i tot, m´es enll`a d’aix`o, podem arribar a formular hip`otesis sobre escenaris que no han passat, en cas que la nostra actuaci´o hagu´es estat diferent. Sabem de forma ’innata’, en general, que una de les causes de treure bona nota ´es haver estudiat m´es hores. I si treus un mal resultat, saps que ’si hagu´es estudiat m´es, hauria aprovat’.

Els humans establim relacions causals de forma natural, i aix`o influeix en el nostre judici constantment; sobretot perqu`e pocs cops hi hem reflexionat en profunditat.

2

Per exemple, not´ıcies d’aquest estil apareixen freq¨uentment als diaris. En aquest moment el nostre cervell assumeix una relaci´o causal ’consumir carn vermella em fa augmentar el risc de mort prematura. Per tant, he de deixar de menjar carn vermella’. Ara b´e, un estudi amb la conclusi´o d’aquest estil no ens vol dir aix`o. Com a m´ınim, no necess`ariament. Significa que en individus amb elevat consum de carn vermella s’ha vist tamb´e relacionat un major ´ındex de mort prematura. Ara b´e, ´es probable que hi hagi un factor extern, per exemple que tingui a veure amb les condicions f´ısiques d’una persona, que li facin augmentar les necessitats de carn vermella i alhora suposi un major risc de mort? Probablement aquesta soluci´o ´es m´es plausible que no considerar que si deixem de menjar carn vermella viurem m´es anys. En el fons, per`o, simplement ´es un dels petits ’errors’ als que anem quan el concepte de causalitat no el tenim parametritzat a la societat.

I ´es que el sentit intu¨ıtiu que tenim ´es complicat de traslladar a un pla acad`emic o d’experimentaci´o. I ´es part d’aquesta falta de metodologia i sobretot de vocabulari causal en l’`ambit acad`emic el que en provoca una manca en l’`ambit social o quotidi`a. De fet, la mateixa definici´o de causalitat ha estat sempre controvertida aix´ı com la seva aplicaci´o pr`actica. Una de definicions m´es conegudes en estudi formal que podem trobar la formula David Hume l’any 1739: [1]

Un objecte precedent i contigu a un altre, i on tots els objectes que s’assemblen als primers es col·loquen en relacions similars de preced`encia i contig¨uitat als objectes que s’assemblen als segons.

En general, per`o, Hume es frustra en la incapacitat de poder definir amb formalitat aquesta connexi´o. Dintre les possibles relacions entre les idees i objectes, la relaci´o causa-efecte ´es una de les m´es importants per`o alhora una de les m´es vagues. Nom´es es basa en l’experi`encia personal, en l’observaci´o de fets i en la juxtaposici´o continuada d’aquesta

2

(8)

relaci´o. Veure-la constantment i de forma repetitiva acaba formant de mica en mica en la nostra ment la relaci´o de causalitat.

En general aquesta aproximaci´o de car`acter filos`ofic, per`o, ja ens aporta llum sobre el perqu`e de les dificultats d’estudi del fenomen de la causalitat. Aquesta frustraci´o i incapacitat ´es tal que, fins i tot, des de la branca de l’estad´ıstica es veu la causalitat com un tema tab´u que s’intenta evitar donades les dificultats que en comporta afegir-hi un proc´es d’an`alisi rigor´os.

El projecte

L’´us habitual que fem en el nostre dia a dia de l’estudi de la causalitat de forma innata juntament amb la poca literatura acad`emica que s’estudia del fenomen ´es una de les principals motivacions d’aquest estudi. Aix`o s’afegeix a la contextualitzaci´o en un moment tecnol`ogic en qu`e l’explosi´o de l’era de les dades fa m´es necessari que mai aplicar a l’estudi una metodologia humana que podem traslladar a un sistema tecnol`ogic. Fins ara, per`o, els algoritmes i m`etodes d’an`alisi est`andards usats es basen en la cerca i utilitzaci´o de correlacions i prediccions basades en aquesta. Aquesta aproximaci´o, per`o, ´es nom´es un primer pas per poder dotar a les m`aquines d’una capacitat de ’raonament’ hum`a. Ens calen, per tant, eines que permetin estudiar les relacions de causalitat i aportar intel·lig`encia a les dades. En aquest treball busquem explorar sobre aquestes t`ecniques, la base te`orica que els fonamenta i veure el perqu`e de les limitacions actuals.

1.1 Objectius

• Definir formalment causalitat, relaci´o causal i model de causalitat. Relacionar un model causal amb un model o font d’informaci´o probabil´ıstica.

• Definir les assumpcions necess`aries per identificar els efectes causals en un conjunt de dades.

• Establir unes regles sobre quines variables del nostre model cal controlar en un estudi i com fer-ho.

• Poder donar eines per estudiar anal´ıticament una relaci´o causal

• Finalment, formular un estudi propi en qu`e es demostri una relaci´o causal.

Estructura de la Mem`oria

La mem`oria est`a estructura de la seg¨uent forma:

• Aproximaci´o inicial a la causalitat i conceptes b`asics sobre grafs, xarxes bayesianes i equacions estructurals.

• Tot seguit, ja passem a definir formalment un model causal, qu`e vol dir intervenci´o i el problema fonamental de la infer`encia causal. Introdu¨ım a m´es les assumpcions causals b`asiques.

• Introdu¨ım el concepte de variables de confusi´o i control sobre aquestes, amb els criteris de pas endavant i enrere.

(9)

• Obrim un rep`as sobre formes metodol`ogiques d’aplicar un estudi anal´ıtic causal. • Finalment, apliquem algunes d’aquestes t`ecniques a un cas pr`actic relacionat amb

l’´us de la bicicleta a Barcelona.

2

El concepte de causalitat. Nocions b`

asiques per a la

in-fer`

encia causal.

Comencem l’an`alisi amb una necess`aria concepci´o sobre qu`e ´es la causalitat per poder-ne discernir aquelles assumpcions que a voltes considerem impl´ıcites de forma err`onia.

Un dels principals problemes que tenim a la literatura i acad`emia estad´ıstica actual ´es una falta de llenguatge, tant oral com matem`atic, per expressar relacions causals. Per exemple, podr´ıem arribar a fer un estudi a partir del grau d’activitat de la poblaci´o juntament amb la proximitat a espai verd p´ublic. I ´es altament probable que ens sort´ıs una correlaci´o positiva i obtingu´essim una regressi´o explicant les dades del tipus

Y = β0+ β1X + 

amb Y l’exercici de la poblaci´o i X l’espai p´ublic de la ciutat. Ara b´e, aquest estudi en mans d’un t`ecnic (o pol´ıtic) pot dur-nos a pol´ıtiques p´ubliques err`onies malgrat tenir les dades i l’an`alisi fets. La igualtat en l’expressi´o i el concepte estad´ıstic en cap cas ens est`a dient informaci´o sobre la relaci´o causal entre variables.

Seguim amb la pregunta, per tant: la poblaci´o m´es activa t´e m´es tend`encia a mudar-se a espais m´es verds de forma pr`evia i aix`o crea la correlaci´o o ha estat l’afectaci´o p´ublica de m´es espai verd el que ha activat a la gent? Determinar aquest sentit de la causalitat entre X i Y ´es clau per a poder actuar correctament. Saber si una pol´ıtica de salut p´ublica positiva per un barri ´es dotar-lo de m´es espais verds o si per contra fent aix`o el que fem ´es gentrificar l’espai, fent-lo m´es atractiu per un conjunt de ciutadans ja actius pr`eviament que estan disposats a pagar m´es per viure all`a.

Per aix`o necessitem anar m´es enll`a dels models cl`assics i cercar tant una definici´o clara de causalitat com un model que ens permeti realitzar-ne un estudi de forma sistem`atica. Entenem la causalitat, segons el Diccionari de la Llengua Catalana [2] com una relaci´o de causa-efecte. Per tant, anant a l’arrel, causa:

All`o per qu`e una cosa ´es o s’esdev´e, antecedent necessari d’un efecte.

En canvi, si mirem de fer una comparativa amb la confusi´o habitual correlaci´o no ´es causalitat, la correlaci´o la definim com:

(1) Relaci´o rec´ıproca o m´utua entre dues o m´es coses. (2) En mat., grau d’in-terdepend`encia entre diverses variables o entre diferents conjunts de nombres. Si comparem ambdues definicions veiem que els processos de correlaci´o, estudiats ex-tensament des de la branca estad´ıstica, i els de causalitat, ens posen en relaci´o la de-pend`encia de dos fen`omens. Un tret caracter´ıstic, per`o, i que fonamenta tota la teoria de causalitat ´es el fenomen temporal necessari. Aix´ı com en una correlaci´o simplement ob-servem dos fen`omens transc´orrer de forma simult`ania i mirem d’establir una quantificaci´o

(10)

de la seva relaci´o, la causalitat ens aporta un punt afegit. La condici´o necess`aria a qu`e un dels fen`omens sigui antecedent de l’altre, fent que en sigui predecessor. En definitiva, si succeeix sovint, podr´ıem arribar a dir-ne el causant.

Evidentment aquesta relaci´o temporal tampoc ens marca una relaci´o causal, per`o s´ı que ens d´ona una primera condici´o necess`aria perqu`e dos fen`omens tinguin una relaci´o causal. Des del moment en qu`e la teoria de la probabilitat es va comen¸car a formular, durant els segles XVI i XVII per exemple amb la famosa taula d’edats de Halley (Ciecka, 2008)[3] en qu`e a partir de l’observaci´o del registre defuncions podia fer una predicci´o del nombre de supervivents en cada cohort d’edat de la gent nascuda un mateix any, es va voler comen¸car a establir una explicaci´o als fen`omens causals a partir de la probabilitat. S’intenta fer un inici d’explicaci´o de causalitat a partir de X augmenta la probabilitat de Y, ´es a dir, si P (Y | X) > P (Y ). El problema ´es que aquesta definici´o ens serveix ´

unicament per explicar que l’observaci´o de X augmenta la probabilitat de Y . Per`o no ens hi determina una relaci´o causal. Ens trobem amb una explicaci´o que nom´es ens justifica un primer pas de l’an`alisi causal.

Per tal d’estudiar correctament les relacions causals necessitem establir un model cau-sal. Un model causal ´es un objecte matem`atic que proveeix d’una interpretaci´o i com-putaci´o efectiva totes les preguntes causals que sorgeixin en el domini estudiat. (Galles i Pearl, 1998).[4] A tall de resum, per tant:

1. Infer`encia d’associaci´o. Respon a les preguntes descriptives cl`assiques.

(a) Resumeix la distribuci´o conjunta amb un model estad´ıstic (´es el que fem en un model de regressi´o)

(b) No ens d´ona informaci´o sobre les relacions causals, ´es a dir, els coeficients resultants informen de relaci´o en ambdues direccions.

2. Infer`encia causal. Amplia el rang de respostes tamb´e a preguntes causals. (a) Resumeix la distribuci´o conjunta en un model estad´ıstic.

(b) Afegeix assumpcions causals al model.

(c) Aporta una interpretaci´o causal (i per tant, direccional) dels coeficients. Per tal d’obtenir un model complet, per`o, necessitem tenir clares algunes nocions pr`evies i estructures necess`aries.

2.1 Notaci´o gr`afica

Com veurem m´es endavant els grafs seran l’objecte que ens permetr`a representar visual-ment els models causals aix´ı com proporcionar un marc amb qu`e treballar.

Definici´o 2.1. (Trudeau, 1993)[5]

Un graf ´es un objecte format per dos conjunts, un anomenat conjunt de v`ertexs (tamb´e anomenats nodes) i un altre conjunt d’arestes. El conjunt de v`ertexs ´es finit i no-buit. El conjunt d’arestes pot ser buit; en cas contrari, els seus elements s´on subconjunts de parelles de v`ertex.

Definici´o 2.2. Si {X, Y } ´es una aresta d’un graf, diem que {X, Y } connecta els v`ertexs X i Y . Si l’aresta t´e associada un ordre, ´es a dir X ´es el v`ertex inicial i Y el final, s’anomena aresta dirigida.

(11)

´

Es important entendre, tamb´e, la forma com connectem els diferents nodes (v`ertex) d’un graf:

Definici´o 2.3. (Gross i Yellen, 2003)[6]

Un cam´ı en un graf G ´es una seq¨u`encia alternada de v`ertexs i arestes W = v0, e1, v1, e1, . . . , en, vn

de manera que per j = 1, . . . , n els v`ertexs vj−1 i vj s´on els extrems de l’aresta ej. Si

l’aresta ej est`a dirigida de vj−1 a vj, diem que W ´es un cam´ı dirigit.

Definici´o 2.4. Un cam´ı s’anomena tancat si el v`ertex inicial ´es tamb´e el v`ertex final. En cas contrari, diem que ´es obert. La llargada del cam´ı la definim a partir del nombre d’arestes (comptant les repeticions).

Definici´o 2.5. Una ruta ´es un cam´ı en qu`e cap aresta apareix m´es d’un cop i cap v`ertex intern es repeteix.

Ser`a important tenir en compte que de cara a considerar una ruta no tenim en compte la direcci´o de les seves arestes.

Definici´o 2.6. Un cicle ´es una ruta tancada de llargada major o igual a 1.

Definici´o 2.7. Un Graf Ac´ıclic Dirigit (DAG per les sigles en angl`es) ´es un graf dirigit sense cicles. ´Es a dir, per cada v`ertex v no tenim un cam´ı que comenci i acabi en aquest v`ertex.

Definici´o 2.8. Un DAG en qu`e cada node t´e com a m`axim un pare s’anomena arbre. A continuaci´o comencem a introduir la intu¨ıci´o de l’´us dels DAG amb l’an`alisi causal. Representem cadascuna de les nostres variables amb un dels nodes i el v`ertex ´es l’efecte causal d’aquest node sobre aquell que t´e a continuaci´o.

2.1.1 Tipus de camins

Fixem-nos que tot DAG es pot construir a partir de la composici´o de nom´es tres tipus de camins dirigits. (Barrett, 2020)[7] Entendre’ls i identificar-los correctament ens per-metr`a despr´es veure qu`e passa amb la informaci´o causal en passar per cadascun d’aquests. Prenem de refer`encia l’exemple de la figura 1:

Educaci´o poc saludable

Fumador

Sobrep`es

Colesterol alt Atac card´ıac

Figura 1: Exemple de gr`afic causal

• Cadenes. Nodes consecutius en una mateixa l´ınia de transmissi´o de l’efecte causal. En la figura 1 tenim una cadena a ’Fumador 7→ Colesterol alt 7→ Atac card´ıac’. ´

(12)

colesterol alt i l’atac card´ıac. Per tant, en un cam´ı de cadena, la informaci´o es passa successivament d’un node al seg¨uent i per tant podr´ıem arribar a determinar una relaci´o causal entre Fumador i Atac card´ıac.

• Forques Node que fa de pare de dos nodes fills. En el cas de l’exemple, tenim que les variables ’Sobrep`es’ i ’Fumador’, que en aquest cas s´on causa ambdues del colesterol alt, alhora podem atribuir les dues variables com a resultat d’una educaci´o (en estil de vida) poc saludable. Per exemple, una mala educaci´o en h`abits alimentaris dels pares aix´ı com una normalitzaci´o del tabaquisme portarien a ambd´os factors de risc tenint una causa comuna. ´Es a dir, que en el nostre gr`afic, l’efecte causal de l’educaci´o poc saludable es diversifica i afecta ambdues variables.

• Forques invertides Una forca invertida ´es el proc´es invers de l’anterior: tenim dos nodes que alhora s´on causants d’un tercer. Tractarem aquest cas endavant amb m´es detall, ja que molts cops ´es precisament aquest cas mal estudiat una font important d’error en l’an`alisi de relacions entre variables. En l’exemple de la figura 1 tenim una forca invertida a ’ Sobrep`es 7→ Colesterol alt ←[ Fumador’.

Posant un altre exemple m´es il·lustratiu, a la figura 2 veiem a la part esquerra un gr`afic evident: la grip causa febre en el pacient. La varicel·la tamb´e causa febre. Per`o entre les dues malalties no hi tenim cap relaci´o, com ´es evident en la literatura m`edica, ja que s´on dues malalties totalment diferents. Podem con`eixer aquesta probabilitat de forma independent. En canvi, si control´essim nom´es per aquell subgrup que t´e febre, estar´ıem creant una relaci´o esp´uria entre grip i varicel·la, ja que a partir d’aquell moment les probabilitats ja no serien independents, sin´o que estarien condicionades l’una de l’altra: saber que estant en el subgrup amb febre no tinc grip em fa augmentar la probabilitat de la varicel·la. Aix`o com despr´es veurem t´e efectes negatius en la nostra an`alisi i per tant ´es una pr`actica que, generalment, evitarem fer.

Grip Varicel·la

Febre

Grip Varicel·la

Febre

Figura 2: Exemple de forca inversa i condicionament

Aquest punt el tractem amb m´es detall a l’apartat 3.6.2: Associacions entre camins.

2.2 Xarxes bayesianes

A partir dels DAG quan hi posem en relaci´o les funcions de densitat de probabilitat podem comen¸car a representar gr`aficament i anal´ıtica les variables aleat`ories d’estudi i la seva relaci´o. Les Xarxes Bayesianes constituiran models gr`afics de probabilitats que represen-ten les depend`encies entre variables aleat`ories. Computacionalment aquestes estructures es representen en forma de graf que es recorre actualitzant les probabilitats condicionades dels esdeveniments. (Kline, 2015)[8]

(13)

Sigui en tot moment G = (V, E) un Graf Ac´ıclic Dirigit amb V el conjunt de v`ertex, E el conjunt d’arestes i sigui X = (Xv)V un conjunt de variables aleat`ories. Sigui P una

distribuci´o definida en n variables X1, ..., Xn.

La regla del producte del c`alcul probabil´ıstic ens permet fer la descomposici´o d’aquesta probabilitat P a partir del condicionament:

P (x1, . . . , xn) =

Y

j

P (xj | x1, . . . , xj−1)

Ara b´e, si alguna de les variables no est`a condicionada per totes les altres sin´o per nom´es un subconjunt, podem establir una condici´o m´es forta:

Definici´o 2.9. (Medin et al, 1996)[9]

Sigui V = {X1, . . . , Xn} un conjunt ordenat de variables, i sigui Pv la distribuci´o

conjunta d’aquestes variables. Un conjunt de variables P Aj s’anomenen pares

Marko-vians de Xj si P Aj ´es un conjunt minimal de predecessors de Xj que fa Xj independent

de tots els seus altres predecessors. En altres paraules, P Aj ´es qualsevol subconjunt de

X1, . . . , Xj−1 que satisf`a

P (xj|paj) = P (xj|x1, . . . , xj−1) (2.1)

de manera que cap altre subconjunt de P Aj satisf`a l’equaci´o (2.1)

Aquesta assignaci´o de variables es pot representar mitjan¸cant un graf dirigit ac´ıclic. Anomenem aquest conjunt P Aj pares connotants.

Definici´o 2.10. (Compatibilitat de Markov)

X ´es una xarxa bayesiana compatible amb G si la seva funci´o de densitat de probabilitat conjunta es pot escriure com el producte de les funcions de densitat individuals a partir de la condici´o als seus pares, ´es a dir, si

p(x) = Y

v∈V

p(xv | xpa(v))

on pav representa el conjunt de pares markovians de xv

Posem-ne un exemple. Sigui donat el seg¨uent esquema de cinc variables:

La figura 3 representa una xarxa bayesiana t´ıpica. Ens relaciona la variable de l’estaci´o de l’any (X1) amb la variable de si plou (X3) o si l’aspersor d’un jard´ı est`a engegat (X2).

Aquestes dues ´ultimes variables condicionen de forma evident si el terra est`a mullat (X4) i

per tant si el terra rellisca (X5). Podem entendre totes les variables com a bin`aries menys

la variable d’estaci´o que pot prendre els 4 valors d’estaci´o de l’any. Aqu´ı podem veure molt millor l’efecte dels pares connotants. En el cas de la variable X5, el simple subconjunt de

variable {X4} ens fa que sigui independent de tots els predecessors (X1, X2, X3), ja que

nom´es ens cal saber que el terra ´es moll per saber que rellisca, indiferentment de quina sigui la causa de l’aigua a terra o de quina estaci´o estiguem. Com que ´es una distribuci´o que satisf`a (2.1) ens indueix poder establir la descomposici´o seg¨uent en aquest exemple concret:

(14)

X1: Estaci´o

X2: Aspersor X3: Pluja

X4: Terra mullat

X5: Terra relliscant

Figura 3: Exemple de xarxa bayesana amb cinc variables

2.3 Equacions Estructurals

Seguint una mica amb la intu¨ıci´o que ens formulava Hume en la definici´o, ´es a dir seguint amb la intu¨ıci´o que la causalitat ´es un fenomen natural, busquem la forma d’expressar-la d’una forma determinista. Tot i el rerefons estoc`astic, busquem una aproximaci´o quasi-determinista d’aquesta forma.

Definici´o 2.11. (Equacions estructurals)

Un model funcional causal consisteix en un conjunt d’equacions de la forma

xi = fi(pai, ui) i = 1, . . . , n (2.2)

on pai representa els pares connotants i Ui representa errors o pertorbacions per factors

omesos. Veiem que l’equaci´o (2.2) ´es una generalitzaci´o no-lineal i no-param`etrica dels models d’equacions estructurals

xi =

X

k6=i

αikxk+ ui i = 1, . . . , n

Quan cadascuna d’aquestes equacions representa un mecanisme aut`onom parlem d’un model estructural. Quan cadascun d’aquests mecanismes determina una sola variable, obtenim el model causal formalment.

Un dels exemples cl`assics d’equacions estructurals ´es el model d’equacions estructural presentat per Goldberg al seu treball de 1992 (Balke i Pearl, 1995)[10]. Sigui q la quantitat de demanda familiar d’un producte A, i els ingressos familiars, w una escala de salaris per la producci´o d’A, u1 un shock en la demanda i u2 un shock en l’oferta. Sigui a m´es r

la demanda familiar per un producte substitutiu B Considerem les seg¨uents equacions: q = b1p + d1i + u1

p = b2+ d2w + u2

r = b3+ u3

A partir d’aquestes 3 equacions podem formular-nos preguntes causals com per exem-ple:

1. Quina seria la demanda del producte A si els preus del producte es controlessin a p = 7

(15)

2. Quina seria la demanda del caf`e si els preus es controlessin a p = 7 assumint que la demanda pel producte B arriba a r = 4?

3. Sigui la demanda actual de B, r = 4, quina seria la demanda del caf`e si els preus s’haguessin controlat a p = 7?

Noti’s que entre 2) i 3) malgrat ser similars hi ha una difer`encia substancial. En el primer s’assumeix que la intervenci´o ocorre abans de veure la demanda de B, mentre que en el cas de 3) s’observa la demanda de B i llavors es for¸ca el preu d’A. Fixem-nos que les ´uniques variables implicades s´on {P, Q, R} i per tant podem marginalitzar les altres variables retenint nom´es les distribucions d’aquestes. En ser I i W variables ex`ogenes, podem combinar I i Ui en una sola variable q. I podem fer similar amb p. Per tant,

sigui X = [P, Q, R] podem reduir la cerca del contrafactual anterior a l’expressi´o:

x = Bx +  amb B =   0 b2 0 b1 0 0 b3 0 0  

Finalment veiem que les equacions estructurals que hem plantejat les podem resumir en el seg¨uent graf:

Q: Demanda d’A P: Preu d’A

R: Demanda de B q p r b1 b2 b3

Figura 4: Graf d’un exemple basat en equacions estructurals

A partir d’aqu´ı juntament amb un conjunt d’assumpcions de qu`e parlarem m´es enda-vant i l’aplicaci´o d’`algebra b`asica podem llavors s´ı determinar els resultats quantitativa-ment.

2.4 El Model Causal Estructural

Definici´o 2.12. (Model causal)

Un model causal ´es una tr´ıada M = {U, V, F } on:

1. U ´es un conjunt de variables, anomenades ex`ogenes, que estan determinades per factors fora del model.

2. V ´es un conjunt {V1, . . . , Vn} de variables, anomenades end`ogenes, que v´enen

de-terminades per variables del model.

3. F ´es un conjunt de funcions {f1, . . . , fn} on cada fi va de U ∪ (V r Vi) a Vi de

manera que cada F envia U a V . ( ´Es a dir, F t´e una soluci´o ´unica per cada estat u del domini de U ). Notacionalment, F es pot representar escrivint

(16)

on pai ´es qualsevol succ´es del conjunt ´unic de variables P Ai en V r Vi (pares

con-notants) que fan que fi no sigui trivial.

Evidentment per la construcci´o que hem anat portant, cada model causal definit M es pot associar amb un graf dirigit, que anomenarem G(M ) en qu`e a cada node li associem una variable en V i les arestes dirigides apunten des dels elements de P Ai cap a Vi.

Veiem que gr`acies a la forma com hem definit i format els models estructurals causals (SCM per les seves sigles en angl`es) obtenim les seg¨uents propietats. (Pearl, 2009)[11]

1. Les hip`otesis causals estan representades de forma gr`afica i amb expressions de forma matem`atica, i per tant, estan subjectes a l’estructura habitual de teoremes i demostracions.

2. Els SCM proveeixen d’un llenguatge prec´ıs per tal de poder comunicar les assump-cions rere les preguntes causals formulades.

3. Un SCM distingeix expl´ıcitament entre preguntes que poden ser provades de forma emp´ırica i aquelles que no poden ser-ho donat aquest model. Seguint amb aquesta l´ınia, ofereix formes de poder indicar de quina forma necessitem que siguin les noves mesures per tal d’obtenir resposta a aquestes preguntes.

4. Els SCM presenten una forma global i gen`erica que inclou altres m`etodes d’infer`encia causal com el de les sortides potencials o els Models d’Equacions Estructurals. A partir d’aqu´ı podem definir f`acilment una noci´o que ens servir`a m´es endavant per veure les afectacions que podem fer sobre el model causal:

Definici´o 2.13. (Submodel causal)

Sigui M un model causal, X un conjunt de variables en V i sigui x un valor particular de X. Un submodel Mx de X ´es el model causal

Mx = {U, V, Fx}

en qu`e

Fx = {fi : Vi ∈ X} ∪ {X = x}/

Fixem-nos que el que estem provocant sobre el model ´es eliminar totes les funcions de les variables en X i substituint-les per X = x. Aix`o ens permet fer una forma d’imposici´o en el model a partir de l’operador do(X = x). Definit m´es formalment:

Definici´o 2.14. (Operador do(x))

Sigui M un model causal, X un conjunt de variables en V i sigui x un valor particular de X. L’efecte de l’acci´o do(X = x) en M ´es el donat pel model Mx.3

En termes probabil´ıstics, l’efecte de la intervenci´o do(x0i) ´es transformar la funci´o de probabilitat inicial P (x1, . . . , xn) en:

P (x1, . . . , xn| do(x0i)) = P0(x1, . . . , xn| Fi= do(x0i)) (2.3)

on P0 ´es la distribuci´o del graf augmentat G0 = G ∪ {Fi→ Xi}

3

Durant el treball, per una comoditat de notaci´o, s’utilitzar`a indistintament Y | do(X) i Yx per tal d’expressar el resultat d’una intervenci´o en X = x. M´es endavant en farem la distinci´o quan parlem ´

(17)

3

Intervencions en Models Causals

3.1 Efecte Causal

Comencem veient els dos principals conceptes a qu`e aspirem en el cas d’un estudi causal de l’efecte de X sobre Y .

Definici´o 3.1. (Resultat potencial)

Anomenem resultat potencial al resultat que observar´ıem en la variable Y en cas que la nostra variable X = x.

En l’exemple d’un cas d’intervenci´o bin`aria, ´es a dir, X = {0, 1} per exemple sent 0 no rebre una vacuna i 1 rebre-la, anomenem resultat potencial per cada persona els valors Y0 i Y1.4

Definici´o 3.2. (Contrafactual)

Resultats que s’haurien obtingut en cas que el tractament hagu´es estat diferent de l’observat.

Per tant, tot i que molts cops s’usen els dos termes d’una forma gaireb´e intercanviable (perqu`e els resultats, Y , s´on els mateixos) el concepte ´es diferent: abans de decidir sobre el tractament, qualsevol dels resultats potencials ´es possible. Despr´es de l’estudi en qu`e s’ha observat un resultat Yx, el contrafactual ´es Yx−1 (en cas d’un estudi binari).

La difer`encia molts cops a escala acad`emica recau en la forma en qu`e cadascuna de les diferents teories aproxima aquest fet. Com veurem m´es endavant, per la teoria basada en equacions estructurals, tot resultat ´es possible de ser computat i per tant el contrafactual ´es simplement una q¨uesti´o d’estudiar altres probabilitats. En canvi, en el cas dels resultats potencials, nom´es s’observa un resultat per cada variable (centrat en resultat en lloc del model te`oric darrere aquest resultat) i per tant el contrafactual s’adequa m´es a la definici´o que hem donat aqu´ı.

3.2 El problema fonamental de la infer`encia causal

Definici´o 3.3. (Problema fonamental de la infer`encia causal)

El problema fonamental de la infer`encia causal consisteix en la impossibilitat d’observar el valor Yt(u) i Yc(u) sobre la mateixa unitat, sent t, c el tractament i control

respectiva-ment sobre la unitat u. Per tant, no podem observar totalrespectiva-ment el valor de l’efecte de t en u perqu`e no podem comparar els dos escenaris. (Holland, 1986)[12]

Per tant, veiem que com ´es evident no podem observar sobre el mateix individu amb totes les condicions que l’envolten id`entiques (incl`os, evidentment, el temps) l’afectaci´o d’un tractament i d’un no-tractament. Per aix`o diem que mai podrem observar aquesta difer`encia entre els dos mons. L’´unica soluci´o que tindrem ser`a mirar d’intentar estimar aquesta difer`encia a partir de diferents t`ecniques mirant de reduir els biaixos que ens permetin comparar al m`axim dos individus diferents, un amb tractament i un amb control, i tractar-los com si parl´essim del mateix.

4es endavant tamb´e ser`a com´u usar la notaci´o Y (0) i Y (1), per remarcar m´es que ´es el resultat d’una

(18)

En l’estudi d’un efecte causal que definirem formalment a continuaci´o el que volem veure ´es quin ´es el resultat d’una intervenci´o, ´es a dir, el resultat d’una modificaci´o volunt`aria sobre la variable d’estudi X. Per exemple, si volem saber l’afectaci´o del pes sobre el risc d’una lesi´o als genolls, determinem el pes com a variable a intervenir. Ens trobem, per`o, amb un dels primers problemes: la forma com podem modificar aquest pes ´es molt diferent (dieta estricta, molt exercici, dieta m´es moderada, dieta baixa en hidrats de carboni, exercicis d’alta intensitat...).

Algunes d’aquestes propostes, per`o, no nom´es tindran una afectaci´o sobre la variable d’estudi (pes) sin´o tamb´e sobre el resultat. Aqu´ı ens crea per tant un factor de confusi´o sobre el que haurem de controlar. D’altra banda ens podrem trobar el cas en qu`e la variable real que volem estudiar sigui immutable ´es a dir, que no es pugui alterar (o com a m´ınim de forma f`acil). Factors com l’origen d’una persona o la situaci´o econ`omica no s´on valors sobre els quals puguem actuar de forma `agil per determinar-ne les causes que provoquen. Per tant, hem de buscar altres variables alternatives (el nom en el cas de l’origen o donar una ajuda extra de forma puntual en la situaci´o econ`omica) per tal de poder realitzar el nostre estudi.

Definici´o 3.4. (Efecte causal)

Donats dos conjunts disjunts de variables, X i Y , definim l’efecte causal de X en Y , denotat per P (y | do(x)) com la funci´o des de X a l’espai de distribuci´o de probabilitat de Y . Per cada valor x de X, P (y | do(x)) d´ona una probabilitat de Y = y indu¨ıda per l’eliminaci´o del model (2.2) de les equacions corresponents a les variables en X i substituint X = x a les equacions restants.

´

Es a dir, per exemple, si ens situem en el cas en qu`e tenim dos tractaments diferents A = {0, 1}, si els resultats Y06= Y1 (Hernan i Robins, 2020)[13]5

Ara b´e, la imposici´o per l’efecte causal que hem definit no sempre ´es possible. En el cas en qu`e P (y | x) 6= P (y | do(x)) ens trobem en la situaci´o que existeixen altres variables afectant que ens impossibiliten resoldre l’efecte del do(x) a partir de termes probabil´ıstics ´

unicament.

3.2.1 Efecte Causal Mitj`a

Una forma r`apida que tindr´ıem de poder considerar un efecte causal seria a partir de la mitjana dels resultats observats. Imaginem un experiment en qu`e volem veure l’efecte de X, que pot prendre valors 0, 1 sobre Y , en una poblaci´o; i col·loquem a la poblaci´o en dos mons simult`aniament, una en qu`e el tractament donat ´es X = 0 i l’altre ´es X = 1. Per exemple, posem que l’estudi ´es sobre el risc de malaltia de cor sobre la poblaci´o fent ioga o no fent-lo. Un cop hagi acabat l’experiment, nom´es ens caldr`a veure E(Y1− Y0), ´es a

dir, l’esperan¸ca de la difer`encia de resultats observats per saber l’efecte causal de fer ioga. Ara b´e, el problema primer ´es evident: tal com coment`avem en el problema fonamental de la infer`encia estad´ıstica no podem simult`aniament fer que tota la poblaci´o faci ioga i no alhora, i per tant, hem de partir la poblaci´o en dues parts, exposant-nos a diversos riscs de biaixos associats.

Condicionament i intervenci´o. En general, per`o, agafant aquest cas d’efecte causal mitj`a (ECM) de refer`encia, podem veure per contraexemple f`acil que, al contrari com es 5Anomenem al resultat observat en Y de l’efecte de l’acci´o x de la variable X com YX=x o simplement

(19)

fa habitualment en molts estudis,

ECM := E(Y1− Y0) 6= E(Y1| X = 1) − E(Y0 | X = 0)

En aquest cas fixem-nos que estem obtenint l’efecte causal no sobre la poblaci´o, sin´o so-bre la poblaci´o que finalment va realitzar el tractament o no tractament assignat, a m´es sense poder comprovar quins m`etodes d’assignaci´o es van usar. Per exemple, poblaci´o amb problemes de flexibilitat ´es possible que abandonessin la pr`actica o la fessin incor-rectament, i aix`o fa que en fer la restricci´o quedin exclosos, mentre que en l’esperan¸ca global s’inclourien. Per tant, en general, l’expressi´o de la dreta que ´es la que a priori podem tenir informaci´o f`acilment no ´es un efecte causal directe perqu`e estem comparant dues poblacions diferents de gent, quan en la primera part de l’expressi´o en qu`e obtenim l’efecte causal directament tenim la mateixa poblaci´o a comparar.

M´es endavant tractarem detalladament quan fem l’an`alisi del marc de resultats poten-cials a l’apartat 4.2 l’efecte causal mitj`a i de quina forma podem aproximar-ne el resultat.

3.3 Assumpcions causals

Sobretot en el moment en qu`e tractem amb dades observacionals amb diferents t`ecniques com les que comentarem despr´es, per tal de poder fer una identificaci´o entre el model probabil´ıstic i el model causal necessitem que certes assumpcions siguin certes. Algu-nes d’aquestes les podrem controlar m´es efectivament mentre que d’altres haurem o b´e d’assumir-les o b´e de realitzar certes t`ecniques preestudi per ajustar-les.

3.3.1 Assumpci´o d’additivitat pel tractament individual

S’assumeix primerament que el tractament assignat a una unitat no afecta el resultat de l’altre. Formalment, existeixen constants ξs per s = 1, . . . , n (una per cada una de les

unitats) i constants τj per j = 1, . . . , v (una per cada tractament) de manera que si Tj

s’assigna a Us, la resposta ´es

ξs+ τj

indiferentment de l’assignaci´o del tractament en la resta d’unitats. (Cox i Reid, 2000)[14] Aix`o ens permet escriure el resultat de la i-`essima persona en termes del tractament exclusivament d’aquella. A aquesta assumpci´o se li sol incorporar l’assumpci´o d’un sol tractament. En el cas de complir-se ambdues es parla d’un experiment SUTVA (Stable-Unit Treatment Value Assumption).

3.3.2 Assumpci´o de consist`encia

Assumim que el resultat potencial del tractament X = x (Yx) ´es igual al resultat observat si el tractament ha estat efectivament X. ´Es a dir, si X = x ⇒ Yx = Y . Aix`o per exemple ´es significatiu perqu`e ens iguala els resultats experimentals amb els observacionals.

3.3.3 Assumpci´o d’ignorabilitat

El concepte introdu¨ıt per (Rubin, 1978)[15] (tamb´e anomenat l’eliminaci´o de factors de confusi´o) busca assegurar la independ`encia en l’assignaci´o del tractament per altres cova-riants Z. Formalment, diem que el mecanisme d’assignaci´o ´es ignorable si la probabilitat

(20)

de l’assignaci´o de les variables de tractament X donades les covariants Z pren el mateix valor per qualsevol element de X. Per tant, els resultats potencials s´on independents de l’assignaci´o:

Yx ⊥⊥ X | Z 3.3.4 Assumpci´o de positivitat

En aquesta assumpci´o, que veurem necess`aria m´es endavant en la formalitzaci´o de la identificabilitat, busca que per tot valor de X l’assignaci´o del tractament no sigui deter-minista:

P (X = x | Z = z) > 0 ∀x ∈ X

En cas que no es compl´ıs aquesta assumpci´o ens podr´ıem trobar amb qu`e mai obtindr´ıem certs valors de Y per alguns valors de X, quan en canvi necessitem aquesta variabilitat per garantir l’efecte causal.

3.4 Identificabilitat

Gr`acies a la definici´o d’un model causal M busquem la forma d’atribuir quantitats causals i definir aquestes relacions. Ara b´e, en el millor dels casos, el que nosaltres podem obtenir ´es informaci´o experimental en qu`e tinguem una probabilitat de les variables del model observades, PM(v). El problema ´es que no tenim la certesa que un sol model causal tingui

una sola probabilitat associada. De fet ´es altament probable que passi el contrari. Per tant, aix´ı com en els models estad´ıstics quan volem estimar un par`ametre simplement obtenim m´es mostres ens aporta una major certesa dels par`ametres establerts, en el cas causal m´es dades no ens aporta m´es fiabilitat. El que busquem ´es un criteri per veure si assumpcions que afegim al model M ens aportaran la informaci´o extra per respondre les nostres preguntes tot i no tenir completament M en si.

Definici´o 3.5. (Identificabilitat)

Sigui Q(M ) una quantitat computable qualsevol del model M . Diem que Q ´es identifi-cable en una classe M de models si, per qualsevol parella M1i M2de M, Q(M1) = Q(M2)

quan PM1(v) = PM2(v). Si nom´es podem tenim unes observacions parcials d’uns factors FM de PM(v), definim Q identificable a partir de FM si Q(M1) = Q(M2) quan FM1 = FM2 Definici´o 3.6. (Identificabilitat de l’efecte causal)

L’efecte causal de X en Y ´es identificable a partir d’un graf G si la quantitat P (y | do(x)) es pot calcular ´unicament a partir de les probabilitats positives de les va-riables observades, ´es a dir, si PM1(y | do(x)) = PM2(y | do(x)) per tot parell de models M1, M2 amb PM1 = PM2 > 0 i G(M1) = G(M2) = G

L’efecte causal de T sobre Y es diu que est`a ’identificat’ si ´es possible, amb dades ideals (mida de mostra infinita, mesura perfecta), eliminar tota associaci´o no causal de l’associaci´o observada entre T i Y tal que nom´es queda l’associaci´o causal.

D’aquesta manera a partir d’arribar a aquesta identificabilitat aconseguim unir el vessant probabil´ıstic (i per tant l’observacional) amb el causal. Ara, per tant, tenim dues fonts d’informaci´o: (Pearl, 2009)[11]

(21)

2. graf causal G que especifica de forma qualitativa quines variables participen o afecten el mecanisme.

3.4.1 L’efecte de les assumpcions causals

Observem ara la import`ancia conjunta que t´e la cerca de l’acceptaci´o de les assumpcions causals que ens permeten el fenomen de la identificabilitat. Suposem que disposem d’un conjunt d’observacions en qu`e tenim Y el nostre resultat observat, X la variable (o varia-bles) d’intervenci´o i Z un conjunt de covariants. Podem determinar la seg¨uent seq¨u`encia d’estudi:

E(Y | X = x, Z = z)(1)= E(Yx| X = x, Z = z)

⇒ E(Y | X = x, Z = z)(1)= E(Yx | X = x, Z = z)(2)= E(Yx| X = x)

Veiem que el pas (1) el podem fer gr`acies a la consist`encia, en qu`e deman`avem que el resultat potencial del tractament amb X = x fos igual al resultat observat. En segon lloc, gr`acies al concepte d’ignorabilitat un cop hem condicionat per la covariant Z sabem que Yx ⊥⊥ X i per tant podem eliminar-la de l’expressi´o. Com veurem m´es endavant en detall el que fem ´es eliminar l’efecte d’un factor de confusi´o aportant a un experiment observacional un tractament d’experiment aleatori. Tot aix`o ens porta a una forma f`acil de poder calcular l’efecte causal marginal simplement a partir de l’estratificaci´o (obtenint la mitjana estandarditzada):

E(Yx) =X

x

E(Y | X = x, Z = z)P (Z = z) (3.1)

Veiem per tant un proc´es d’estratificaci´o, en qu`e hem separat la nostra mostra ob-servacional en diferents conjunts en funci´o de la covariant Z, eliminant aix´ı factors dis-torsionadors podent obtenir un efecte causal marginal. Posem ara un exemple per veure l’efecte en l’an`alisi de forma real del concepte de control.

Imaginem que estem analitzant l’efecte d’haver fumat durant els ´ultims 5 anys sobre el risc a tenir c`ancer. Amb una mostra observacional de 7.995 persones obtenim els seg¨uents resultats. Sigui Y l’aparici´o de c`ancer i X si la persona ´es fumadora: 6:

CANCER = SI CANCER = NO TOTAL

FUMA = SI 303 2700 3003

FUMA = NO 292 4700 4992

TOTAL 595 7400 7995

Si fem servir 1 per denotar ’SI’ i 0 per denotar ’NO’, tenim el seg¨uent: a priori, si fem una an`alisi r`apida, veiem que E(Y1 | X = 1) = 0, 1009 i en canvi E(Y1| X = 0) = 0, 0585.

Per tant, amb un 10,08% de probabilitat si fumes i un 5,85% si no, sembla evident a partir de l’an`alisi de les mitjanes dels efectes potencials que fumar ´es perjudicial i augmenta el risc de c`ancer. De fet sembla que estiguem arribant a veure que el risc es duplica.

6Tots els n´umeros s´on inventats per tal de posar un exemple i no tenen cap relaci´o amb els efectes

(22)

Ara b´e, imaginem que tenim la idea que existeix una covariant que tamb´e entra en joc en aquest model: si els pares de l’individu eren fumadors. En aquest cas ´es l`ogic pensar que el fet de tenir pares fumadors augmenta el risc de tenir un c`ancer, ja que per l’efecte de fumador passiu l’individu de petit ha experimentat molts anys de fumador. A m´es a m´es, per`o, tamb´e ´es probable que un nen que hagi vist a casa com a normal el fet de fumar vegi augmentada la probabilitat que fumi de gran. Per tant, tenim una covariant fins ara no analitzada, Z =’pares fumadors’ que afecta tant a la nostra X com a la nostra Y . Per tant, pel principi d’ignorabilitat, hem d’ajustar per aquesta variable. En aquest cas, les dues taules resultants s´on les seg¨uents:

CAS PARESFUMADORS = NO

CANCER = SI CANCER = NO TOTAL

FUMA = SI 3 900 903

FUMA = NO 2 2900 2902

TOTAL 5 3800 3805

CAS PARESFUMADORS = SI

CANCER = SI CANCER = NO TOTAL

FUMA = SI 300 1800 2100

FUMA = NO 290 1800 2090

TOTAL 590 3600 4190

Ara per tant tornem a fer els c`alculs a partir de la f´ormula d’estratificaci´o que hem definit abans, en qu`e ponderem cadascun dels resultats a partir de quin percentatge del subconjunt representa: E(Y1) =X x E(Y | X = 1, Z = z)P (Z = z) = = E(Y | X = 1, Z = 0)P (Z = 0) + E(Y | X = 1, Z = 1)P (Z = 1) = 0, 0764 E(Y0) =X x E(Y | X = 0, Z = z)P (Z = z) = = E(Y | X = 0, Z = 0)P (Z = 0) + E(Y | X = 0, Z = 1)P (Z = 1) = 0, 0730 I aqu´ı veiem com tot era radicalment diferent: en el moment en qu`e eliminem l’efecte del covariant i assumim la ignorabilitat, veiem que l’efecte causal del fet de fumar tot i seguir existint (a priori) ´es gaireb´e nul en comparaci´o amb el que hav´ıem obtingut. Per tant, d’aqu´ı no podem assumir que el fet que una persona hagi fumat els darrers 5 anys li faci augmentar el risc a patir c`ancer (i en canvi s´ı que podem determinar l’exist`encia d’una relaci´o molt gran amb la precondici´o de pares fumadors).

3.5 La paradoxa de Simpson

La Paradoxa de Simpson, anomenada aix´ı en ser E.H Simpson el primer que en plantej`a un cas a principis dels anys 50, ´es el resultat de qu`e succeeix si no es t´e en compte l’estructura causal en l’an`alisi d’un problema (Clayton et al, 2011)[16]. Similar al que ens hem trobat anteriorment, planteja el seg¨uent escenari d’observacions. Imaginem la taula dels seg¨uents resultats d’estudi de les variables A, B, C en N = 52 individus.

(23)

B = 0 B = 1 A = 1 20 20

A = 0 6 6

Separant ara condicionat a C, tenim:

C = 1 C = 0 B = 0 B = 1 A = 1 5 8 A = 0 3 4 B = 0 B = 1 A = 1 15 12 A = 0 3 2

Si mirem les dades veiem que l’oportunitat relativa7 ORAB = 1 en el primer cas i

ORAB | C=1 = ORAB | C=0 = 5/6. Veiem per tant que tot i que l’oportunitat relativa condicionada ´es la mateixa en ambd´os casos, aquesta difereix si no condicionem per C. Per tant, A i B s´on independents si no condicionem (A ⊥⊥ B) i en canvi s´on dependents condicionals per C, matem`aticament A 6⊥⊥ B | C.

En aquest moment ens plantegem: quin m`etode d’an`alisi ´es el m´es encertat? Simpson tamb´e s’ho q¨uestion`a, i ens don`a un exemple per demostrar que ambd´os ho s´on en funci´o del model causal que estiguem estudiant. Suposem un primer cas en qu`e volem veure si la proporci´o de cartes que siguin figures (Rei, Reina i Patge) est`a associada al color (Negre, Vermell). Sigui A el tipus de carta (amb 1 n´umero i 0 figura) i B el color (1 negre i 0 vermell). A m´es, per`o, el joc de cartes que estem mirant ´es el d’un nen petit que les ha embrutat amb les mans, en aquest cas, la variable C. Evidentment, veiem que obtenim el resultat esperat ORAB = 1, ja que tenim el mateix nombre de cartes vermelles que

negres.

Ara b´e, suposem un altre experiment en qu`e A representa un tractament m`edic, B representi si el pacient ha mort o sobreviscut i C representi el sexe de l’individu. En aquest cas, per`o, s’adequa m´es la resposta condicionant per sexe, ORAB | C < 1 demostrant que

el tractament s’associa amb una disminuci´o del risc tant per homes com per dones. Per tant, aqu´ı ens sorgeix el dubte evident: com triem en cada cas si mirem el condi-cionament o no? Les dades, ´es a dir, el vessant probabil´ıstic, ens d´ona resultats confusos i veiem que per dos models diferents obtenim el mateix conjunt de dades possible. La resposta a la nostra an`alisi ser`a definida per una aproximaci´o en qu`e fem l’estudi ’no-estandarditzat’ del model causal. A tall d’introducci´o de la formalitzaci´o que farem a continuaci´o, veiem el que est`a succeint aqu´ı. De les dades extraiem una predilecci´o del nen tant per les cartes amb figures com per les cartes vermelles. Per aix`o, tant A com B tenen una relaci´o causal (independent entre elles) amb C com veiem a l’esquerra de la figura 5. Aqu´ı C actua de col·lisionador de la informaci´o i en el moment en qu`e condici-onem, generem una relaci´o esp´uria entre A i B (marcada amb una l´ınia discont´ınua) que 7Definim oportunitat relativa com el quocient de dues oportunitats, essent cadascuna de les

opor-tunitats com la probabilitat entre que succeeixi i que no succeeixi. ´Es una mesura epidemiol`ogica que es fa servir generalment per veure l’associaci´o entre una exposici´o i una malaltia. En el cas d’una taula 2x2 amb valors per fila a, b, c, d definim per tant l’oportunitat relativa com:

OR =a/b c/d

A partir d’aqu´ı interpretem tres casos: si OR = 1 no existeix associaci´o entre exposici´o i malaltia. Si OR < 1 tenim a priori una associaci´o negativa i en cas contrari, si OR > 1 tenim a priori una associaci´o positiva. La traducci´o ´es la proposada pel Termcat.

(24)

no existia amb anterioritat. Aix`o ´es el que en l’`ambit epidemiol`ogic es coneix com el biaix de selecci´o.

En canvi en el segon cas, el dibuix causal seria diferent: a la dreta de la figura 5 els homes tenen menys possibilitat de rebre el tractament com veiem a les dades, i per tant, no s’aplica de forma uniforme entre la poblaci´o. D’altra banda, els homes tamb´e tenen menys propensi´o a morir. Per aquestes raons tenim una fletxa de C tant cap a A com cap a B. Com veurem a continuaci´o tenim un factor de confusi´o, en aquest cas C, que afecta les dues variables alhora i per tant tamb´e a la relaci´o entre aquestes. De cara a poder observar l’efecte causal de forma neta necessitem eliminar l’efecte d’aquest factor, i per tant, aqu´ı s´ı que necessitem controlar per aquestes variables.

A B

C

C

B A

Figura 5: Dos models causals per les mateixes dades

En definitiva, un mateix conjunt de dades que t´e un tractament i interpretaci´o radi-calment diferent en funci´o del model causal que s’apliqui. La Paradoxa de Simpson per tant no ´es un gran maldecap com ha resultat ser per molts investigadors sin´o un simple problema de diferents relacions causals entre les variables estudiades.

3.6 Control de variables de confusi´o

Com hem vist amb la paradoxa de Simpson ens trobem a vegades amb l’exist`encia de variables que afecten el nostre model i sobre les quals la nostra intervenci´o per intentar controlar-les ens pot portar a resultats incorrectes.

3.6.1 Formes de condicionament

Entenem per condicionament el fet d’assumir o tractar l’esdeveniment com si hagu´es ocorregut. Aix´ı podem fer grups de les nostres observacions o mostres a partir d’aquest criteri. Hi ha moltes formes de controlar per una variable, i quan m´es endavant parlem dels perills (o beneficis) de condicionar, entendrem que s’ha realitzat alguna pr`actica igual o similar a aquestes:

1. Control de variables (e.g. regressi´o). En infer`encia causal entenem pel control d’una variable per regressi´o a agrupar per l’efecte de certes covariants que afecten la nostra variable estudiada. Quan s’estima l’efecte de les variables explicatives sobre un resultat per regressi´o, les variables controlades per les variables s’inclouen com a entrades per separar els seus efectes de les variables explicatives.

2. Estratificaci´o (eg. taules de conting`encia, an`alisis de superviv`encia, log-linear mo-dels). L’estratificaci´o ´es el proc´es de dividir els membres de la poblaci´o en subgrups homogenis abans del mostreig. Es poden establir diferents tipus d’estratificaci´o en funci´o de criteris com igual nombre de representats per cada estrat (en aquest cas podr´ıem perdre dades representatives) o en funci´o de quines variables s’usa.

(25)

3. An`alisi de subgrups (eg. restricci´o). Tot i partir d’una subagrupaci´o pel valor d’una variable com el cas de l’estratificaci´o, en el cas de l’an`alisi de subgrups el que fem ´es l’estudi directament restringit nom´es en aquell grup, generalment sabent que no t´e efecte causal la variable sobre el resultat (o el t´e i en sembla correcte incorporar-ne el biaix de nom´es restringir-ho). Per exemple, si estem estudiant l’efecte de certa pol´ıtica nom´es en dones amb feina.

4. Selecci´o de mostra. T`ecnica basada en simplement recollir mostres dels individus amb certa covariant determinada. Per exemple, nom´es estudiar els homes blancs d’ingressos baixos. Tot semblant en l’an`alisi de grups, aqu´ı posem l’`emfasi en el fet que la selecci´o i tall es fa en el moment d’estudi, no en la fase d’an`alisi.

5. Desgast, manca de resposta. Analitzar nom´es els individus que han arribat al final d’un tractament aplicat o dels quals coneixem amb certesa que han respost d’alguna forma. Ja ´es una pr`actica habitual seleccionar nom´es aquells que tenim la certesa que s’han tractat (i per exemple no han abandonat la pr`actica de cert exercici al cap d’una setmana), per`o ´es important veure que estem realitzant un condicionament sobre l’an`alisi en veure nom´es aquest subconjunt. Per exemple, seria interessant potser estudiar tamb´e quines condicions o fets han portat a les altres persones a abandonar l’estudi prematurament.

Com hem vist, ´es important condicionar per aquelles variables que ens estan alterant la nostra an`alisi causal, o al rev´es, no hem de condicionar per aquelles que ens generen relacions esp´uries. Definim-les amb detall:

Definici´o 3.7. (Variables de confusi´o)8 (VanderWeele i Shpitser, 2013)[17]

Una covariable C es considera un factor de confusi´o per a l’efecte d’A sobre Y si hi ha un conjunt de covariables X de tal manera que l’efecte de l’exposici´o sobre el resultat ´es inconfusible condicionat a (X, C) per`o per cap subconjunt adequat de (X, C) ´es l’efecte de l’exposici´o sobre el resultat inconfusible donat el subconjunt. Matem`aticament, podem expressar-ho si ∃X | Ya⊥⊥ A(X, C) per`o T ⊂ (X, C) | Ya⊥⊥ A|T .

3.6.2 Associacions a partir de camins

Direm que dues variables estan associades, ´es a dir, tenen algun tipus de relaci´o causal entre elles, si existeix algun cam´ı pel qual circula informaci´o. (Pearl i Mackenzie, 2018)[18] Per exemple, en el cas dels tipus de cam´ı que hem definit al principi, en relaci´o amb X i Y :

• En una cadena X → G → Y la informaci´o circula des de X a Y , de manera que no s´on independents

• En una forca, la informaci´o va de G a X i a Y , de manera que ambdues estan connectades i no s´on independents

• En una forca inversa, la informaci´o va de X a G i de Y a G, per`o no arriba cap comunicaci´o entre X i Y , de manera que s´on independents.

8

S’accepta segons Termcat la terminologia ’variable de confusi´o’ per confounder. Tot i aix`o, es proposa utilitzar ’confusor’ si en algun moment es considera convenient per brevetat del text

(26)

A partir d’aqu´ı podem definir un concepte important de cara a assegurar l’eliminaci´o de covariables que ens distorsionen l’an`alisi:

Definici´o 3.8. (d-Separaci´o)

Una ruta p es diu estar d-separada (o bloquejada) per un conjunt de nodes Z ⊂ V si i nom´es si es compleix una de les seg¨uents:

1. p cont´e una cadena i → m → j o una bifurcaci´o i ← j → m de manera que el node central m estigi en Z

2. p cont´e una bifurcaci´o inversa (o col·lisionador) i → m ← j de manera que ni m ni cap descendent seu estiguin en Z

Un conjunt Z es diu que d-separa X de Y ⇐⇒ Z bloqueja tots els camins possibles entre un node de X i un node de Y .

Veurem la import`ancia de la d-separaci´o en termes de causalitat i condicionament. Tant en el cas de la cadena com el de la bifurcaci´o, es veu de forma evident que la relaci´o entre i i j es pot condicionar a trav´es de m. Per exemple, en el cas de la relaci´o de cadena, coneguda m no ens cal saber i per tal de poder saber la probabilitat de sortida.

Teorema 3.9. (Implicaci´o probabil´ıstica de la d-separaci´o)

Si els conjunts X i Y es troben d-separats per un conjunt Z en un DAG G, llavors X ´es independent de Y condicionat en Z en totes les distribucions del model G. De forma inversa, si no tenim aquesta d-separaci´o, X i Y s´on dependents condicionades a Z en com a m´ınim una distribuci´o de G.

Per tant, podem definir a partir d’aquest criteri dos termes que ens permeten catego-ritzar algunes variables:

Definici´o 3.10. Anomenarem bloquejador a un conjunt de variables Z que d-separen X i Y .

El que ens permet per tant un bloquejador ´es fer que dues variables fins ara dependents siguin independents. Per exemple, suposem un graf molt senzill:

Fum Alarma Foc

En aquest cas senzill tenim que la pres`encia de foc ens causa la pres`encia de fum. La pres`encia de fum fa saltar l’alarma. Per tant, tenim una cadena de causalitat entre les tres variables. Ara determinem F um com a bloquejador, condicionant en aquesta variable. Tot i que a partir de saber la pres`encia de F oc puc determinar el salt de l’alarma, ara simplement a partir de con`eixer la variable F um en tinc suficient. ´Es a dir, el fet de bloquejar el cam´ı ha fet que Foc i Alarma es tornin independents, perqu`e Fum em d´ona tota la informaci´o que hi havia circulant entre Foc i Alarma.

Definici´o 3.11. Anomenem col·lisionador a una variable situada en una forca inversa per la qual controlem, creant una relaci´o esp´uria entre dos conjunts de variables indepen-dents fins aleshores. Anomenem a aquest fenomen ’biaix de selecci´o end`ogena’. (Elwert i Winship, 2014)[19]

(27)

Posem per exemple el cas del seg¨uent graf (figura 6 en relaci´o amb el m´on del debat universitari. Podem establir una relaci´o causal entre que alg´u sigui un bon orador i que acabi anant a un torneig de debat universitari. D’altra banda, tamb´e ´es cert que per les caracter´ıstiques que t´e la carrera de Dret a nivell tant d’argumentaci´o com d’orat`oria davant un jurat, ´es molt habitual que la gent que estudia Dret participi del m´on del debat i per tant vagin tamb´e a tornejos de debat universitari. Tindr´ıem un graf de les seg¨uents caracter´ıstiques:

Torneig de Debat

Estudiant de Dret Bon orador

Figura 6: Exemple de col·lisionador

A priori no existeix una relaci´o directa entre ser bon orador i ser estudiant de dret. Evidentment hi ha estudiants de dret que s´on bons oradors, per`o igual que tenim bons oradors a la carrera de matem`atiques. Ara b´e, es d´ona el cas que si nom´es tens com a refer`encia i condiciones per ’Torneig de Debat = 1’ ´es a dir, l’assist`encia a un torneig de debat (per exemple, si vas de p´ublic a un torneig) establiries una relaci´o en qu`e els estudiants de dret s´on bons oradors, ja que ´es el que observaries. El fet de condicionar sobre un col·lisionador ens ha creat una relaci´o esp´uria entre ser bon orador i ser estudiant de dret, de forma que com que nom´es podem veure una subpoblaci´o afectada per ambdues causalitats, es crea un nou node que ens far`a impossible l’an`alisi real.

Aquest ´es el problema principal per qu`e molts estudis arriben a conclusions err`onies per`o a priori correctes segons els c`alculs matem`atics. Sense disposar d’un model causal que expliqui aquestes relacions i ens doni elements de selecci´o de col·lisionadors, la tend`encia estad´ıstica a controlar per totes les variables possibles ens pot portar a controlar per un col·lisionador, creant un efecte pantalla que ens cre¨ı causalitats inexistents fins aleshores. Aquesta ´es malauradament una pr`actica comuna en recerca estad´ıstica que ha portat sovint a resultats aparentment correctes que m´es tard, amb l’an`alisi causal correcte, s’han demostrat falsos.

3.6.3 Criteri de pas posterior

Ara b´e, de quina forma podem assegurar tenir controlat l’efecte d’una variable de confusi´o o en canvi, no afegir-ne un de nou? L’objectiu del seg¨uent apartat ser`a trobar un criteri que ens permeti comprovar si, a priori, un conjunt de variables Z ⊆ V ´es suficient per a estimar els efectes de P (y | do(x)) tenint nom´es una representaci´o de P (v).

Definici´o 3.12. Un pas posterior ´es un cam´ı que va de X a Y el qual t´e un v`ertex dirigit cap a X. Per exemple, en el cas senzill X ← Z → Y .

A la pr`actica, aquest tipus de camins s´on associacions entre les nostres variables per`o que no ´es la associaci´o causal que estem estudiant (fixem-nos que nosaltres volem la causa de X sobre Y , per tant, ens interessen els camins que surten de X, no aquells que influeixen sobre X). Per tant volem un criteri que permeti bloquejar aquesta relaci´o.

Si bloquegem tots els camins de pas posterior, a partir de condicionar un conjunt de variables Z, aconseguirem certificar l’assumpci´o causal d’ignorabilitat (donat Z).

(28)

Definici´o 3.13. (Criteri de pas posterior)9

Un conjunt de variables Z compleix el criteri de pas posterior relatiu a dues variables (X,Y) en un graf ac´ıclic dirigit G si:

1. cap node de Z ´es descendent de X

2. Z bloqueja tots els camins entre X i Y que contenen una aresta dirigida cap a X En cas que X i Y siguin dos conjunts de nodes, podem dir que Z satisf`a el criteri de pas posterior si el satisf`a per tota parella (Xi, Yj) tal que Xi ∈ X i Yj ∈ Y .

A partir d’aqu´ı, formalitzem la propietat d’identificabilitat:

Teorema 3.14. Si un conjunt de variables Z satisf`a el criteri de pas enrere relatiu a (X, Y ), llavors l’efecte causal de X en Y ´es identificable a partir de la f´ormula (3.1) Demostraci´o. Comencem escrivint la probabilitat P (y | do(x)) en termes de la funci´o de probabilitat augmentada P0 que vam definir a (2.3) condicionant sobre Z de forma que obtenim: P (y | do(x)) = P0(y | Fx) = X z P0(y | z, Fx)P0(z | Fx) (3.2) =X z P0(y | z, x, Fx)P0(z, Fx) (3.3)

Com que Fx consisteix en nodes arrel amb fills restringits a X, ha de ser independent de

tots els no-fills de X, incl`os Z. Per tant, la primera condici´o ens permet fer P0(z | Fx) = P0(z) = P (z)

Ara a partir de la segona condici´o, juntament amb el condicionament, podem eliminar Fx

de (3.3) obtenint el resultat.  Z X Y a) Z X Y b) X U Z Y c)

Figura 7: Exemples d’identificabilitat pel criteri de pas posterior

Si seguim la definici´o del criteri, veiem a la figura 7 que en els diagrames a) i b) l’efecte P (y | do(x)) es pot identificar perP

zP (y | x, z)P (z), ´es a dir, pel control en Z. En canvi,

en el tercer cas, c), no tenim cap conjunt que ens permeti aplicar el criteri i identificar amb l’efecte P (y | do(x)).

Busquem ara un algoritme que ens permeti f`acilment poder aplicar el criteri de pas posterior per poder comprovar si un gr`afic causal ´es identificable:

9

Traducci´o pr`opia per falta de traducci´o acad`emica reconeguda del terme ’back-door criterion’ en catal`a. Donades les caracter´ıstiques de la definici´o (bloquejar els camins entre X i Y que apunten a X) s’ha considerat correcte el concepte de ’barrar el pas posterior’.

(29)

1. Llistar tots els camins de pas posterior entre X i Y .

2. Comprovar si tots aquests camins estan naturalment (incondicionalment) bloque-jats. Si ´es que s´ı, tenim identificaci´o.

3. Mirar si els camins no bloquejats es poden bloquejar a partir del condicionament en variables que no siguin descendents de X. En cas que s´ı, seguim. Si no, no ´es identificable.

4. Comprovar si el pas anterior ha desbloquejat algun cam´ı no-causal i mirar si aquests es poden bloquejar. En cas que s´ı, seguim. Si no, no ´es identificable.

5. Comprovar si alguna de les variables que han d’estar condicionant per bloquejar camins de pas posterior estan en el cam´ı de X a Y o s´on descendents d’alguna variable del cam´ı causal. En cas que si, no ´es identificable. Si no, tenim identificaci´o. Finalment mostrem una generalitzaci´o del criteri de pas enrere que ens permeti, per qualsevol efecte estudiat P (y | do(x)), ajustar per Z deixant oberts (o obrint) tots els camins causals per`o bloquejant la resta.

Definici´o 3.15. (Criteri d’ajustament).

Z satisf`a el criteri d’ajustament relatiu a (X, Y ) a G si:

• Cap element de Z ´es descendent en GX de cap W /∈ X que viu en un cam´ı causal

correcte de X a Y .

• Tots els camins no causals de X a Y estan bloquejats per Z

3.7 Criteri de pas endavant

Finalment, busquem una forma alternativa de poder identificar el nostre model causal. En lloc de mirar aquells camins que entren a X, mirem aquells que en s´on descendents. Pre-cisament aquests nodes concomitants, sota certes condicions, ens poden ajudar a obtenir una expressi´o del nostre efecte causal.

Definici´o 3.16. (Criteri de pas endavant)

Un conjunt de variables Z es diu que satisf`a el criteri de pas endavant relatiu a un parell ordenat de variables (X, Y ) si es compleixen totes les condicions seg¨uents:

1. Z intercepta tots els camins dirigits de X a Y 2. No hi ha un cam´ı de pas posterior de X a Z

3. Tots els camins de pas posterior de Z a Y estan bloquejats per X

Teorema 3.17. Si Z satisf`a el criteri de pas endavant relatiu a (X, Y ) i tenim P (x, z) > 0, llavors l’efecte causal de X en Y ´es identificable i ´es definit per la f´ormula

P (y | do(x)) =X

z

P (z | x)X

x0

Figura

Figura 1: Exemple de gr` afic causal
Figura 2: Exemple de forca inversa i condicionament
Figura 3: Exemple de xarxa bayesana amb cinc variables
Figura 4: Graf d’un exemple basat en equacions estructurals
+7

Riferimenti

Documenti correlati

El término κόσμος tiene la doble significación central de orden y de mundo /cosmos, que también está relacionada con el adorno corporal (cf. Significa una bella disposición,

AIMS OF THE THESIS The aims of this thesis include the seismic baseline modeling and geological characterization of the Hontomín CO2 storage site, by means of the 3D seismic

In the current study, we manipulate, in a single task, both reactive and proactive inhibition mechanisms, and we investigate the within-subjects effect of increasing, by means of

Our spectrophotometer-based assay in which the intensity of fluorescently-labelled diffusing particles was analyzed within the diffusion layer minimized the effects

A new pyrrolo[2,3-d]pyrimidines bearing three aryl groups at 2-, 4- and 6- positions were prepared by arylation of 7-methyl-2-methylthio-4-chloro-6- phenylpyrrolo[2,3-d]pyrimidine

CARLES FERRER COSTA 2005.. DEPARTAMENT DE BIOQUÍMICA I BIOLOGIA MOLECULAR.. UNIVERSITAT

Però també és cert que algunes d’aquestes persones hi han tingut un paper més determinant i és a aquestes a les que em voldria referir en aquest moment en què sembla

(3) IS: sí | entonces ha eso e::: yo tengo siempre la mentalidad de de mirarlos mucho para evitar que me traigan la::: un documento falsificado porque hay hay inmigrantes que lo