4. ANALISI DI MEDIAZIONE
4.1 Cosa si intende con il termine “mediazione”?
Il termine mediazione viene utilizzato in statistica e nelle scienze sociali per indicare un meccanismo o un processo caratterizzato dalla presenza di una variabile indipendente che causa, influenza una variabile dipendente, o outcome, attraverso una terza variabile chiamata mediatore, intermediario o interveniente.
I metodi che permettono di svolgere analisi di mediazione sono utili per riuscire a determinare non solamente la presenza di un effetto diretto che una variabile ha su un’altra ma, tramite la presenza di un mediatore, per comprendere la reale natura della relazione tra le variabili di interesse. Bisogna quindi prendere in considerazione due aspetti: il procedimento con cui una variabile influenza un’altra e il modo in cui ciò accade. L’analisi di mediazione aiuta a comprendere situazioni in cui le variabili non sembrano avere un legame diretto immediato.
Per semplificare la comprensione delle relazioni di cui si sta parlando, spesso si fa ricorso alla parte grafica della path analysis per la descrizione di un processo causale. Si tratta di un metodo sviluppato tra il 1918 e il 1934 dal genetista Sewall Wright (Pedhazur, 1982), nel quale ogni freccia unidirezionale viene utilizzata per indicare una relazione causale, mentre le frecce bidirezionali indicano la presenza di un’associazione tra le variabili coinvolte.
In questo modo è possibile visualizzare graficamente lo scenario della mediazione a cui si è interessati.
Si veda a tale proposito la Figura 4.1, dove 𝐴 indica la variabile indipendente o esposizione, 𝑌 la variabile dipendente o outcome e 𝑀 il mediatore. Per semplicità non viene per ora considerata la possibile presenza di covariate.
4.2 Il controfattuale
Il metodo della mediazione verrà affrontato seguendo l’approccio controfattuale degli outcome potenziali7. Tale approccio si basa tutto sul
cercare di capire cosa sarebbe successo se l’esposizione, o semplicemente più in generale la variabile indipendente, avesse assunto un valore diverso da quello che effettivamente ha assunto. L’idea di partenza è che se questo cambiamento modifica l’outcome di interesse, allora si può pensare che l’esposizione causi, o comunque abbia un effetto, sull’outcome (Menzies, 2017).
Sia 𝑌$ il valore assunto dalla risposta quando l’esposizione 𝐴 è fissata al valore 𝑎; per semplicità si può considerare un’esposizione dicotomica con 𝑎 = 0 oppure 𝑎 = 1, ottenendo così che gli outcome potenziali o controfattuali possano essere identificati come 𝑌) e 𝑌*.
Il problema principale di quest’approccio è che in generale si conosce solamente quello che è effettivamente accaduto, quindi solo 𝑌) o 𝑌* e non è possibile valutare direttamente cosa sarebbe successo altrimenti. Questo solitamente prende il nome di consistency assumption (VanderWeele, Explanation in Causal Inference: Methods for Mediation and Interaction., 2015). Il valore controfattuale dell’outcome è quindi solitamente qualcosa che non si conosce e il quesito può essere ridotto ad un problema di valori mancanti talvolta difficile da affrontare in un contesto empirico.
7 L’idea di considerare la causazione da un punto di vista controfattuale risale a Hume
(1748), ma all’interno del mondo statistico viene introdotta da Neyman (1923) per la prima volta una notazione precisa dell’approccio controfattuale. Tutto questo viene poi
approfondito e portato avanti da Rubin (1974; 1978), fino ad essere ampliato ulteriormente con l’aggiunta di più esposizioni ed esposizioni che variano nel tempo da Robins (1986). Viene spesso affiancato da una rappresentazione grafica di causalità introdotta da Spirtes, et al. (1993) e Pearl (1995; 2001).
L’impossibilità di conoscere entrambi i valori della risposta per lo stesso individuo rappresenta il problema fondamentale dell’inferenza causale (Angrist & Pischke, 2009).
L’effetto causale può essere semplicemente definito come la differenza tra gli outcome ottenuti nel caso in cui fossero state attuate le azioni potenziali, cioè 𝑌*− 𝑌), tuttavia questa differenza solitamente non può essere identificata a livello individuale.
Lavorando a livello di popolazione si può però sperare di riuscire a fare inferenza sugli effetti medi: 𝐸(𝑌*− 𝑌)). La randomizzazione, quando può essere attuata, permette di comparare a livello di media di popolazione il risultato di due trattamenti o esposizioni differenti, consentendo di ottenere che 𝑌$⊥ 𝐴. Nonostante possa sembrare scorretto un legame di indipendenza
come quello appena definito, in realtà al suo interno è contenuto il significato centrale del controfattuale: non è l’outcome osservato ad essere indipendente dall’esposizione, ma lo sono gli outcome potenziali, 𝑌$, in quanto rappresentano gli outcome che si potrebbero verificare a priori, indipendentemente dal valore che poi effettivamente ha assunto l’esposizione. Purtroppo molto spesso non si ha la possibilità di ottenere dati provenienti da studi sperimentali, ma sono disponibili solo dati osservazionali e quindi nonostante possano essere svolti dei controlli per assicurarsi che sia possibile il confronto fra le risposte con due stati di esposizioni differenti, non si ha mai la certezza che essi siano sufficienti. Si cercherà pertanto di garantire che risulti almeno possibile confrontare gli outcome potenziali all’interno di gruppi definiti sulla base dei valori delle covariate 𝐶, assumendo 𝑌$ ⊥ 𝐴|𝐶. Questo prende il nome di no-unmeasured-confounding assumption o
exogeneity assumption (VanderWeele, 2015).
Sotto queste assunzioni risulta possibile ottenere gli effetti causali dai dati come
e quindi, eliminando il condizionamento, 𝐸(𝑌*− 𝑌)) = 4 𝐸(𝑌*− 𝑌)|𝑐) 5 𝑃(𝑐) = 4 {𝐸(𝑌|𝐴 = 1, 𝑐) − 𝐸(𝑌|𝐴 = 0, 𝑐)} 5 𝑃(𝑐) (4.2)
Tramite le Formule 4.1 e 4.2 è possibile osservare come l’effetto causale medio dell’esposizione sull’outcome possa essere ottenuto semplicemente come una differenza di valori attesi, stimabili dai dati osservati. La Formula 4.2 rappresenta l’effetto causale medio dell’esposizione sull’outcome sull’intera popolazione invece che considerarlo all’interno di strati di covariate 𝐶 = 𝑐 come veniva fatto nella Formula 4.1.
È importante sottolineare che non tutte le forme di causazione possono essere ricondotte ad un ambito controfattuale, ad esempio nel caso in cui siano presenti più cause che influiscono sull’avvenimento di un effetto.
Si può considerare il caso semplice con due cause che agiscono contemporaneamente su un outcome. Nel caso in cui solamente una delle due venisse modificata, l’outcome potrebbe rimanere invariato non perché la variabile non rappresenti un’effettiva causa, ma semplicemente perché è presente qualche altro fenomeno, cioè la seconda causa, che agisce contemporaneamente al primo e modifica il risultato che ci si attende. In questa situazione, analizzando il fenomeno dal punto di vista controfattuale, si potrebbe giungere alla conclusione errata che la prima variabile non sia una causa della risposta.
I metodi descritti in seguito si concentrano su situazioni in cui si ha ragione di ritenere che il mediatore abbia un ruolo sufficientemente importante nell’effetto che la causa ha sulla risposta. Si cercano degli strumenti che permettano di capire con quale entità l’effetto complessivo possa essere
dovuto alla presenza dell’intermediario. Per questo motivo si fa la distinzione tra tre tipologie di effetto:
• Effetto diretto, cioè l’effetto della causa sull’outcome non dovuto alla
presenza del mediatore.
Figura 4.2 – Modello di mediazione semplice con evidenziato in rosso l’effetto diretto
• Effetto indiretto, cioè l’effetto della causa sull’outcome dovuto alla
presenza del mediatore.
Figura 4.3 – Modello di mediazione semplice con evidenziato in rosso l’effetto indiretto
• Effetto totale, cioè l’effetto complessivo che la causa ha sull’outcome.
Figura 4.4 – Modello di mediazione semplice con evidenziato in rosso l’effetto totale Le definizioni appena fornite servono per iniziare ad avvicinarsi alla mediazione e al modo in cui vengono valutati i legami causali tra le variabili, verranno tuttavia fornite in seguito delle definizioni più formali e corrette di questi effetti utilizzando la notazione propria dell’approccio controfattuale.
Come sarà chiarito meglio successivamente, serviranno assunzioni molto più forti per valutare empiricamente la presenza di mediazione rispetto a quelle necessarie all’identificazione di una causazione complessiva.