• Non ci sono risultati.

4. ANALISI DI MEDIAZIONE

4.4 Mediatori multipl

4.4.2 Inverse Probability Weighting (VanderWeele e Vansteelandt, 2013)

Questo metodo non richiede la specificazione di modelli per i mediatori e può essere applicato con outcome di qualsiasi tipo, tuttavia è stato mostrato che funziona meglio nei casi di esposizione dicotomica o comunque con pochi livelli. Per questo motivo risolve molti problemi che portano i metodi basati sulla regressione presentati nel Paragrafo 4.4.1.

Per il calcolo degli effetti diretti e indiretti marginali (cioè in media rispetto alle covariate), sotto le quattro assunzioni specificate è necessaria fondamentalmente solo la stima di tre medie pesate12:

• 𝐸M𝑌$I

J∗N, ottenuta usando come pesi 𝑃(𝐴 = 𝑎

) 𝑃(𝐴 = 𝑎|𝐶 = 𝑐 •)

⁄ sui

soggetti con esposizione 𝑎∗;

• 𝐸M𝑌$IJN, ottenuta usando come pesi 𝑃(𝐴 = 𝑎) 𝑃(𝐴 = 𝑎|𝐶 = 𝑐⁄ ) sui soggetti

con esposizione 𝑎;

• 𝐸M𝑌$I

J∗N, ottenuta calcolando come prima cosa per ogni soggetto con

esposizione 𝑎∗ i valori predetti per la risposta se il soggetto avesse avuto

esposizione 𝑎 invece di 𝑎∗, ricavando 𝐸M𝑌|𝐴 = 𝑎, 𝑀 = 𝑚

•, 𝐶 = 𝑐•N e

utilizzando poi questi per il calcolo della media pesandoli con 𝑃(𝐴 = 𝑎∗) 𝑃(𝐴 = 𝑎|𝐶 = 𝑐

•)

⁄ .

Una volta ottenute queste stime possono essere calcolati gli effetti di interesse e può essere utilizzato il bootstrap per il calcolo degli intervalli di confidenza. Il Natural Direct Effect sarà identificato dalla differenza 𝐸M𝑌$IJ∗N − 𝐸M𝑌$I

J∗N

e il Natural Indirect Effect dalla differenza 𝐸M𝑌$IJN − 𝐸M𝑌$IJ∗N.

Questo approccio e il precedente hanno in comune il fatto che entrambi sono considerati parametrici e assumono che i modelli utilizzati siano correttamente specificati. L’approccio basato sulla regressione assume che siano correttamente specificati i modelli per la risposta e per ogni mediatore. L’approccio IPW invece richiede che siano correttamente specificati i modelli per la risposta e per l’esposizione (utilizzati per calcolare i pesi). Nel primo

12 L’approccio IPW si basa e trova la giustificazione dell’utilizzo di quei pesi specifici nella

seguente identità (VanderWeele e Vansteelandt, 2013): 𝐸…𝑌$IJ∗† = ‡ 𝐸(𝑌|𝑎, 𝑚, 𝑐)𝑓(𝑀 = 𝑚|𝑎∗, 𝑐)𝑓(𝑐)𝑑𝑚𝑑𝑐 = ‡ 𝐼(𝐴 = 𝑎∗)𝐸(𝑌|𝑎, 𝑀, 𝑐)𝑓(𝑀|𝐴, 𝑐)𝑓(𝑐)𝑑𝑀𝑑𝐴𝑑𝑐 = ‡ 𝐼(𝐴 = 𝑎∗) 𝑃(𝐴 = 𝑎∗|𝑐)𝐸(𝑌|𝑎, 𝑀, 𝑐)𝑓(𝑀, 𝐴, 𝑐)𝑑𝑀𝑑𝐴𝑑𝑐 = 𝐸 ‰ 𝐼(𝐴 = 𝑎∗) 𝑃(𝐴 = 𝑎∗|𝑐)𝐸(𝑌|𝑎, 𝑀, 𝑐)Š = 𝐸 ‰𝑃(𝐴 = 𝑎 ∗) 𝑃(𝐴 = 𝑎∗|𝑐)𝐸(𝑌|𝑎, 𝑀, 𝑐)|𝐴 = 𝑎∗Š

caso non sono necessari modelli per l’esposizione, mentre nel secondo non sono necessari quelli per i mediatori (VanderWeele e Vansteelandt, 2013).

Non è stato ancora affrontato però il caso in cui si sia interessati ad un solo mediatore ma siano presenti altri mediatori precedenti a questo, influenzati dall’esposizione, che a loro volta influenzano sia il mediatore di interesse sia l’outcome. È questo il passaggio che permetterà poi di ampliare il discorso valutando i fenomeni da un punto di vista non solo trasversale ma anche longitudinale.

Nelle situazioni in cui l’assunzione (4.27) viene violata, come è stato precedentemente detto, i metodi di regressione (Paragrafo 4.3) non permettono di ottenere stime non distorte per il 𝐶𝐷𝐸(𝑚), mentre 𝑁𝐷𝐸 e 𝑁𝐼𝐸 non sono identificati. Per cercare di rimediare a queste situazioni, sono stati creati degli approcci alternativi per il calcolo degli effetti in situazioni nelle quali solitamente non sarebbero identificati.

Sia 𝐿 la variabile confondente per la relazione tra mediatore e risposta, influenzata dall’esposizione (Figura 4.5). Se si volesse calcolare il 𝐶𝐷𝐸(𝑚) di 𝐴 su 𝑌 considerando solamente i pathway che non includono 𝑀, è come se si cercasse l’effetto di due percorsi: 𝐴 − 𝑌 e 𝐴 − 𝐿 − 𝑌 (Figura 4.6).

Figura 4.6 – Modello di mediazione in cui è presente un confondente (𝐿) nella relazione tra mediatore e outcome influenzato dall’esposizione. In rosso sono evidenziati i

In questa situazione specifica i metodi esposti nel Paragrafo 4.3 non funzionano poiché 𝐿 si trova nel percorso dall’esposizione all’outcome e allo stesso tempo rappresenta un confondente per la relazione tra mediatore e outcome. A livello intuitivo, è possibile vedere che gli approcci precedentemente mostrati non portano a risultati affidabili supponendo inizialmente di inserire 𝐿 insieme alle altre covariate nella regressione per la risposta. Attraverso questo controllo verrebbe bloccando il percorso 𝐴 − 𝐿 − 𝑌 a cui si è interessati. Si potrebbe quindi pensare di non includere la variabile insieme alle altre covariate, ma questo porterebbe comunque a stime distorte in quando non verrebbe controllato l’effetto di confondimento che 𝐿 ha nella relazione tra 𝑀 e 𝑌 (VanderWeele, 2015).

Per poter calcolare correttamente il 𝐶𝐷𝐸(𝑚) nelle situazioni in cui i metodi di regressione falliscono, si può far ricorso a due diverse categorie di modelli: i

marginal structural models (MSM) (Robins et al., 2000; VanderWeele, 2009)

e gli structural mean models (SMM) (Robins, 1999). Verranno approfonditi solamente i primi, ma è importante evidenziare come entrambe le categorie di modelli sono nate per gestire situazioni in cui l’esposizione è tempo- dipendente al di fuori della mediazione e poi sono state ampliate per gestire anche scenari differenti.

Rispetto a prima sarà necessario modificare l’ assunzione (4.14) in quanto è fondamentale che non siano presenti confondenti non misurati nella relazione tra il mediatore e l’outcome anche condizionatamente a 𝐿, cioè

𝑌$H ⊥ 𝑀|𝐴, 𝐶, 𝐿 (4.40)

Se la prima assunzione (4.13) e la seconda modificata (4.40) sono valide allora si può procedere con i metodi basati su MSM e SMM.

I MSM (Robins, 1996; Robins et al., 2000) sono modelli direttamente per le medie degli outcome controfattuali adattati attraverso la tecnica dell’inverse

regressioni. L’idea alla base è quella di regredire 𝑌 sull’esposizione (𝐴) e sul mediatore (𝑀) controllando per le covariate (𝐶) e per le variabili (𝐿) che violano l’assunzione (4.27), mediante un sistema di pesi.

Sono necessari per questo motivo due gruppi di pesi, uno per l’esposizione e l’altro per il mediatore.

Ipotizzando per semplicità l’esposizione dicotomica, per ogni individuo 𝑖 verrà calcolato

𝜔Œ = 𝑃(𝐴 = 𝑎

•) 𝑃(𝐴 = 𝑎⁄ •|𝐶 = 𝑐•) (4.41)

in cui a denominatore si trova la probabilità che l’individuo riceva il trattamento che effettivamente ha ricevuto condizionatamente al valore delle covariate che può essere visto come qualcosa di simile ad un propensity score (Rosenbaum e Rubin, 1983).

Se i soggetti non hanno ricevuto il trattamento allora i pesi relativi all’esposizione saranno

𝜔Œ = (1 − 𝑃(𝐴 = 𝑎

•)) (1 − 𝑃(𝐴 = 𝑎⁄ •|𝐶 = 𝑐•)) (4.42)

Il nome del metodo deriva proprio dalla quantità che viene posta a denominatore dei pesi mentre al numeratore si trova semplicemente la proporzione dei soggetti esposti e non esposti nella popolazione rispettivamente.

Allo stesso modo per quanto riguarda il mediatore, per ogni soggetto 𝑖 verrà calcolato

𝜔I = 𝑃(𝑀 = 𝑚

•) 𝑃(𝑀 = 𝑚⁄ •|𝐴 = 𝑎•, 𝐶 = 𝑐•, 𝐿 = 𝑙•) (4.43)

E analogamente a quanto fatto per l’esposizione, in caso di mediatore dicotomico potranno essere utilizzati i complementi a 1 di queste probabilità per i soggetti con valore diverso del mediatore.

I pesi globali sono ottenuti come 𝜔• = 𝜔•Œ𝜔•I e vengono utilizzati in maniera

diretta nella regressione

𝐶𝐷𝐸(𝑚) = 𝛾*(𝑎 − 𝑎∗) + 𝛾S𝑚(𝑎 − 𝑎∗) (4.45)

Il controllo per le covariate viene quindi svolto mediante un sistema di pesi invece che con delle regressioni. Non vengono inserite le covariate nella regressione di Y ma viene semplicemente svolta una regressione pesata della risposta su esposizione e mediatore.

L’inclusione della variabile confondente 𝐿 solamente all’interno del denominatore dei pesi per il mediatore è quello che permette di aggirare il problema che si presentava con i metodi di regressione precedentemente mostrati, per cui le stime risultavano distorte sia nel caso in cui si attuasse un controllo per 𝐿 sia che non fosse attuato.

Nel calcolo degli standard error viene utilizzato lo stimatore sandwich che permette di tenere conto del sistema di pesi utilizzato.

Le probabilità all’interno dei pesi possono essere calcolate mediante l’utilizzo di regressioni logistiche nel caso in cui le variabili siano binarie, altrimenti si può far ricorso a delle regressioni logistiche ordinali, a delle multinomiali oppure utilizzando le distribuzioni di densità della variabile a seconda della natura dell’esposizione e del mediatore. È stato mostrato che con variabili continue questo metodo non risulta funzionare bene.

L’approccio funziona anche in assenza di 𝐿 e rappresenta una valida alternativa a quello basato sulla regressione (VanderWeele, 2015).

È già stato evidenziato che in caso di violazione della quarta assunzione, 𝑁𝐷𝐸 e 𝑁𝐼𝐸 non sono identificati, tuttavia è possibile ottenere degli analoghi basati su interventi randomizzati sul mediatore che prendono il nome di randomized

intereventional analogues di 𝑁𝐷𝐸 e 𝑁𝐼𝐸.

Generalmente ci si è sempre focalizzati su cosa sarebbe successo ad un soggetto esposto se fosse stato fissato il mediatore al valore che avrebbe assunto nel caso in cui il soggetto non fosse stato esposto. Adesso invece si considera un prospettiva differente, cioè cosa sarebbe successo ad un soggetto

esposto se venisse fissato il mediatore ad un valore estratto casualmente dalla popolazione non esposta.

Questa ottica differente permette di identificare degli analoghi di 𝑁𝐷𝐸 e 𝑁𝐼𝐸. Sia 𝐺$|5 un’estrazione casuale dalla distribuzione di 𝑀 tra coloro con 𝐴 = 𝑎 e

condizionatamente ai valori assunti dalle covariate 𝐶 = 𝑐.

Siano 𝑎 e 𝑎∗ i due valori che si vogliono confrontare, allora è possibile definire

• L’effetto sull’outcome di assegnare casualmente un individuo esposto ad

un valore del mediatore dalla sua distribuzione tra gli esposti rispetta a quella dei non esposti

𝑁𝐼𝐸• = 𝐸 …𝑌 $•J|‘† − 𝐸 …𝑌$•J∗|‘† = 4 𝐸(𝑌|𝑎, 𝑙, 𝑚, 𝑐)𝑃(𝑙|𝑎, 𝑐){𝑃(𝑚|𝑎, 𝑐) ’,H − 𝑃(𝑚|𝑎∗, 𝑐)} (4.46)

• L’effetto di essere esposto rispetto a non essere esposto con il valore del

mediatore estratto entrambe le volte dalla sua distribuzione dei non esposti 𝑁𝐷𝐸• = 𝐸 …𝑌 $•J∗|‘† − 𝐸 …𝑌$∗ J∗|‘† = 4 {𝐸(𝑌|𝑎, 𝑙, 𝑚, 𝑐)𝑃(𝑙|𝑎, 𝑐) ’,H − 𝐸(𝑌|𝑎∗, 𝑙, 𝑚, 𝑐)𝑃(𝑙|𝑎, 𝑐)}𝑃(𝑚|𝑎, 𝑐) (4.47)

• L’effetto sull’outcome di essere esposto rispetto a non esserlo con il valore

del mediatore estratto casualmente rispettivamente dalla distribuzione degli esposti e quella dei non esposti

𝑇𝐸• = 𝐸 …𝑌

𝑇𝐸• = 𝑁𝐷𝐸+ 𝑁𝐼𝐸(4.49)

Questi effetti sono identificati sotto le assunzioni (4.13), (4.15) e (4.40). La quarta assunzione quindi può essere rilasciata e non è necessaria per l’identificazione di questi effetti poiché il mediatore viene fissato ad un livello che è estratto casualmente dalla distribuzione del mediatore tra coloro con una particolare esposizione e non al livello che avrebbe assunto per quel soggetto se fosse stato esposto diversamente (VanderWeele, 2015).

Se non ci sono variabili confondenti come 𝐿 e vengono rispettate le assunzioni (4.13 – 4.16) allora gli effetti coincideranno con quelli veri.

Per la stima degli intervalli di confidenza di questi effetti si usano generalmente le tecniche di bootstrap.