Master in EBP e
Metodologia della ricerca
Associazione e confondimento
17 marzo 2016
mattina/pomeriggio 2° parte
Lezioni a cura di Laura Dallolio
([email protected])
12
Dalla descrizione degli eventi spesso
scaturiscono nuove ipotesi circa le cause che ne hanno potuto provocare o facilitare
l’insorgenza.
EPIDEMIOLOGIA DESCRITTIVA
Studia la distribuzione di una malattia nella popolazione.
Utilizza le misure di frequenza (o di
occorrenza…da occur): prevalenza, incidenza,
tassi grezzi e standardizzati
3
James V. Lacey Jr.,* Susan S. Devesa, and Louise A. Brinton Recent Trends in Breast Cancer Incidence and Mortality Environmental and Molecular Mutagenesis 39:82–88 (2002)
Dalla descrizione degli eventi spesso scaturiscono nuove ipotesi circa le cause che ne hanno potuto provocare o facilitare l’insorgenza.
4
Epidemiologia Descrittiva
Epidemiologia Analitica
Ricerca d’indizi Indizi disponibili
Formula ipotesi Verifica Ipotesi
Risposte: quanto, chi Risposte: Perchè
5
La correlazione tra alimentazione a base di carni rosse e insorgenza dei tumori del seno è tradizionalmente poco chiara, per questo motivo
i ricercatori del Department of Medicine del Brigham and Women’s Hospital e della Harvard Medical School hanno condotto uno studio epidemiologico per indagare questa possibile associazione studiando i dati riguardanti 90.659 donne in fase pre-menopausale dai 26 ai 46 anni di età.
ESPOSIZIONE ESITO
CAUSA EFFETTO Carne rossa aumento TUMORE
Mangiare carne rossa aumenta il rischio di tumore al seno?
Una volta formulata l’ipotesi è però necessario possedere gli strumenti metodologici indispensabili per indagare le relazioni causa-effetto eventualmente esistenti.
7
Come fanno gli epidemiologi a capire se tra
un’esposizione ed un esito c’è effettivamente una relazione causa-effetto?
Primo passo: dimostrare che esiste
un’associazione statistica tra esposizione ed esito Se si riesce a dimostrare che in un gruppo di
esposti l’incidenza di malattia è superiore rispetto a quella misurata in un gruppo omogeneo di non esposti, si può cominciare ad ipotizzare che fra
quella esposizione e quella malattia esiste un nesso
di causalità.
8
Popolazione in studio
2000
Esposti 1000
Non esposti 1000
Malati 45
Non malati 955 Malati
15
Non malati 985
Follow-up 10 anni
L’obiettivo di uno studio epidemiologico è quello di “misurare” quello che “veramente” accade nella
popolazione.
9
esposte
non esposte malate sane
malate sane
E+
E-
M+ M-
45 955
15 985
1000
1000
Rischio Relativo
I E+
I E-
45/1000 15/1000
= 3
=
a b
c d
a/(a+b)
=
c/(c+d)
=
La tabella 2x2 o tabella di contingenza
=
0,045 0,015
10
La tabella 2x2
o tabella di contingenza
Incidenza di tumore nelle donne esposte
Incidenza di tumore nelle donne NON esposte
= =
11
RISCHIO RELATIVO
12
Interpretazione del rischio relativo
13
Popolazione in studio 90659 donne
in fase premenopausale
che non hanno mai ricevuto
una diagnosi di tumore al seno
Esposte
Carne = o > 1,5 volte al giorno
8649 donne
Non esposte
Carne < 1,5 volte al giorno
82010 donne
Malate
117 casi
Non malate 8532 Malate
904 casi
Non malate 81106
Follow-up di 12 anni
Il consumo di carne rossa è stato misurato mediante questionari sui regimi alimentari sottoposti alle pazienti ogni 4 anni
nell'arco di 12 anni: i casi registrati di carcinoma invasivo della mammella sono stati 1021.
14
esposti
non esposti malate sane
malate sane
E+
E-
M+ M-
117 8532
904 81106
8649
82010
Rischio Relativo
I E+
I E-
117/8649 904/82010
= 1,23
=
a b
c d
a/(a+b)
=
c/(c+d)
=
La tabella 2x2 o tabella di contingenza
=
0,0135 0,0110
5-1=4 400%
Le persone esposte hanno un eccesso di rischio del 400%0,5-1=-0,5 -50%
Le persone esposte hanno un rischio minore del 50%Le persone esposte hanno un rischio dell’0%
1-1=0 0%
16
Se in un articolo scientifico si trova riportata la dizione RR=2 come si interpreta?
Esiste un’associazione positiva tra l’esposizione e l’esito.
Il rischio relativo (RR) ci permette di quantificare questa
associazione e possiamo affermare che gli esposti hanno un
rischio di ammalare che è 2 volte maggiore (doppio) di quello dei non esposti.
Lo stesso risultato può essere espresso in termini di eccesso di rischio, possiamo quindi dire (ed è la stessa cosa rispetto
all’affermazione di prima) che gli esposti hanno un rischio di ammalarsi del 100% in più rispetto ai non esposti, ovvero
facciamo 2 -1=1 (dove 1 corrisponde a nessuna associazione tra esposizione e malattia) e 1 lo esprimiamo poi in
percentuale (100%).
17
Se in un articolo scientifico si trova riportata la dizione RR=0,7 come si interpreta?
Esiste un’associazione negativa tra l’esposizione e l’esito.
Il rischio relativo (RR) ci permette di quantificare questa
associazione e possiamo affermare che gli esposti hanno un
rischio di ammalare che è 0,7 volte inferiore di quello dei non esposti.
Lo stesso risultato può essere espresso dicendo che gli esposti hanno un rischio di ammalarsi del 30% meno rispetto ai non esposti, ovvero facciamo 0,7 -1= -0,30 (dove 1 corrisponde a nessuna associazione tra esposizione e malattia) e 1 lo
esprimiamo poi in percentuale (-30%).
Quiz di verifica
Il rischio relativo (RR):
A. costituisce una misura della forza dell’associazione tra fattore di rischio e malattia.
B. stima come il fattore di esposizione aumenta la probabilità di ammalarsi.
C. è dato dal rapporto: Incidenza negli Esposti/ Incidenza nei non esposti
D. tutte le precedenti sono vere.
E. Solo A e C
Se l’incidenza di tumore negli esposti a un fattore di rischio
ambientale è di casi 4 ogni 100.000 e quella nei non esposti è di 1 caso ogni 100.000 il rischio relativo (RR) è:
A. 0,4 B. 4 C. 3
D. nessuna delle precedenti
Se in un articolo scientifico si trova riportata la dizione “RR=1,5”
A. Il fattore di rischio in studio aumenta di 1,5 volte in più il rischio di malattia
B. Il fattore di rischio in studio aumenta del 50% in più il rischio di malattia
C. Il rischio di malattia negli esposti è 15 volte superiore a quella dei non esposti.
D. Il fattore di rischio è ininfluente rispetto al rischio di malattia E. Solo A e B
Un rischio relativo < 1:
A. Suggerisce un effetto protettivo dell’esposizione in studio B. Suggerisce un fattore di rischio dell’esposizione in studio.
C. Il rischio relativo non può essere < 1
20
Esperienza di malattia di una popolazione esposta
Esperienza di malattia della stessa
popolazione in
assenza di esposizione
Ogni persona dovrebbe vivere la stessa esperienza due volte, una da esposto e una da non
esposto…questa situazione ideale viene detta ideale controfattuale
I due gruppi a confronto dovrebbero essere il
più possibile uguali o omogenei o confrontabili
NON ESPOSTE ESPOSTE
RR= 2
22
Tumore al SENO CARNE ROSSA
Età
Esposizione Esito
Confondente
?
Confondimento
• Si intende per confondimento quella situazione in cui l’associazione osservata tra un fattore di
esposizione e un determinato esito di salute è in realtà dovuta interamente o parzialmente ad un terzo fattore definito confondente.
• Il confondimento si verifica perché le popolazioni a confronto non sono perfettamente omogenee tra di loro
• Il confondimento è un problema centrale in
epidemiologia (un po’ di confondimento si dice c’è
in tutti gli studi).
Confondimento
Il confondimento è un problema centrale in
epidemiologia, in particolare è un problema degli studi osservazionali.
L’eterno triangolo
Esposizione
Esito
Confondente
CONFONDERE: 1 vtr mescolare insieme disordinatamente 2 vtr scambiare per errore
Vivere nei pressi di un inceneritore aumenta il rischio di ammalarsi di tumore?
pop A pop B
RR 4,5/1,5=
=3 Incidenza di tumore
45/1000=4,5% Incidenza di tumore
15/1000=1,5%
Pop A
età
Inceneritore Aumentato
numero di tumori
Pop B
Proporzione di casi di tumore 25-39 anni 3/300= 0.01 * 100 =1%
Proporzione di casi di tumore oltre i 40 anni 42/700= 0,06* 100 =6%
Popolazione A Popolazione B
Proporzione di casi di tumore 25-39 anni 9/900= 0.01 * 100 =1%
Proporzione di casi di tumore oltre i 40 anni 6/100= 0,06* 100 =6%
Tutto il campione
(n=2000)
TUMORE
SI NO totale
E+ 45 955 1000
E- 15 985 1000
RR=4,5% ÷1,5%= 3 (95% CI 1,7-5,4)
Campione di persone con età solo tra 25-39
anni
TUMORE
SI NO totale
E+ 3 297 300
E- 9 891 900
Campione di persone con età solo > 40
anni
TUMORE
SI NO totale
E+ 42 658 700
E- 6 94 100
RR=1%÷1%= 1 RR=6%÷6%= 1
ANALISI STRATIFICATA
INCENERITORE TUMORE ETA’
?
Cosa ci fa capire l’analisi dei RR tra strati
Il RR grezzo è diverso dai RR dei due strati di età che sono simili (omogenei) tra loro
Quando i RR negli strati diversi dal RR grezzo e simili tra loro, allora siamo in presenza di confondimento e il RR giusto è quello dell’analisi stratificata
La stratificazione ci consente di individuare
la presenza di confondimento.
Esempio di confondimento totale
Prevalenza della sindrome di Down alla nascita in relazione all’ordine di nascita
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8
1 figlio
2 figlio
3 figlio
4 figlio
5 figlio
o +
casi su 1000 nati vivi
Esempio tratto da “Epidemiology: an introduction” di K.J. Rothman
Prevalenza della Sindrome di Down per età materna
0 1 2 3 4 5 6 7 8 9
20-24 25-29 30-34 35-39 40
casi su 1000 nati vivi
Prevalenza della Sindrome di Down per ordine di nascita ed età materna
1 figlio 2 figlio
3 figlio 4 figlio 0
1 2 3 4 5 6 7 8 9
< 20
20-24 25-29
30-34 35-39 40 +
1 figlio 2 figlio 3 figlio 4 figlio
ORDINE DI NASCITA SINDROME DI DOWN ETA’ MATERNA
L’effetto dell’ordine di nascita è in realtà confuso dall’effetto dell’età materna.
?
Confondimento
• Il confondimento è un problema centrale in
epidemiologia: un po’ di confondimento si dice c’è in tutti gli studi
• Si intende per confondimento quella situazione in cui l’associazione osservata tra un fattore di
esposizione e un determinato esito di salute è in realtà dovuta interamente o parzialmente ad un terzo fattore definito confondente
• Il confondimento è più facile da capire attraverso
un esempio che dalle definizioni
CARATTERISTICHE ESSENZIALI DI UN CONFONDENTE.
Perché si realizzi confondimento, è necessario che il confondente soddisfi due condizioni essenziali:
•
deve essere associato all’esito, cioè deve essere un fattore di rischio
della malattia in studio
•
deve essere distribuito in modo
diseguale tra i gruppi a confronto
Esito
Infarto si Infarto no totale
Esposizione Alcol si 71 52 123
Alcol no 29 48 77
Calcola l’incidenza di infarto negli esposti all’alcol: 0,577 Calcola l’incidenza di infarto nei non esposti: 0,377
Calcola il RR: 0,577/0,377=1,53
C’è associazione tra alcol e infarto? Si’, coloro che assumono alcol hanno un eccesso di rischio di infarto del 53%.
ESEMPIO 1
Il consumo di alcol aumenta il rischio di infarto?
Esposti (alcol si)
Non esposti (alcol no)
Età anni 67 68
Maschi (%) 68% 69%
Fumo 80,38% 14,28%
Tabella 1. Caratteristiche dei gruppi a confronto alle baseline I gruppi a confronto sono omogenei?
O potrebbe esserci confondimento?
Tra gli esposti c’è una maggiore concentrazione di persone che fumano
ALCOL INFARTO FUMO
Esiste veramente l’associazione tra alcol e infarto?
O il fumo potrebbe essere la sola spiegazione dell’associazione trovata?
?
Calcoliamo l’associazione tra alcol e infarto prima solo tra i fumatori poi tra i non fumatori
Solo NON fumatori
Infarto si Infarto no totale
Esposizione Alcol si 63 36 99
Alcol no 7 4 11
Incidenza di infarto negli esposti all’alcol: 63/99=0,636 Incidenza di infarto nei non esposti: 7/11= 0,636
RR= 0,636/0,636=1
Solo fumatori
Infarto si Infarto no totale
Esposizione Alcol si 8 16 24
Alcol no 22 44 66
Incidenza di infarto negli esposti all’alcol: 8/24=3 Incidenza di infarto nei non esposti: 22/66= 3
RR= 3/3=1
ALCOL INFARTO FUMO
L’effetto dell’alcol sull’infarto è in realtà confuso dall’effetto del fumo.
?
Confondimento: che cosa comporta -L’associazione dell’esposizione con l’esito può essere attribuita totalmente o in parte al fattore di confondimento
-Il confondimento può causare una
sovrastima o una sottostima della reale associazione tra esposizione ed esito.
Può addirittura cambiare la direzione
dell’associazione
FUMATORI
età
Fumo Aumentato rischio di infarto
NON FUMATORI
Incidenza di infarto: 10 su 1000 Incidenza di infarto: 1 su 1000 RR=
10/1=10
RR aggiustato per età=4
Esempio di confondimento parziale: l’associazione esiste realmente
Confondimento
• Dovrebbe essere “prevenuto”
• Se non è possibile prevenirlo, deve
essere controllato (corretto) in fase di analisi dei dati
STRATIFICAZIONE
STANDARDIZZAZIONE
ANALISI MULTIVARIATA
Come si controlla il confondimento
In fase di Disegno di studio
– Randomizzazione – Restrizione
– Appaiamento (matching)
In fase di Analisi
– Standardizzazione
– Analisi stratificata
– Analisi multivariata
Prevenire il confondimento con la RANDOMIZZAZIONE
• Assegnazione casuale dei soggetti ai gruppi in studio (trattati/non trattati; esposti/non esposti)
• Procedura applicabile UNICAMENTE negli studi sperimentali
• Per campioni sufficientemente grandi:
assicura che tutti i potenziali confondenti,
noti e non noti, siano distribuiti in modo
omogeneo tra i gruppi in studio
NON ESPOSTE ESPOSTE ESPOSIZIONE CASUALE AL
TRATTAMENTO O RANDOMIZZAZIONE
Il disegno di una sperimentazione clinica
GRUPPO DI TRATTAMENTO
randomizzazione
POPOLAZIONE STUDIATA (CAMPIONE)
GRUPPO DI CONTROLLO
CONFRONTO ESITI
simili
T E M P O
POPOLAZIONE GENERALE
% esiti favorevoli % esiti favorevoli
PREVENIRE il confondimento con la RESTRIZIONE
-Limitare i criteri di l’ammissibilità allo studio:
includere solo gli individui che hanno lo stesso valore della variabile confondente -Ciò che NON varia NON può agire come
confondente
-Può essere utilizzato sia negli studi
sperimentali che in quelli non sperimentali -Metodo semplice ed economico
- ↑validità ma ↓generalizzabilità
PREVENIRE il confondimento con l’APPAIAMENTO
- Selezione dei soggetti in studio in modo tale che i potenziali confondenti siano
“omogeamente” distribuiti nei gruppi a confronto
– Es: Infarto e attività fisica: potenziali
confondenti genere, età e abitudine al fumo ATTIVITA’ FISICA +: donna, forte fumatrice,
età 65 aa
ATTIVITA’ FISICA -: donna, forte fumatrice,
età 65 aa
Negli studi osservazionali
-Il confondimento è una conseguenza dell’assenza di randomizazzione, cioè
dell’assegnazione casuale degli individui nei gruppi in studio
-Il controllo del confondimento in fase di analisi
è un RIMEDIO alla non randomizzazione
ANALISI STRATIFICATA ANALISI MULTIVARIATA
• permette di controllare simultaneamente diversi fattori confondenti
• si basa su modelli matematici:
regressione multipla lineare
regressione logistica
CONTROLLARE il confondimento
durante l’ANALISI dei DATI
53
Analisi statistica MULTIVARIATA
Considerato che spesso le potenziali variabili confondenti sono molte, sarebbe difficile costruire tanti strati e tante tabelle separate per tutti i potenziali confindenti.
Si utilizzano allora modelli matematici di analisi multivariata per supplire a questa difficoltà.
L’analisi multivariata permette di stimare il RR tra
l’esposizione e l’esito al netto dei fattori di confondimento, eliminando cioè il loro effetto sulla lettura dell’associazione tra determinante di malattia e malattia in studio.
I RR in questo caso si dicono AGGIUSTATI (adjusted).
NON ESPOSTE ESPOSTE
RR= 2
INCIDENZA= 1/1000 INCIDENZA= 2/1000
55
Tumore al SENO CARNE
Età
Esposizione Esito
Confondente
?
•BMI
•Famigliarità
•Fumo
•Uso di contraccettivi orali
…ecc…ovvero tutti i fattori di rischio del tumore al seno
56
NON ESPOSTE ESPOSTE Negli studi SPERIMENTALI
Negli studi osservazionali
-Il confondimento è una conseguenza dell’assenza di randomizazzione, cioè
dell’assegnazione casuale degli individui nei gruppi in studio
-Il controllo del confondimento in fase di analisi
è un RIMEDIO alla non randomizzazione
Quando si pianifica lo studio:
•cercare in letteratura i possibili confondenti (fattori di rischio della malattia in studio che potrebbero
essere casualmente o non casualmente sbilanciati tra i gruppi a confronto)
•raccogliere l’informazione sui confondenti (negli RCT: per vedere se la randomizzazione ha avuto
successo; negli studi osservazionali: per stratificare o aggiustare).
Quando si legge un articolo chiedersi se gli Autori si sono posti il problema del confondimento e, se hanno aggiustato, leggere sempre i RR multivariate o
adjusted.
RICORDARSI DI:
• prevedere in anticipo la raccolta di informazioni su potenziali confondenti
→
Ci sono alcuni confondenti comuni:• Età
• sesso
• occupazione
• scolarità
→ Gli altri sono da cercare in letteratura (fattori di rischio della malattia in studio)