1
I bias negli studi epidemiologici.
Elementi di statistica descrittiva ed
inferenziale. L’epidemiologia sperimentale.
Le revisioni sistematiche e le metanalisi:
concetti fondamentali
Prof. Paolo Villari paolo.villari@uniroma1.it
Dipartimento di Sanità Pubblica e Malattie Infettive Sapienza Università di Roma
2
Le misure di associazione
ESERCIZIO 3
Negli anni ‘20, sulla base di osservazioni cliniche, è stata ipotizzata l’esistenza di una relazione causale tra il tumore polmonare ed il fumo di sigaretta.
Tra il 1930 ed il 1960 sono stati condotti numerosi studi epidemiologici per valutare questa apparente associazione, due studi sono stati fatti da Doll e Hill in Gran Bretagna.
Il primo è uno studio caso-controllo, iniziato nel 1947, nel quale sono state confrontate le abitudini al fumo di pazienti con un tumore del polmone e pazienti con altre patologie.
Il secondo, iniziato nel 1951, è uno studio di coorte che ha registrato le cause di
morte dei medici inglesi in relazione alle loro abitudini al fumo .
STUDIO CASO-CONTROLLO
I dati sono stati ottenuti da pazienti ricoverati negli ospedali di Londra e dintorni per un periodo di 4 anni (aprile 1948-febbraio 1952).
Agli ospedali (20 all’inizio dello studio e aumentati successivamente) è stato chiesto di segnalare ai ricercatori tutti i pazienti ricoverati con una prima diagnosi di cancro al polmone. Questi pazienti sono stati poi intervistati per conoscere le loro abitudini al fumo;
analoghe interviste sono state condotte tra i pazienti con altre diagnosi (principalmente patologie a carattere non maligno) ospedalizzati nello stesso periodo di tempo nello stesso ospedale.
Tabella 1 – Distribuzione per abitudine al fumo dei casi di tumore polmonare e dei controlli. Maschi.
Abitudine al fumo Casi Controlli
Fumatore 1350 1296
Non Fumatore 7 61
Totale 1357 1357
Domanda 1: Valutare l’associazione tra tumore del polmone e fumo di sigaretta calcolando l’appropriata misura di associazione (utilizza i dati della tabella 1)
STUDIO CASO-CONTROLLO
Tabella 1 – Distribuzione per abitudine al fumo dei casi di tumore polmonare e dei controlli. Maschi.
Abitudine al fumo Casi Controlli
Fumatore 1350 1296
Non Fumatore 7 61
Totale 1357 1357
Domanda 1: Valutare l’associazione tra tumore del polmone e fumo di sigaretta calcolando l’appropriata misura di associazione (utilizza i dati della tabella 1)
La misura di associazione appropriata per lo studio caso-controllo è l’ODDS RATIO.
OR= (1350*61)/(1296*7)= 9.08
STUDIO CASO-CONTROLLO
Tabella 2 - Distribuzione per numero medio di sigarette al giorno dei casi di tumore polmonare e dei controlli.
Numero di sigarette al giorno Casi Controlli
0 7 61
1 - 14 565 706
15 - 24 445 408
≥25 340 182
Tutti i fumatori 1350 1296
Totale 1357 1357
Domanda 2: Evidenziare la presenza di un eventuale dose risposta (utilizza i dati della tabella 2; calcolare tre OR)
OR1-14 = (565*61)/(706*7)=6.97
OR15-24 = (445*61)/(408*7)=9.50
OR≥25 = (340*61)/(182*7)=16.28
565 706
7 61
445 408
7 61
340 182
7 61
STUDIO DI COORTE
I dati per lo studio di coorte sono stati ottenuti dalle liste degli iscritti all’Ordine dei Medici della Gran Bretagna (British Medical Register) residenti in Inghilterra e Galles all’ottobre 1951. L’informazione sulle abitudini al fumo nel presente e nel passato sono state raccolte attraverso un questionario. L’informazione sulla eventuale presenza di tumore polmonare è stata ottenuta dal certificato di morte e altri dati di mortalità raccolti negli anni successivi.
Tabella 3 – Abitudini al fumo e mortalità per tumore polmonare in una coorte di medici inglesi
Numero di sigarette fumate al giorno
Casi di tumore del polmone Anni-persona a rischio
0 3 42.800
1 - 14 22 38.600
15 - 24 54 38.900
≥25 57 25.100
Tutti i fumatori 133 102.600
Totale 136 145.400
Domanda 1: Valutare l’associazione tra tumore al polmone e fumo di sigaretta, evidenziando anche la presenza di una eventuale relazione dose-risposta.
STUDIO DI COORTE
Tabella 3 – Abitudini al fumo e mortalità per tumore polmonare in una coorte di medici inglesi
Numero di sigarette fumate al giorno
Casi di tumore del polmone Anni-persona a rischio
0 3 42.800
1 - 14 22 38.600
15 - 24 54 38.900
≥25 57 25.100
Tutti i fumatori 133 102.600
Totale 136 145.400
Domanda 1: Valutare l’associazione tra tumore al polmone e fumo di sigaretta, evidenziando anche la presenza di una eventuale relazione dose-risposta.
Calcoliamo per prima cosa il tasso di incidenza del tumore polmonare negli esposti (tutti i fumatori) e nei non esposti (non fumatori).
Iexp+ =133/102.600=0,0013 Iexp-=3/42.800=0,00007
La misura di associazione nello Studio di Coorte è il RISCHIO RELATIVO.
RR=0,0013/0,00007= 18,57
STUDIO DI COORTE
Tabella 3 – Abitudini al fumo e mortalità per tumore polmonare in una coorte di medici inglesi
Numero di sigarette fumate al giorno
Casi di tumore del polmone Anni-persona a rischio
0 3 42.800
1 - 14 22 38.600
15 - 24 54 38.900
≥25 57 25.100
Tutti i fumatori 133 102.600
Totale 136 145.400
Calcoliamo ora i tassi di incidenza del tumore polmonare negli esposti in base al numero di sigarette fumate al giorno ed i RR corrispondenti.
I1-14 =22/38.600=0,0006 RR1-14 =0,0006/0,00007= 8,57 I15-24 =54/38.900=0,0014 RR15-24 =0,0014/0,00007= 20 I≥25=57/25.100=0,0023 RR≥25=0,0023/0,00007= 32,86
CONFRONTO STUDIO CASO-CONTROLLO E STUDIO DI COORTE
CASO CONTROLLO
OR
exp= 9.08 OR
1-14=6.97 OR
15-24=9.50 OR
≥25=16.28
COORTE RR
exp= 18,57
RR
1-14= 8,57
RR
15-24= 20
RR
≥25=32,86
11
•La storia naturale delle malattie. Concetti di salute e malattia. Valutazione
dell’efficacia dei tests diagnostici: sensibilità, specificità e valori predittivi. I livelli di prevenzione. Gli screening.
•Definizione ed obiettivi dell’epidemiologia. Classificazione degli studi
epidemiologici. Metodologia e strumenti dell’epidemiologia descrittiva. Misure di frequenza di malattia.
•Metodologie e strumenti dell’epidemiologia analitica. Le misure di associazione.
• I bias negli studi epidemiologici. Elementi di statistica descrittiva ed
inferenziale. L’epidemiologia sperimentale. Le revisioni sistematiche e la meta- analisi. Concetti fondamentali .
STUDI DI EPIDEMIOLOGIA ANALITICA ERRORI SISTEMATICI (BIAS)
BIAS DI SELEZIONE
Si verifica quando il reclutamento dei soggetti in uno studio non dipende solo dai criteri di inclusione
esempio: l’inclusione di un caso in uno studio caso-controllo è influenzata dallo stato di esposizione
BIAS DI INFORMAZIONE (MISCLASSIFICAZIONE)
Si verifica quando i soggetti vengono erroneamente classificati relativamente allo stato di esposizione o di malattia
esempio: il ricordo di un’esposizione può essere più probabile in
uno dei gruppi selezionati (casi)
CONFONDIMENTO
SI VERIFICA QUANDO UNA “VARIABILE ESTERNA”
MODIFICA (ANNULLA, RIDUCE, AUMENTA) L’ASSOCIAZIONE TRA L’ESPOSIZIONE E LA
PATOLOGIA ESPOSIZIONE
(consumo di caffè) MALATTIA
(mal. cardiovascolari)
VARIABILE DI CONFONDIMENTO
(fumo di sigaretta)
CONFONDIMENTO:
UN ESEMPIO
FUMATORI
LUNG CANCER
NO LUNG CANCER COFFEE
160 640 800
NO
COFFEE 40 160 200
RR = (160/800)/(40/200) = 1
NON FUMATORI
LUNG CANCER
NO LUNG CANCER COFFEE
10 190 200
NO
COFFEE 40 760 800
RR = (10/200)/(40/800) = 1
LUNG CANCER
NO LUNG CANCER COFFEE
170 830 1000
NO
COFFEE 80 920 1000
RISCHIO RELATIVO = (170/1000)/(80/1000) = 2.12
METODI PER CONTROLLARE IL CONFONDIMENTO
NEL DISEGNO DELLO STUDIO
• RANDOMIZZAZIONE
• RESTRIZIONE
• APPAIAMENTO
NELL’ANALISI DEI DATI
• ANALISI STRATIFICATA
• ANALISI MULTIVARIATA (TECNICHE DI
REGRESSIONE)
STUDI DI EPIDEMIOLOGIA ANALITICA VANTAGGI E SVANTAGGI
POSSIBILITA’ DI PERDITA AL FOLLOW UP VALUTAZIONE SEQUENZA TEMPORALE ESPOSIZIONE-MALATTIA
POSSIBILITA’ DI STUDIARE GLI EFFETTI DI ESPOSIZIONI RARE
POSSIBILITA’ DI IDENTIFICARE FATTORI DI RISCHIO PER MALATTIE RARE
TEMPI COSTI
elevata elevata
sì
no
lunghi elevati
- media
no
sì
intermedi intermedi
- bassa
no
no
brevi bassi COORTE CASO -
CONTROLLO TRASVERSALI STUDI
STATISTICA DESCRITTIVA ED INFERENZIALE
STATISTICA DESCRITTIVA
* Si utilizza per descrivere i dati
* E’ la prima fase di ogni analisi statistica
* Si riferisce solo al campione
* Utilizza stime puntuali (es. %, Odds Ratio, etc.) STATISTICA INFERENZIALE
* Si utilizza per generalizzare alla intera popolazione i risultati ottenuti dal campione che si sta studiando
* Il campione quasi mai rappresenta la popolazione in modo perfetto, a causa del cosiddetto “errore di campionamento”
* L’errore di campionamento non è in realtà un vero e proprio errore: rappresenta soltanto la variabilità naturale che ci si aspetta tra un campione ed un altro
* Utilizza stime intervallari (es. Intervallo di confidenza al 95%)
95% CI OR = OR + 1.96 SE dove SE (Standard Error) varianza
numerosità campionaria
ALCUNI CONCETTI FONDAMENTALI TIPOLOGIE DI
VARIABILI MISURE DI TENDENZA CENTRALE MISURE DI DISPERSIONE
RAPPRESENTAZIONE DEI DATI
TESTS
STATISTICI
Variabili
quantitative (es:colesterolo)
Variabili qualitative (es:sesso) Media (x)
Mediana
Moda Proporzione (p)
Deviazione standard Range
Tabelle
Grafici (Istogrammi o diagrammi a barre) Test del t di
student Test del chi
quadrato
VALORE DI P (P VALUE)
• E’ UNA PROBABILITA’ (RANGE DI VALORI POSSIBILI: 0 - 1)
• INDICA LA PROBABILITA’ CHE LE DIFFERENZE OSSERVATE TRA I GRUPPI DEL NOSTRO CAMPIONE SIANO DOVUTE AL CASO
• SE QUESTA PROBABILITA’ E’ SUFFICIENTEMENTE BASSA POSSIAMO RITENERE CHE LE DIFFERENZE SIANO
SIGNIFICATIVE
• SE QUESTA PROBABILITA’ E’ INVECE ALTA NON POSSIAMO RITENERE CHE LE DIFFERENZE SIANO SIGNIFICATIVE E
QUINDI ….
• PER CONVENZIONE SI USA UN VALORE DI CUT-OFF PARI A
0.05 (5%)
STUDI SPERIMENTALI
POPOLAZIONE IN STUDIO
SELEZIONE IN BASE A CRITERI DI INCLUSIONE PREDEFINITI
POTENZIALI PARTECIPANTI
CONSENSO INFORMATO
PARTECIPANTI ALLO STUDIO RANDOMIZZAZIONE
GRUPPO DI TRATTAMENTO GRUPPO DI CONTROLLO NON PARTECIPANTI
NON PARTECIPANTI
METODOLOGIA
STUDI SPERIMENTALI: ESEMPIO
POPOLAZIONE: PAZIENTI HIV+
SELEZIONE IN BASE A CRITERI PREDEFINITI: PAZIENTI CON AIDS O AIDS-RELATED COMPLEX
PARTECIPANTI ALLO STUDIO: N. 282
TRATTATI CON AZT:
N. 145
TRATTATI CON PLACEBO:
N. 137
CONSENSO INFORMATO NON PARTECIPANTI
ESCLUSI TUTTI GLI ALTRI PAZIENTI HIV+
RANDOMIZZAZIONE
Fischl MA et al. The efficacy of azidothymidine (AZT) in the treatment of patients with Aids or Aids-related complex. NEJM, 1987, 317: 185.
Mortalità a 24 settimane nel gruppo trattato con AZT: 1/145 = 0.7%
Mortalità a 24 settimane nel gruppo con placebo: 19/137 =14%
STUDI SPERIMENTALI
OBIETTIVI
Valutare l’efficacia di un intervento di prevenzione o di rimozione di fattori di rischio su intere
popolazioni
(sperimentazioni di
intervento comunitario) Paragonare l’efficacia di
due o più trattamenti
terapeutici o preventivi
(sperimentazione clinica)
su gruppi di persone
VANTAGGI
•sono gli studi più corretti da un punto di vista metodologico
•costituiscono gli unici modelli di studio in grado di stabilire
l’efficacia degli interventi
•se ben condotti non sono
suscettibili a bias di selezione, di misclassificazione e di
confondimento
STUDI SPERIMENTALI
SVANTAGGI
• problemi etici, in particolare
per le valutazioni di trattamenti già entrati nella pratica clinica
• lunga durata
• costi elevati
• difficoltà organizzative
RANDOMIZED CONTROL TRIALS (RCTs) MISURE DI EFFETTO
morti vivi
AZT 1 144
placebo 118
145 19 137
Mortalità a 24 settimane nel gruppo AZT: 1/145 = 0.7%
Mortalità a 24 settimane nel gruppo placebo: 19/137 =14%
Rischio relativo (RR) = [a/(a+b)]/[c/(c+d)] = 0.05
RR = 1 la mortalità è eguale in entrambi i gruppi
RR < 1 la mortalità è più bassa nel gruppo di trattamento
RR > 1 la mortalità è più alta nel gruppo di trattamento
RANDOMIZED CONTROL TRIALS (RCTs) MISURE DI EFFETTO
morti vivi
AZT 1 144
placebo 118
145 19 137
Odds Ratio (OR) = a x d / c x b = 1 x 118 / 19 x 144 = 0.043
OR = 1 la mortalità è eguale in entrambi i gruppi
OR < 1 la mortalità è più bassa nel gruppo di trattamento OR > 1 la mortalità è più alta nel gruppo di trattamento
IC 95% OR = 0.001 - 0.257
Karl Pearson , 1904
“Ciascun gruppo ... è di dimensioni troppo limitate per poter trarre
conclusioni definitive...”
“... Si è reso necessario, pertanto, raggrupparli insieme”
Thomas C. Chalmers, MD
META-ANALISI Definizioni
L’analisi statistica dei dati di diversi studi individuali condotta con l’obiettivo di riassumerne i risultati
Analisi primaria: analisi originaria dei dati di uno studio
Analisi secondaria: rianalisi dei dati per testare una nuova ipotesi di ricerca Meta-analisi: analisi finalizzata alla combinazione dei risultati di diversi studi
G. Glass, 1976 Analisi statistica che combina ed integra i risultati di diversi trials clinici
indipendenti che possono essere considerati combinabili
M.F. Huque, 1988 La meta-analisi utilizza i risultati di diversi studi per rispondere a quesiti specifici, generalmente in modo quantitativo. Sebbene la meta-analisi possa
contribuire ad una review su di una particolare area di ricerca, le reviews tradizionali hanno generalmente uno scopo più ampio delle meta-analisi
Louis, Finenberg and Mosteller, 1985
REVIEW PAPER
SYSTEMATIC REVIEW
META-ANALYSIS
REVIEW: Non sistematica, ampie finalità
REVISIONE SISTEMATICA: Protocollo formale e standardizzato
META-ANALISI: Combinazione statistica dei dati
STATISTICA DESCRITTIVA ED INFERENZIALE
STATISTICA DESCRITTIVA
* Si utilizza per descrivere i dati
* E’ la prima fase di ogni analisi statistica
* Si riferisce solo al campione
* Utilizza stime puntuali (es. %, Odds Ratio, etc.) STATISTICA INFERENZIALE
* Si utilizza per generalizzare alla intera popolazione i risultati ottenuti dal campione che si sta studiando
* Il campione quasi mai rappresenta la popolazione in modo perfetto, a causa del cosiddetto “errore di campionamento”
* L’errore di campionamento non è in realtà un vero e proprio errore: rappresenta soltanto la variabilità naturale che ci si aspetta tra un campione ed un altro
* Utilizza stime intervallari (es. Intervallo di confidenza al 95%), oppure test statistici
95% CI OR = OR + 1.96 SE dove SE (Standard Error) varianza
numerosità campionaria
VALORE DI P (P VALUE)
• E’ UNA PROBABILITA’ (RANGE DI VALORI POSSIBILI: 0 - 1)
• INDICA LA PROBABILITA’ CHE LE DIFFERENZE OSSERVATE TRA I GRUPPI DEL NOSTRO CAMPIONE SIANO DOVUTE AL CASO
• SE QUESTA PROBABILITA’ E’ SUFFICIENTEMENTE BASSA POSSIAMO RITENERE CHE LE DIFFERENZE SIANO
SIGNIFICATIVE
• SE QUESTA PROBABILITA’ E’ INVECE ALTA NON POSSIAMO RITENERE CHE LE DIFFERENZE SIANO SIGNIFICATIVE E
QUINDI ….
• PER CONVENZIONE SI USA UN VALORE DI CUT-OFF PARI A
0.05 (5%)
UTILITA’ DELLA META-ANALISI ALCUNI ESEMPI
1978
I PAZIENTI CON INFARTO MIOCARDICO ACUTO DEVONO ESSERE SOTTOPOSTI A TERAPIA TROMBOLITICA
(STREPTOCHINASI)?
1978
L’ANTIBIOTICO-PROFILASSI DEVE ESSERE EFFETTUATA NEI PAZIENTI DA SOTTOPORRE AD INTERVENTI
CHIRURGICI SUL COLON?
1988
IL TRATTAMENTO ENDOSCOPICO E’ INDICATO NEI
PAZIENTI CON EMORRAGIE GASTROINTESTINALI?
1978
I PAZIENTI CON INFARTO MIOCARDICO ACUTO DEVONO ESSERE SOTTOPOSTI A TERAPIA
TROMBOLITICA (STREPTOCHINASI)?
1986
0XFORD TEXTBOOK OF MEDICINE (2nd ed.)
“I benefici clinici della terapia trombolitica, sia in
termini di aumento della sopravvivenza sia in termini
di miglioramento della funzionalità ventricolare
sinistra, devono ancora essere dimostrati”
Study 1
Study 2
Study 3
Study 4
Cumulative M-A 1
Cumulative M-A 2
Cumulative M-A 3
Pool Studies 1 to 2
Basic Concept of Cumulative Meta-Analysis
Studies ordered chronologically or
by covariates
Pool Studies 1 to 4 Pool Studies 1 to 3
Study n-1 Cumulative M-A n-2
Study n Pool Studies 1 to n Cumulative M-A n-1
Pool Studies 1 to n-1