Prof. Paolo Villari Dipartimento di Sanità Pubblica e Malattie Infettive Sapienza Università di Roma

(1)

1

I bias negli studi epidemiologici.

Elementi di statistica descrittiva ed

inferenziale. L’epidemiologia sperimentale.

Le revisioni sistematiche e le metanalisi:

concetti fondamentali

Prof. Paolo Villari [email protected]

Dipartimento di Sanità Pubblica e Malattie Infettive Sapienza Università di Roma

(2)

2

Le misure di associazione

ESERCIZIO 3

(3)

Negli anni ‘20, sulla base di osservazioni cliniche, è stata ipotizzata l’esistenza di una relazione causale tra il tumore polmonare ed il fumo di sigaretta.

Tra il 1930 ed il 1960 sono stati condotti numerosi studi epidemiologici per valutare questa apparente associazione, due studi sono stati fatti da Doll e Hill in Gran Bretagna.

Il primo è uno studio caso-controllo, iniziato nel 1947, nel quale sono state confrontate le abitudini al fumo di pazienti con un tumore del polmone e pazienti con altre patologie.

Il secondo, iniziato nel 1951, è uno studio di coorte che ha registrato le cause di

morte dei medici inglesi in relazione alle loro abitudini al fumo .

(4)

STUDIO CASO-CONTROLLO

I dati sono stati ottenuti da pazienti ricoverati negli ospedali di Londra e dintorni per un periodo di 4 anni (aprile 1948-febbraio 1952).

Agli ospedali (20 all’inizio dello studio e aumentati successivamente) è stato chiesto di segnalare ai ricercatori tutti i pazienti ricoverati con una prima diagnosi di cancro al polmone. Questi pazienti sono stati poi intervistati per conoscere le loro abitudini al fumo;

analoghe interviste sono state condotte tra i pazienti con altre diagnosi (principalmente patologie a carattere non maligno) ospedalizzati nello stesso periodo di tempo nello stesso ospedale.

Tabella 1 – Distribuzione per abitudine al fumo dei casi di tumore polmonare e dei controlli. Maschi.

Abitudine al fumo Casi Controlli

Fumatore 1350 1296

Non Fumatore 7 61

Totale 1357 1357

Domanda 1: Valutare l’associazione tra tumore del polmone e fumo di sigaretta calcolando l’appropriata misura di associazione (utilizza i dati della tabella 1)

(5)

STUDIO CASO-CONTROLLO

Tabella 1 – Distribuzione per abitudine al fumo dei casi di tumore polmonare e dei controlli. Maschi.

Abitudine al fumo Casi Controlli

Fumatore 1350 1296

Non Fumatore 7 61

Totale 1357 1357

Domanda 1: Valutare l’associazione tra tumore del polmone e fumo di sigaretta calcolando l’appropriata misura di associazione (utilizza i dati della tabella 1)

La misura di associazione appropriata per lo studio caso-controllo è l’ODDS RATIO.

OR= (1350*61)/(1296*7)= 9.08

(6)

STUDIO CASO-CONTROLLO

Tabella 2 - Distribuzione per numero medio di sigarette al giorno dei casi di tumore polmonare e dei controlli.

Numero di sigarette al giorno Casi Controlli

0 7 61

1 - 14 565 706

15 - 24 445 408

≥25 340 182

Tutti i fumatori 1350 1296

Totale 1357 1357

Domanda 2: Evidenziare la presenza di un eventuale dose risposta (utilizza i dati della tabella 2; calcolare tre OR)

OR_1-14 = (565*61)/(706*7)=6.97

OR_15-24 = (445*61)/(408*7)=9.50

OR_≥25= (340*61)/(182*7)=16.28

565 706

7 61

445 408

7 61

340 182

7 61

(7)

STUDIO DI COORTE

I dati per lo studio di coorte sono stati ottenuti dalle liste degli iscritti all’Ordine dei Medici della Gran Bretagna (British Medical Register) residenti in Inghilterra e Galles all’ottobre 1951. L’informazione sulle abitudini al fumo nel presente e nel passato sono state raccolte attraverso un questionario. L’informazione sulla eventuale presenza di tumore polmonare è stata ottenuta dal certificato di morte e altri dati di mortalità raccolti negli anni successivi.

Tabella 3 – Abitudini al fumo e mortalità per tumore polmonare in una coorte di medici inglesi

Numero di sigarette fumate al giorno

Casi di tumore del polmone Anni-persona a rischio

0 3 42.800

1 - 14 22 38.600

15 - 24 54 38.900

≥25 57 25.100

Tutti i fumatori 133 102.600

Totale 136 145.400

Domanda 1: Valutare l’associazione tra tumore al polmone e fumo di sigaretta, evidenziando anche la presenza di una eventuale relazione dose-risposta.

(8)

STUDIO DI COORTE

0 3 42.800

1 - 14 22 38.600

15 - 24 54 38.900

≥25 57 25.100

Totale 136 145.400

Domanda 1: Valutare l’associazione tra tumore al polmone e fumo di sigaretta, evidenziando anche la presenza di una eventuale relazione dose-risposta.

Calcoliamo per prima cosa il tasso di incidenza del tumore polmonare negli esposti (tutti i fumatori) e nei non esposti (non fumatori).

I_exp+=133/102.600=0,0013 I_exp-=3/42.800=0,00007

La misura di associazione nello Studio di Coorte è il RISCHIO RELATIVO.

RR=0,0013/0,00007= 18,57

(9)

STUDIO DI COORTE

0 3 42.800

1 - 14 22 38.600

15 - 24 54 38.900

≥25 57 25.100

Totale 136 145.400

Calcoliamo ora i tassi di incidenza del tumore polmonare negli esposti in base al numero di sigarette fumate al giorno ed i RR corrispondenti.

I_1-14=22/38.600=0,0006 RR_1-14=0,0006/0,00007= 8,57 I_15-24=54/38.900=0,0014 RR_15-24=0,0014/0,00007= 20 I_≥25=57/25.100=0,0023 RR_≥25=0,0023/0,00007= 32,86

(10)

CONFRONTO STUDIO CASO-CONTROLLO E STUDIO DI COORTE

CASO CONTROLLO

OR

_exp

= 9.08 OR

_1-14

=6.97 OR

_15-24

=9.50 OR

_≥25

=16.28

COORTE RR

_exp

= 18,57

RR

_1-14

= 8,57

RR

_15-24

= 20

RR

_≥25

=32,86

(11)

11

•La storia naturale delle malattie. Concetti di salute e malattia. Valutazione

dell’efficacia dei tests diagnostici: sensibilità, specificità e valori predittivi. I livelli di prevenzione. Gli screening.

•Definizione ed obiettivi dell’epidemiologia. Classificazione degli studi

epidemiologici. Metodologia e strumenti dell’epidemiologia descrittiva. Misure di frequenza di malattia.

•Metodologie e strumenti dell’epidemiologia analitica. Le misure di associazione.

• I bias negli studi epidemiologici. Elementi di statistica descrittiva ed

inferenziale. L’epidemiologia sperimentale. Le revisioni sistematiche e la meta- analisi. Concetti fondamentali .

(12)

STUDI DI EPIDEMIOLOGIA ANALITICA ERRORI SISTEMATICI (BIAS)

BIAS DI SELEZIONE

Si verifica quando il reclutamento dei soggetti in uno studio non dipende solo dai criteri di inclusione

esempio: l’inclusione di un caso in uno studio caso-controllo è influenzata dallo stato di esposizione

BIAS DI INFORMAZIONE (MISCLASSIFICAZIONE)

Si verifica quando i soggetti vengono erroneamente classificati relativamente allo stato di esposizione o di malattia

esempio: il ricordo di un’esposizione può essere più probabile in

uno dei gruppi selezionati (casi)

(13)

CONFONDIMENTO

SI VERIFICA QUANDO UNA “VARIABILE ESTERNA”

MODIFICA (ANNULLA, RIDUCE, AUMENTA) L’ASSOCIAZIONE TRA L’ESPOSIZIONE E LA

PATOLOGIA ESPOSIZIONE

(consumo di caffè) MALATTIA

(mal. cardiovascolari)

VARIABILE DI CONFONDIMENTO

(fumo di sigaretta)

(14)

CONFONDIMENTO:

UN ESEMPIO

FUMATORI

LUNG CANCER

NO LUNG CANCER COFFEE

160 640 800

NO

COFFEE 40 160 200

RR = (160/800)/(40/200) = 1

NON FUMATORI

LUNG CANCER

10 190 200

NO

COFFEE 40 760 800

RR = (10/200)/(40/800) = 1

LUNG CANCER

170 830 1000

NO

COFFEE 80 920 1000

RISCHIO RELATIVO = (170/1000)/(80/1000) = 2.12

(15)

METODI PER CONTROLLARE IL CONFONDIMENTO

NEL DISEGNO DELLO STUDIO

• RANDOMIZZAZIONE

• RESTRIZIONE

• APPAIAMENTO

NELL’ANALISI DEI DATI

• ANALISI STRATIFICATA

• ANALISI MULTIVARIATA (TECNICHE DI

REGRESSIONE)

(16)

STUDI DI EPIDEMIOLOGIA ANALITICA VANTAGGI E SVANTAGGI

POSSIBILITA’ DI PERDITA AL FOLLOW UP VALUTAZIONE SEQUENZA TEMPORALE ESPOSIZIONE-MALATTIA

POSSIBILITA’ DI STUDIARE GLI EFFETTI DI ESPOSIZIONI RARE

POSSIBILITA’ DI IDENTIFICARE FATTORI DI RISCHIO PER MALATTIE RARE

TEMPI COSTI

elevata elevata

sì

no

lunghi elevati

- media

no

sì

intermedi intermedi

- bassa

no

brevi bassi COORTE CASO -

CONTROLLO TRASVERSALI STUDI

(17)

STATISTICA DESCRITTIVA ED INFERENZIALE

STATISTICA DESCRITTIVA

* Si utilizza per descrivere i dati

* E’ la prima fase di ogni analisi statistica

* Si riferisce solo al campione

* Utilizza stime puntuali (es. %, Odds Ratio, etc.) STATISTICA INFERENZIALE

* Si utilizza per generalizzare alla intera popolazione i risultati ottenuti dal campione che si sta studiando

* Il campione quasi mai rappresenta la popolazione in modo perfetto, a causa del cosiddetto “errore di campionamento”

* L’errore di campionamento non è in realtà un vero e proprio errore: rappresenta soltanto la variabilità naturale che ci si aspetta tra un campione ed un altro

* Utilizza stime intervallari (es. Intervallo di confidenza al 95%)

95% CI OR = OR + 1.96 SE dove SE (Standard Error) varianza

numerosità campionaria

(18)

ALCUNI CONCETTI FONDAMENTALI TIPOLOGIE DI

VARIABILI MISURE DI TENDENZA CENTRALE MISURE DI DISPERSIONE

RAPPRESENTAZIONE DEI DATI

TESTS

STATISTICI

Variabili

quantitative (es:colesterolo)

Variabili qualitative (es:sesso) Media (x)

Mediana

Moda Proporzione (p)

Deviazione standard Range

Tabelle

Grafici (Istogrammi o diagrammi a barre) Test del t di

student Test del chi

quadrato

(19)

VALORE DI P (P VALUE)

• E’ UNA PROBABILITA’ (RANGE DI VALORI POSSIBILI: 0 - 1)

• INDICA LA PROBABILITA’ CHE LE DIFFERENZE OSSERVATE TRA I GRUPPI DEL NOSTRO CAMPIONE SIANO DOVUTE AL CASO

• SE QUESTA PROBABILITA’ E’ SUFFICIENTEMENTE BASSA POSSIAMO RITENERE CHE LE DIFFERENZE SIANO

SIGNIFICATIVE

• SE QUESTA PROBABILITA’ E’ INVECE ALTA NON POSSIAMO RITENERE CHE LE DIFFERENZE SIANO SIGNIFICATIVE E

QUINDI ….

• PER CONVENZIONE SI USA UN VALORE DI CUT-OFF PARI A

0.05 (5%)

(20)

STUDI SPERIMENTALI

POPOLAZIONE IN STUDIO

SELEZIONE IN BASE A CRITERI DI INCLUSIONE PREDEFINITI

POTENZIALI PARTECIPANTI

CONSENSO INFORMATO

PARTECIPANTI ALLO STUDIO RANDOMIZZAZIONE

GRUPPO DI TRATTAMENTO GRUPPO DI CONTROLLO NON PARTECIPANTI

NON PARTECIPANTI

METODOLOGIA

(21)

STUDI SPERIMENTALI: ESEMPIO

POPOLAZIONE: PAZIENTI HIV+

SELEZIONE IN BASE A CRITERI PREDEFINITI: PAZIENTI CON AIDS O AIDS-RELATED COMPLEX

PARTECIPANTI ALLO STUDIO: N. 282

TRATTATI CON AZT:

N. 145

TRATTATI CON PLACEBO:

N. 137

CONSENSO INFORMATO NON PARTECIPANTI

ESCLUSI TUTTI GLI ALTRI PAZIENTI HIV+

RANDOMIZZAZIONE

Fischl MA et al. The efficacy of azidothymidine (AZT) in the treatment of patients with Aids or Aids-related complex. NEJM, 1987, 317: 185.

Mortalità a 24 settimane nel gruppo trattato con AZT: 1/145 = 0.7%

Mortalità a 24 settimane nel gruppo con placebo: 19/137 =14%

(22)

STUDI SPERIMENTALI

OBIETTIVI

Valutare l’efficacia di un intervento di prevenzione o di rimozione di fattori di rischio su intere

popolazioni

(sperimentazioni di

intervento comunitario) Paragonare l’efficacia di

due o più trattamenti

terapeutici o preventivi

(sperimentazione clinica)

su gruppi di persone

(23)

VANTAGGI

•sono gli studi più corretti da un punto di vista metodologico

•costituiscono gli unici modelli di studio in grado di stabilire

l’efficacia degli interventi

•se ben condotti non sono

suscettibili a bias di selezione, di misclassificazione e di

confondimento

STUDI SPERIMENTALI

SVANTAGGI

• problemi etici, in particolare

per le valutazioni di trattamenti già entrati nella pratica clinica

• lunga durata

• costi elevati

• difficoltà organizzative

(24)

RANDOMIZED CONTROL TRIALS (RCTs) MISURE DI EFFETTO

morti vivi

AZT ¹ ¹⁴⁴

placebo ¹¹⁸

145 19 137

Mortalità a 24 settimane nel gruppo AZT: 1/145 = 0.7%

Mortalità a 24 settimane nel gruppo placebo: 19/137 =14%

Rischio relativo (RR) = [a/(a+b)]/[c/(c+d)] = 0.05

RR = 1 la mortalità è eguale in entrambi i gruppi

RR < 1 la mortalità è più bassa nel gruppo di trattamento

RR > 1 la mortalità è più alta nel gruppo di trattamento

(25)

RANDOMIZED CONTROL TRIALS (RCTs) MISURE DI EFFETTO

morti vivi

AZT ¹ ¹⁴⁴

placebo ¹¹⁸

145 19 137

Odds Ratio (OR) = a x d / c x b = 1 x 118 / 19 x 144 = 0.043

OR = 1 la mortalità è eguale in entrambi i gruppi

OR < 1 la mortalità è più bassa nel gruppo di trattamento OR > 1 la mortalità è più alta nel gruppo di trattamento

IC 95% OR = 0.001 - 0.257

(26)

(27)

Karl Pearson , 1904

“Ciascun gruppo ... è di dimensioni troppo limitate per poter trarre

conclusioni definitive...”

“... Si è reso necessario, pertanto, raggrupparli insieme”

(28)

Thomas C. Chalmers, MD

(29)

META-ANALISI Definizioni

L’analisi statistica dei dati di diversi studi individuali condotta con l’obiettivo di riassumerne i risultati

Analisi primaria: analisi originaria dei dati di uno studio

Analisi secondaria: rianalisi dei dati per testare una nuova ipotesi di ricerca Meta-analisi: analisi finalizzata alla combinazione dei risultati di diversi studi

G. Glass, 1976 Analisi statistica che combina ed integra i risultati di diversi trials clinici

indipendenti che possono essere considerati combinabili

M.F. Huque, 1988 La meta-analisi utilizza i risultati di diversi studi per rispondere a quesiti specifici, generalmente in modo quantitativo. Sebbene la meta-analisi possa

contribuire ad una review su di una particolare area di ricerca, le reviews tradizionali hanno generalmente uno scopo più ampio delle meta-analisi

Louis, Finenberg and Mosteller, 1985

(30)

REVIEW PAPER

SYSTEMATIC REVIEW

META-ANALYSIS

REVIEW: Non sistematica, ampie finalità

REVISIONE SISTEMATICA: Protocollo formale e standardizzato

META-ANALISI: Combinazione statistica dei dati

(31)

STATISTICA DESCRITTIVA ED INFERENZIALE

STATISTICA DESCRITTIVA

* Si utilizza per descrivere i dati

* E’ la prima fase di ogni analisi statistica

* Si riferisce solo al campione

* Utilizza stime puntuali (es. %, Odds Ratio, etc.) STATISTICA INFERENZIALE

* Si utilizza per generalizzare alla intera popolazione i risultati ottenuti dal campione che si sta studiando

* Il campione quasi mai rappresenta la popolazione in modo perfetto, a causa del cosiddetto “errore di campionamento”

* L’errore di campionamento non è in realtà un vero e proprio errore: rappresenta soltanto la variabilità naturale che ci si aspetta tra un campione ed un altro

* Utilizza stime intervallari (es. Intervallo di confidenza al 95%), oppure test statistici

95% CI OR = OR + 1.96 SE dove SE (Standard Error) varianza

numerosità campionaria

(32)

VALORE DI P (P VALUE)

• E’ UNA PROBABILITA’ (RANGE DI VALORI POSSIBILI: 0 - 1)

• INDICA LA PROBABILITA’ CHE LE DIFFERENZE OSSERVATE TRA I GRUPPI DEL NOSTRO CAMPIONE SIANO DOVUTE AL CASO

• SE QUESTA PROBABILITA’ E’ SUFFICIENTEMENTE BASSA POSSIAMO RITENERE CHE LE DIFFERENZE SIANO

SIGNIFICATIVE

• SE QUESTA PROBABILITA’ E’ INVECE ALTA NON POSSIAMO RITENERE CHE LE DIFFERENZE SIANO SIGNIFICATIVE E

QUINDI ….

• PER CONVENZIONE SI USA UN VALORE DI CUT-OFF PARI A

0.05 (5%)

(33)

UTILITA’ DELLA META-ANALISI ALCUNI ESEMPI

1978

I PAZIENTI CON INFARTO MIOCARDICO ACUTO DEVONO ESSERE SOTTOPOSTI A TERAPIA TROMBOLITICA

(STREPTOCHINASI)?

1978

L’ANTIBIOTICO-PROFILASSI DEVE ESSERE EFFETTUATA NEI PAZIENTI DA SOTTOPORRE AD INTERVENTI

CHIRURGICI SUL COLON?

1988

IL TRATTAMENTO ENDOSCOPICO E’ INDICATO NEI

PAZIENTI CON EMORRAGIE GASTROINTESTINALI?

(34)

1978

I PAZIENTI CON INFARTO MIOCARDICO ACUTO DEVONO ESSERE SOTTOPOSTI A TERAPIA

TROMBOLITICA (STREPTOCHINASI)?

1986

0XFORD TEXTBOOK OF MEDICINE (2nd ed.)

“I benefici clinici della terapia trombolitica, sia in

termini di aumento della sopravvivenza sia in termini

di miglioramento della funzionalità ventricolare

sinistra, devono ancora essere dimostrati”

(35)

(36)

Study 1

Study 2

Study 3

Study 4

Cumulative M-A 1

Pool Studies 1 to 2

Basic Concept of Cumulative Meta-Analysis

Studies ordered chronologically or

by covariates

Pool Studies 1 to 4 Pool Studies 1 to 3

Study n-1 Cumulative M-A n-2

Study n Pool Studies 1 to n Cumulative M-A n-1

Pool Studies 1 to n-1

(37)

(38)

(39)

(40)

(41)