orso di
Evidence-based Medicine
Nicola Latronico
Dipartimento di Anestesia, Rianimazione e Medicina Perioperatoria SSVD Neuroanestesia & Neurorianimazione
Università di Brescia, Spedali Civili
Brescia, Italia
Cosetta Minelli
Respiratory Epidemiology & Public Health Group National Heart and Lung Institute at Imperial College London
London, England
Statistica descrittiva
Statistica inferenziale e test d’ipotesi
Dimensione campionaria
Classificazione degli studi primari
Studi secondari: revisioni sistematiche e meta-analisi
Definizione di outcome
Misure di rischio
Un esempio: il report di fine anno di un reparto (n. di ricoveri, durata della
degenza, mortalità, etc.) .
POPOLAZIONE oggetto di studio: tutti i pazienti ricoverati in quel reparto durante l’anno.
VARIABILI oggetto do studio: n. di ricoveri, durata della degenza, mortalità, etc.
Comprende tutte le analisi condotte su un determinato gruppo di osservazioni (persone, oggetti, eventi, etc) a fine puramente descrittivo: ci limitiamo a descrivere in modo sintetico ciò che osserviamo.
La statistica descrittiva
Definizione di VARIABILE:
Caratteristica tipica di un fenomeno (essere vivente, oggetto, evento, etc) che può manifestarsi in modo diverso.
I 3 tipi di variabile
EBM
Operatori possibili Tendenza centrale Variabilità
A Qualitativa
1 Qualitativa p.d. = moda distribuzione di frequenza
2 Ordinale > < mediana range, percentili
Operatori possibili Tendenza centrale Variabilità
B Quantitativa + - x ¸ ecc. media varianza,
deviazione standard Bertolini G, Nardi D. Statistica applicata alla ricerca educativa. Guerini Studio. 1998. Milano
Variabile qualitativa propriamente detta (p.d. ): es. sesso Variabile ordinale: es. Glasgow Coma Scale
• MODA (variabili qualitative) : categoria della variabile più frequente nel gruppo di osservazioni.
Misure di TENDENZA CENTRALE
• MEDIANA (variabili ordinali) : categoria di mezzo della variabile ordinata in modo crescente o decrescente.
Definizione:
Indicatori statistici che forniscono una rappresentatività sintetica dell’intero gruppo di osservazione.
• MEDIA (variabili quantitative) : xi =
DISTRIBUZIONE DI FREQUENZA (variabili qualitative):
numero di categorie e numerosità (assoluta e relativa) all’interno di ciascuna categoria. Viene rappresentata da una tabella o grafico.
Misure di VARIABILITA’
Definizione:
Indicatori statistici che forniscono una misura del grado di variabilità delle osservazioni rispetto al fenomeno osservato.
Misure di VARIABILITA’
RANGE e PERCENTILI (variabili ordinali) :
• RANGE: semplice = valori minimo e massimo osservati; interquartile = intervallo di valori che stanno tra il 1 e il 3 quartile (25° e 75° percentile)
• PERCENTILE: valore sotto il quale si trova una certa percentuale di popolazione
• VARIANZA e DEVIAZIONE STANDARD (variabili quantitative) :
(xi- )2 • VARIANZA = n (xi- ) 2 • DEVIAZIONE STANDARD = n
Glasgow Coma Scale
EBMA. Discreta
B. Continua
C. Ordinale
D. Nominale
E. Dicotomica
VARIABILE
VARIABILE
0
1
2
Frequenza cardiaca Assente <100 bpm >100 bpm Respiro Assente Bradipnea
irregolare
Pianto valido
Tono muscolare Ipotonia Modica flessione
delle estremità Movimenti attivi
Risposta riflessa all’introduzione del catetere nel naso
Nessuna risposta Smorfie Tosse, starnuto
Colore Pallido, cianotico Tronco eritrosico,
estremità cianotiche Completamente eritrosico
Virginia Apgar
1909-1974
Columbia
University
Anesthesiologist
A. Discreta
B. Continua
C. Ordinale
D. Nominale
E. Dicotomica
VARIABILE
VARIABILE
TIPO DI PARTO
taglio cesareo
naturale
indotto
A. Discreta
B. Continua
C. Ordinale
D. Nominale
E. Dicotomica
VARIABILE
VARIABILE
1D
1D
2C
2C
3B
3B
HDM/CDM= high-, conventional-dose mannitol.
GCS= postresuscitation Glasgow Coma Scale
MAP= mean arterial pressure
PaCO2= arterial carbon dioxide tension
PaO2= arterial oxygen tension
Hgb= total hemoglobin content
Midline shift= shift of midline structures on brain CT
CBC= compromised basilar cisterns
UPW= unilateral pupillary widening
BPW= bilateral pupillary widening.
Statistica descrittiva
Statistica inferenziale e test d’ipotesi
Dimensione campionaria
Classificazione degli studi primari
Studi secondari: revisioni sistematiche e meta-analisi
Definizione di outcome
Misure di rischio
Mentre il parametro di interesse viene misurato nel campione studiato, questo
può solo essere stimato in popolazione, a partire dal valore ottenuto nel nostro campione.
La STIMA di un parametro in POPOLAZIONE
Come?
Identificando un intervallo di valori possibili attorno al valore del parametro trovato nel campione (intervallo di confidenza). La “confidenza” che l’intervallo davvero contenga il valore vero in popolazione è definita da un valore
convenzionalmente fissato a 95 o 99% (possibilità di errore rispettivamente del 5 o 1%).
L’intervallo sarà tanto più stretto quanto più grande è il campione
p<0.05
EBM
Cos’è la “
p”
?
Definizione:
La p è la probabilità di ottenere per il puro effetto del caso i dati che abbiamo
IL TEST DI IPOTESI
E’ la parte della statistica che valuta il grado di significatività di una differenza
osservata fra due gruppi (es: pts trattati con un farmaco vs non trattati; rischio della malattia in maschi/femmine).
La statistica procede a valutare un’ipotesi contraria rispetto a quanto
normalmente atteso, e cioè valuta l’ipotesi che tra i due gruppi a confronto NON vi sia differenza statisticamente significativa (ipotesi nulla).
La statistica mette a disposizione diversi tipi di test d’ipotesi a seconda del
tipo di variabile del parametro di interesse (es.: misura di outcome della malattia in oggetto)
P<0.05 e 95% C.I.
Significato della
significatività
statistica
• Un test "significativo" dimostra la presenza di differenza e la direzione di
questa, ma non può dirci di che entità
• Un test "non significativo" non dimostra l'assenza di differenza
• La p va valutata in base al suo valore (non solo come < o > di 0.5!)
• Significatività statistica non significa rilevanza conoscitiva
Intervallo di confidenza
EBM
L’intervallo di confidenza può essere calcolato per qualsiasi stima.
Nel caso di un rapporto la soglia per un effetto significativo è 1,
negli altri casi è 0.
R.R. 2.27 (95% C.I. 1.00-4.01)
Il rischio di SGI in pazienti in condizioni critiche trattati con sucralfato è 3,8% (Rsu); in
quelli trattati con ranitidina (Rran) è 1,7%; il rischio relativo R.R. (Rsu/Rran) è:
During anticoagulant prophylaxis, patients had xxxxxxxxxxxxx reductions in any PE (relative risk, 0.43 [CI, 0.26 to 0.71]) and fatal PE (relative risk, 0.38 [CI, 0.21 to 0.69]),
xxxxxxxxxxxxx reduction in symptomatic deep venous
thrombosis (relative risk, 0.47 [CI, 0.22 to 1.00]),
and a xxxxxxxxxxxxx increase in major bleeding (relative risk, 1.32 [CI, 0.73 to 2.37]).
Anticoagulant prophylaxis had xxxxxxxx on all-cause mortality (relative risk, 0.97 [CI, 0.79 to 1.19]).
During anticoagulant prophylaxis, patients had xxxxxxxxxxxxx reductions in any PE (relative risk, 0.43 [CI, 0.26 to 0.71]) and fatal PE (relative risk, 0.38 [CI, 0.21 to 0.69]),
xxxxxxxxxxxxx reduction in symptomatic deep venous
thrombosis (relative risk, 0.47 [CI, 0.22 to 1.00]),
and a xxxxxxxxxxxxx increase in major bleeding (relative risk, 1.32 [CI, 0.73 to 2.37]).
Anticoagulant prophylaxis had xxxxxxxx on all-cause mortality (relative risk, 0.97 [CI, 0.79 to 1.19]).
non significant
significant
non significant
no effect
Test parametrici e non parametrici
EBM
Test parametrici
Sono molto potenti, ma si possono usare soltanto:
quando il parametro di interesse è una variabile quantitativa; quando sono soddisfatte due assunzioni :
distribuzione normale del parametro in popolazione;
omoscedasticità (cioè uguale varianza nei due gruppi a confronto).
Test non parametrici
Sono meno potenti, ma si possono usare sempre, cioè con tutti i tipi di variabile. Non richiedono alcuna assunzione.
Test per dati appaiati e non appaiati
Campioni “non appaiati” (o indipendenti)
I 2 gruppi a confronto sono costituiti da soggetti diversi
Campioni “appaiati” (o dipendenti)
I 2 gruppi a confronto sono costituiti dagli stessi soggetti
(valutazioni ripetute sugli stessi soggetti).
Test a 1 o 2 code
EBM
Test a 2 code
Quando l’ipotesi nulla può essere falsa in tutte e 2 le direzioni
Test a 1 coda
L’ipotesi nulla è vera soltanto in una direzione.
Tale situazione è molto rara!
I diversi tipi di Test
Quadro generale
TIPO DI VARIABILE
TIPO DI CAMPIONE
Variabili qualitative p.d. Variabili ordinali Variabili quantitative
Campioni non appaiati (o indipendenti)
Test non parametrico: Chi-quadrato di
Pearson
Test non parametrico:
U di Mann-Whitney
Test parametrici:
t di Student
2 sample or unpaired
(per il confronto di 2 campioni)
ANOVA
(per il confronto di più campioni)
Test non parametrico: U di Mann-Whitney
Campioni Appaiati (o dipendenti)
Test non parametrico: Chi-quadrato di
McNemar
Test non parametrico: Test dei segni
Test parametrici:
t di Student
one sample or paired
(per il confronto di 2 campioni)
ANOVA per misure ripetute
(per il confronto di più campioni)
Test non parametrico: Test di Wilcoxon
Objective: Evaluation of selective decontamination of the digestive tract (SDD) on late mortality in ventilated trauma patients.
Methods: A multicenter, randomized controlled trial in 401 severe trauma patients. Patients were randomized to control (n = 200) or SDD (n = 201). Primary endpoint was late mortality excluding early death from hemorrhage or craniocerebral injury. Secondary endpoints were infection and organ dysfunction.
Results: Late mortality was 15.3% (57/372) as 29 patients died from cerebral injury, 16 SDD and 13 control.
23
Yes
No
SDD
26
159 185
Control
31
156 187
57
315 372
Risk A = 14.1%
Risk B = 16.6%
Absolute risk reduction = 2.5%
Quadro generale
TIPO DI VARIABILE TIPO DI
CAMPIONE
Variabili qualitative p.d. Variabili ordinali Variabili quantitative
Campioni non appaiati (o indipendenti)
Test non parametrico:
Chi-quadrato di Pearson
Test non parametrico:
U di Mann-Whitney
Test parametrici:
t di Student
2 sample or unpaired (per il confronto di 2 campioni)
ANOVA
(per il confronto di più campioni)
Test non parametrico:
U di Mann-Whitney
Campioni Appaiati (o dipendenti)
Test non parametrico:
Chi-quadrato di McNemar
Test non parametrico:
Test dei segni
Test parametrici: t di Student
one sample or paired (per il confronto di 2 campioni)
ANOVA per misure ripetute
(per il confronto di più campioni)
Test non parametrico:
Test di Wilcoxon
Quale test?
Quadro generale
TIPO DI VARIABILE
TIPO DI CAMPIONE
Variabili qualitative p.d. Variabili ordinali Variabili quantitative
Campioni non appaiati (o indipendenti)
Test non parametrico:
Chi-quadrato di Pearson
Test non parametrico:
U di Mann-Whitney
Test parametrici:
t di Student
2 sample or unpaired (per il confronto di 2 campioni)
ANOVA
(per il confronto di più campioni)
Test non parametrico:
U di Mann-Whitney
Campioni Appaiati (o dipendenti)
Test non parametrico:
Chi-quadrato di McNemar
Test non parametrico:
Test dei segni
Test parametrici:
t di Student
one sample or paired (per il confronto di 2 campioni)
ANOVA per misure ripetute
(per il confronto di più campioni)
Test non parametrico:
Statistica descrittiva
Statistica inferenziale e test d’ipotesi
Dimensione campionaria
Classificazione degli studi primari
Studi secondari: revisioni sistematiche e meta-analisi
Definizione di outcome
Misure di rischio
La letteratura medica contiene molti esempi di trial troppo piccoli per poter
avere buona probabilità di evidenziare (come “statisticamente significative”) differenze clinicamente rilevanti tra i gruppi di trattamento studiati.
In altre parole: la “negatività” dei loro risultati potrebbe essere legata esclusivamente all’inadeguatezza della dimensione campionaria e non alla mancanza di effetto del trattamento oggetto di studio.
Questo problema viene risolto con il calcolo statistico eseguito a priori (cioè
nella fase di progettazione di un clinical trial) della dimensione del campione appropriata per lo studio.
Perché
stimare a priori
la
dimensione del
campione
da studiare?
Nell’analisi dei risultati di uno studio, la dimensione campionaria è il fattore che
maggiormente influenza il potere di un test statistico, cioè la capacità del test di evidenziare come “statisticamente significativa” una differenza realmente esistente tra i gruppi di trattamento.
Tanto più grande la dimensione del campione, tanto maggiore il potere del test.
Il calcolo della dimensione campionaria può essere complesso e richiedere
l’assistenza di uno statistico.
Per ogni situazione vi sono a disposizione formule (spesso complesse), estese tabelle, e metodi grafici più semplici (nomogrammi).
Il calcolo della dimensione campionaria varia a seconda di:
• tipo di dati da analizzare (es.: dati continui, dati categorici)
• tipo di campioni (indipendenti o dipendenti), e quindi di disegno dello studio (a gruppi paralleli o cross-over)
• numero dei gruppi di trattamento da confrontare
• situazioni particolari, quali: tempo di sopravvivenza come outcome principale di interesse
Indipendentemente da quale sia la formula adatta al disegno di studio e al tipo di
dati di interesse, per calcolare la dimensione campionaria è necessario specificare il valore di 3 fattori:
• Il potere del test che si desidera ottenere (è consigliabile mirare a un potere del test compreso tra l’80% e il 90%).
• la differenza minima tra i trattamenti che sia “clinicamente rilevante”. E’ il fattore più difficile da specificare.
Può essere espresso in generale come il grado di beneficio che il nuovo trattamento dovrebbe fornire rispetto a quello vecchio perché valga la pena di utilizzarlo.
• il valore di “alfa” (= errore di primo tipo) che si vuole accettare, cioè la
Quali sono i
fattori
che entrano nel
calcolo
la
dimensione campionaria?
Il fine ultimo del calcolo della dimensione campionaria è quello di:
• avere un’alta probabilità di evidenziare, come “statisticamente significativo”, un effetto definito come rilevante, se questo esiste;
• essere ragionevolmente sicuri che non esista un beneficio del genere se non riscontrato nel trial.
(maggiore la dimensione campionaria maggiore il potere dello studio maggiore la nostra confidenza in quanto sopra)
In conclusione…….
Errore alfa e beta
EBM
Errore alfa
Errore beta
Definizione:
E’ l’errore che commettiamo dicendo che un risultato è significativo quando invece non lo è.
L’errore alfa che siamo disposti ad accettare corrisponde al limite che fissiamo
per la significatività della p: 5 o 1%, a seconda che decidiamo di essere più o meno conservativi.
Definizione:
E’ l’errore che commettiamo dicendo che un risultato non è significativo quando invece lo è.
Yes
No
SDD
26
159 185
Control
31
156 187
57
315 372
Risk A = 14.1%
Risk B = 16.6%
INTERVENTO:
SDD per ridurre la mortalità nei traumi gravi
BRACCI DI TRATTAMENTO:
•
braccio A - sperimentale:
SDD
•
braccio B - intervento standard:
placebo
OUTCOME:
late mortality
Calcolo della dimensione campionaria
UN ESEMPIO
EBM
I determinanti per il calcolo della dimensione campionaria: • differenza attesa di efficacia tra i due trattamenti • potere desiderato dello studio
efficacia attesa dei due trattamenti
• efficacia attesa trattamento B - standard: outcome positivo 80% (p1=0.80)
• efficacia attesa trattamento A - sperimentale: outcome positivo 85% (p2=0.85)
i determinanti per il calcolo
Potere dello studio desiderato =
80%
Livello soglia di significatività statistica =
5%Mortalità 20%
Mortalità 20%
Mortalità 15%
Calcolo della
differenza standardizzata
p2 - p1 0.85 - 0.80
D = = = 0.132 p (1 - p) 0.825 (1 - 0.825)
dove : p = ( p2 + p1 ) /2 = 0.85 + 0.80 / 2 = 0.825
Calcolo della dimensione campionaria:
l’uso del nomogramma
EBM
Potere dello studio desiderato =
80%RISULTATO
:
n =
1800
pazienti (900 per braccio)Statistica descrittiva
Statistica inferenziale e test d’ipotesi
Dimensione campionaria
Classificazione degli studi primari
Studi secondari: revisioni sistematiche e meta-analisi
Definizione di outcome
Misure di rischio
37
Ignaz Philipp Semmelweis (1818-1865)
E
gli notò che la febbre puerperale era più comune nel reparto di
maternità dove medici e studenti di medicina assistevano le
donne per il parto (Divisione A) rispetto al reparto dove ad
assistere erano le ostetriche (Divisione B).
L
a mortalità periparto della Divisione A era del 18%, mentre
quella della Divisione B era del 3%.
A
quel tempo la teoria prevalente per spiegare tale fenomeno era
quella dei miasmi (aria cattiva) in combinazione con le lenzuola
sporche, il basso stato sociale ed influenze climatiche.
Parte I
Ignaz Philipp Semmelweis (1818-1865)
EBM
Morte per sepsi puerperale
Si
No
Reparto A
620
2880 3500
Reparto B
100
3400 3500
M
entre la febbre puerperale imperversava con violenza dentro gli
ospedali, fuori, nella città di Vienna, non si riscontrava tale epidemia.
L
e madri che partorivano in casa avevano un rischio di mortalità molto
basso, e tra le madri che partorivano senza assistenza non si
riscontrava alcuna mortalità.
L
a mortalità non era in alcun modo collegata alle variazioni climatiche.
M
aggiore era la lesione della cervice e dell’utero, maggiori le
probabilità che la madre sviluppasse la febbre puerperale.
L
a chiusura del reparto arrestava sempre la mortalità per un periodo.
Ignaz Philipp Semmelweis (1818-1865)
Ignaz Philipp Semmelweis (1818-1865)
EBM
ienna 1846:
D
a
tali osservazioni, Semmelweis
comprese che la causa non poteva
essere attribuita né a epidemie né a
miasmi, ma doveva trovarsi in un
qualche fattore inspiegato esistente
nella I Divisione, ma non nella II
Parte I
Ignaz Philipp Semmelweis (1818-1865)
ienna 1846:
Jakob Kolletschka, un
giovane docente di medicina
forense, subì un’accidentale
lacerazione durante
un’autopsia e morì
rapidamente per infezione.
Studenti e maestri
sezionavano parecchi
cadaveri al giorno
(ovviamente non
refrigerati) e si lavavano
in modo approssimativo.
Parte I
Parte I
emmelweis comprese che dovevano esser
presenti 3 fattori:
la fonte di materia putrefatta;
un mezzo per trasportare fisicamente tale
materia dalla fonte alla vittima che doveva
venirvi in stretto contatto;
una superficie ferita, come la parete spoglia
Ignaz Philipp Semmelweis (1818-1865)
EBM
Parte I
Ignaz Philipp Semmelweis (1818-1865)
Parte II
Parte II
Semmelweis ordinò che tutti i medici e gli
studenti si lavassero le mani con una soluzione
di cloro al 4% finché la pelle non fosse
scivolosa e l’odore di cadavere sparito.
Il tasso di mortalità per febbre puerperale alla
fine del 1° anno intero di profilassi fu
dell’1,2% nella I Divisione e del 3% nella II
Divisione
Ignaz Philipp Semmelweis (1818-1865)
EBM
Morte per sepsi puerperale
Si
No
Reparto A
620
2880 3500
Reparto B
100
3400 3500
720
6280 7000
Morte per sepsi puerperale
Si
No
Ignaz Philipp Semmelweis (1818-1865)
Parte III
Parte III
Il mondo medico viennese non solo non riconosce come plausibili le
spiegazioni fornite per spiegare la riduzione del tasso di mortalità, che
viene invece attribuito a variazioni della composizione dei miasmi, ma
addirittura isola Semmelweis e lo deride. Di conseguenza si oppone
con forza all’implementazione del nuovo metodo.
Semmelweis, per contro, si rifiuta di pubblicare una spiegazione
logica dei suoi risultati e si rifiuta anche di dimostrare la sua teoria in
esperimenti animali.
Noto per il suo pessimo carattere entra in aperto dissenso con
l’establishment medico viennese apostrofando i suoi colleghi come
Licenziato, torna nella natia Ungheria, dove
nel 1854 diventa professore ordinario di
ginecologia all’Università di Pest.
Ignaz Philipp Semmelweis (1818-1865)
EBM
Parte III
Parte III
A Pest egli istituisce il suo metodo in 2
altri Ospedali, riducendo la mortalità dal
10% a meno dell’1%.
Nel 1861 pubblica il suo trattato sulle febbri
puerperali “Die Aetiologie der Begriff mid die
Prophylaxis des Kindbettfiebers”.
omande
Che tipo di studio fu quello realizzato da
Semmelweis nella I parte?
Che tipo di studio fu quello realizzato da
Semmelweis nella II parte?
Come avrebbe potuto migliorare le prove di
efficacia del trattamento antisettico?
Come avrebbe potuto migliorarne
l’adozione?
Della carne e del macellaio
EBM
Lo studio
49
Gerarchia degli studi
Modificato da: United States Department of Health and Human Services. Agency for Health Care Policy and Research. Acute pain management: operative or medical procedures and trauma. Rockville, MD: AHCPR, 1993:107. (Clinical practice
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
(2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto Lancet 2006; 367: 413–418 Lancet 2006; 367: 413–418 ?? ?????????????????????????? ?????????? ???????????????????????????????????????????????????????????? ??
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto ???????????????????????????????????????? ? Lancet 2007; 369: 920–26 Lancet 2007; 369: 920–26 ????????????????????????????????????????????????
53
Am J Respir Crit Care Med 2007; 176: 886–891Am J Respir Crit Care Med 2007; 176: 886–891
????????????????????????
The U.K. blood system has nearly eliminated female donors from the
production of high plasma volume products (FFP).
The first reports suggest a significant
decrease in TRALI reactions reported to the national transfusion surveillance system (SHOT [serious hazards of transfusion]).
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di controllo studio di coorte
caso-controllo survey
(5) Studio descrittivo (6) Case report
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
BACKGROUND: Large intervention studies suggest that aspirin may reduce mortality when given to patients who present with strokes or transient ischemic attacks. We sought to determine whether patients who were already using aspirin at the time of an ischemic stroke had a lower mortality than those who were not.
METHODS: A prospective study was undertaken in 1,457 patients with acute ischemic stroke, 650 (45%) of whom were using aspirin prior to the stroke. Mortality was measured 4 weeks after the initial episode.
RESULTS: Prior use of aspirin was associated with lower 4-week mortality (14% versus 20%, P <0.01). The effect of prior aspirin use on mortality was independent of age, gender, other risk factors, and use of other medication. CONCLUSIONS: Prior use of low-dose aspirin may be associated with a small but significant reduction in stroke mortality.
Kalra L, et al. Does prior use of aspirin affect outcome in ischemic stroke? Am J Med 2000; 108:205
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
BACKGROUND: La sepsi puerperale ha un’elevata incidenza nelle donne che partoriscono nell’Ospedale di Vienna, ma non nelle donne che partoriscono a casa.
METHODS: Ho riguardato tutti i documenti di donne che sviluppano sepsi e di quelle che non la sviluppano; ho anche parlato con il personale dell’Ospedale per cercare di scoprire possibili cause.
RESULTS: Ho scoperto che la maggior parte delle sepsi avviene nella I Divisione, dove ad assistere le gravide sono medici e studenti. Questi eseguono tutti i giorni numerose autopsie e non si lavano le mani al termine. Questo non succede nella II Divisione dove sono le ostetriche ad assistere le gravide.
CONCLUSIONS: Medici e studenti trasferiscono
materiale cadaverico letale dalla sala autoptica nel canale vaginale delle gravide.
Semmelweiss IP. Assassini. Wien Med J 1847
Ignaz Philipp Semmelweis (1818-1865)
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
BACKGROUND: Medici e studenti trasferiscono
materiale cadaverico letale dalla sala autoptica nel canale vaginale delle gravide. La mortalità è molto alta.
METHODS: Ho obbligato tutti i medici e gli studenti a lavarsi (disinfettarsi) le mani dopo l’autopsia e prima del parto.
RESULTS: Il numero di sepsi puerperali è diminuito drasticamente dal 18,0% all’1,1%
CONCLUSIONS: Coloro che non dovessero seguire il metodo da me indicato sono da considerarsi degli
assassini
Semmelweiss IP. Assassini2. Wien Med J 1848
Ignaz Philipp Semmelweis (1818-1865)
EBM
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
(2) Trial clinico randomizzato (3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
An early cohort in search of favourable
outcomes
Gerarchia degli studi
E’ uno studio osservazionale in cui la popolazione oggetto di studio viene suddivisa in
due (o più) gruppi sulla base del grado di esposizione ad un certo agente (fattore di rischio o trattamento), e seguita nel tempo per valutare quanti individui in ciascun gruppo sviluppano la malattia (o l’outcome di interesse).
Lo studio è spesso prospettico, ma può essere anche retrospettivo .
Gerarchia degli studi
Lo studio caso-controllo
E’ uno studio osservazionale in cui pazienti affetti da una malattia (casi) sono
confrontati con un gruppo di controllo non affetto dalla malattia (controlli). Una volta selezionati in base alla presenza/assenza della malattia, i due gruppi vengono studiati per valutare il grado di esposizione a fattori di rischio.
Lo studio è quasi sempre retrospettivo, ma potrebbe essere anche prospettico (dove
prospettico è il reclutamento dei casi e/o controlli).
Gerarchia degli studi
EBM
La survey
(o cross sectional
survey)
E’ uno studio condotto in un lasso di tempo molto breve su un campione
rappresentativo della popolazione, con lo scopo di “fotografare” la situazione rispetto ad un quesito clinico specifico in un dato momento.
Permette di rilevare soltanto misure di prevalenza di una malattia, mancando
per definizione un periodo di osservazione (follow-up) (Esempio: interviste postali o telefoniche.)
Lo studio viene condotto in un dato momento ma il quesito potrebbe riferirsi
Gerarchia degli studi
Il Case report
E’ lo studio che descrive il caso clinico di un singolo paziente sotto forma di storia.
Case report
Case report
67
An 82-year-old lady presented with sudden, partial, painless visual loss in her right eye.
Fundoscopy revealed a reddish macula, typical of retinal artery occlusion, and an embolus in a branch of the central retinal artery. On general examination, a bruit was heard over the right carotid artery.
The commonest cause of retinal artery occlusion is thromboembolism.
Treatment should be immediate, because if the occlusion lasts longer than about 1 h, the ischaemic part of the optic nerve will atrophy, causing permanent visual loss.
There is no reliable treatment—but if the patient is seen within about 1 h of onset, pressure on the eyeball, firm enough to cause pain, with sudden release, can propel an embolus distally.
(A) Ischaemic patch on the retina. (B) Close-up view of macula. (C) Fluorescein angiography, showing very little filling
Una bambina di 2 anni viene coinvolta in un incidente a bassa velocità. L’air-bag si apre
violentemente. Al momento dell’incidente era seduta nel posto di fianco al guidatore, senza cinture.
Prima dell’arrivo dell’ambulanza è in coma e non respira più. Viene quindi rianimata sul luogo
dell’incidente. A parte diverse abrasioni ed ustioni, non vi sono altri segni di danno all’esame clinico.
La radiografia della colonna vertebrale cervicale mostra un distacco tra l’occipite e l’atlante (frecce) di 4 cm.
All’esame TC si dimostrano emorragia cerebrale, edema cerebrale grave, ematoma intracranico. Inoltre il midollo
equipaggiate con 2 air bags che si gonfiano in meno
di 1/25 di secondo ad una velocità di 322 km/ora.
I bambini sono particolarmente a rischio per lesioni
della testa e del collo da air bag a causa di un
rapporto testa/tronco più alto che nell’adulto e per
varie altre ragioni.
Il danno cervicale è causato da un’iperestensione
violenta. Per prevenire tali danni i bambini con meno
di 12 anni dovrebbero viaggiare solo dietro e con la
cintura di sicurezza allacciata.
Valutare la qualità
BMJ 2003;327:1459–61
BMJ 2003;327:1459–61
……we feel assured that those who
advocate evidence based medicine and
criticise use of interventions that lack an
evidence base will not hesitate to
demonstrate their commitment by
volunteering for a double blind,
randomised, placebo controlled,
crossover trial.
Valutare la fattibilità
Gerarchia degli studi
EBM
Il trial clinico controllato
randomizzato
Disegno di studio relativamente giovane, introdotto nella ricerca medica circa 50 anni
fa. Primo importante clinical trial nel 1948, con confronto tra streptomicina e riposo a letto per il trattamento della tubercolosi.
E’ uno studio sperimentale sugli esseri umani disegnato per valutare l’efficacia di uno
o più forme di trattamento (inteso in senso generale).
Il campione di studio viene suddiviso in due (o più) gruppi: uno assegnato a ricevere
l’intervento (o gli interventi) oggetto di studio, l’altro il trattamento di controllo (terapia standard o placebo).
Il trial viene definito randomizzato quando l’assegnazione del trattamento
(sperimentale e di controllo) ai due gruppi non viene decisa dal medico (o da altri) ma avviene in modo del tutto casuale.
L’idea chiave del clinical trial randomizzato è confrontare gruppi di pazienti che
differiscono soltanto per il trattamento somministrato.
Questo si ottiene grazie all’allocazione randomizzata (i.e. totalmente casuale) ad
un trattamento o all’altro - tutti i pazienti reclutati nello studio hanno la stessa probabilità di ricevere un trattamento o l’altro.
L’allocazione di un paziente ad un trattamento deve essere imprevedibile
(allocation concealment)
Gerarchia degli studi
A cosa serve la randomizzazione ?
EBM
Se la dimensione del campione è
sufficientemente ampia, assicura, che i
determinanti dell’outcome, sia quelli noti che
quelli non noti, si distribuiscano a caso tra il
gruppo di trattamento e quello di controllo.
L’analisi secondo l’intention to treat
2000
1000
1000
70
100
955
875
A
B
A = stent coronarico
B = by pass aorto-coronarico
CONSORT IIIn 2006, Arthur Amman, President of Global Strategies for HIV
Prevention, made a disquieting remark:
“I recently met a physician from southern Africa, engaged in perinatal
HIV prevention, whose primary access to information was abstracts
posted on the internet.
Based on a single abstract, they had altered their perinatal HIV
prevention program from an e ective therapy to one with lesser
ff
e cacy.
ffi
Had they read the full text article they would have undoubtedly realized
that the study results were based on short-term follow-up, a small pivotal
group, incomplete data, and unlikely to be applicable to their country
situation.
Their decision to alter treatment based solely on the abstract’s
Hopewell S, Clarke M, Moher M, Wager E, Middleton P, Altman DG, Schulz KF, and the CONSORT Group
Lancet 2008; 371 (January 26):281-3
Items to be included when
reporting randomised
trials in journal or
conference abstracts
Items to be included when
reporting randomised
trials in journal or
conference abstracts
Un paziente dovrebbe essere arruolato in un trial clinico
randomizzato solo nel caso in cui vi sia sostanziale incertezza su
quale sia il trattamento migliore.
L’interesse che si protegge è quello futuro della popolazione dei
pazienti.
Lancet 2002; 360: 1267
We remain cautious and critical of the conclusion of the ISAT trial,
and believe that this study has not effectively answered the question of what is the preferred mode of therapy because of fundamental flaws in the study design……..
Of the 9559 patients who were eligible for inclusion, 78% were
excluded. Only 9% of the patients refused to participate, and the remaining 69% were excluded by the treating physician. This is not true randomisation, nor does it represent an intention-to-treat
randomised trial.
Britz GW, Newell DW, West GA, Lam A. Lancet 2003; 361:431
We remain cautious and critical of the conclusion of the ISAT trial,
and believe that this study has not effectively answered the question of what is the preferred mode of therapy because of fundamental flaws in the study design……..
Of the 9559 patients who were eligible for inclusion, 78% were
excluded. Only 9% of the patients refused to participate, and the remaining 69% were excluded by the treating physician. This is not true randomisation, nor does it represent an intention-to-treat
randomised trial.
Britz GW, Newell DW, West GA, Lam A. Lancet 2003; 361:431
In ISAT, the required clinical equipoise allowing randomisation did not exist in
80% of the 9278 patients with aneurysmal subarachnoid haemorrhage assessed for eligibility.
In ISAT, the required clinical equipoise allowing randomisation did not exist in
80% of the 9278 patients with aneurysmal subarachnoid haemorrhage assessed for eligibility.
In patients with a ruptured intracranial
aneurysm, for which endovascular coiling
and neurosurgical clipping are therapeutic
options, the outcome in terms of survival
free of disability at 1 year is significantly
better with endovascular coiling.
In patients with a ruptured intracranial
aneurysm, for which endovascular coiling
and neurosurgical clipping are therapeutic
options, the outcome in terms of survival
free of disability at 1 year is significantly
better with endovascular coiling.
L’analisi di sottogruppi
EBM
N Engl J Med 2004;350:2247-56.
Background We conducted a multicenter, randomized, double-blind trial to compare the effect of fluid resuscitation
with albumin or saline on mortality in a heterogeneous population of patients in the ICU.
Methods We randomly assigned patients who had been admitted to the ICU to receive either 4 percent albumin or
normal saline for intravascular-fluid resuscitation during the next 28 days. The primary outcome measure was death from any cause during the 28-day period after randomization.
Results Of the 6997 patients who underwent randomization, 3497 were assigned to receive albumin and 3500 to
receive saline; the two groups had similar baseline characteristics. There were 726 deaths in the albumin group, as compared with 729 deaths in the saline group (relative risk of death, 0.99; 95 percent confidence interval, 0.91 to 1.09;
The primary outcome measure was death from any cause during the 28-day period after randomization.
Death from any cause within 28 days after randomization was also examined in 6
predefined subgroups according to: - the presence or absence of trauma, - the presence or absence of severe sepsis, - the presence or absence of the ARDS at baseline.
This difference in the relative risk of death was due to the
greater number of patients with trauma and an associated
brain injury.
Domandina
Domandina
Usiamo o no
l’albumina nei
L’analisi di sottogruppi
EBM
Un sottogruppo appropriato è rappresentato da un gruppo di pazienti con caratteristiche
di partenza comuni (baseline parameters); in altre parole i sottogruppi devono essere
definiti all’inizio (at baseline) prima della randomizzazione.
Yusuf S, JAMA 1991; 266: 93Il risultato complessivo di un trial clinico randomizzato è usualmente una stima più
affidabile dell’effetto del trattamento nei vari sottogruppi che non gli effetti osservati
nei vari sottogruppi.
Yusuf S, JAMA 1991; 266: 93Un’analisi di sottogruppo che dimostra un’interazione qualitativa (il trattamento è
positivo in un sottogruppo e negativo in un altro) difficilmente può essere vero, dato
che i partecipanti al trial condividono un numero sufficiente di caratteristiche tale da
rendere tale interazione improbabile.
Horton R, Lancet 2000; 355:1033Se si includono troppi sottogruppi, aumenta in modo sostanziale la probabilità di
trovare una differenza “statisticamente significativa” per puro effetto del caso
(multiplicity o multiple comparisons).
Assmann SF, Lancet 2000;355:1064FARM6JS3R5. Gattinoni L, Pesenti A, Caironi P, Fumagalli R, Latini R, Tognoni G.
Efficacia della somministrazione di albumina nel rimpiazzo/espansione volemica dei pazienti con sepsi severa e shock settico.
Il problema dei test multipli
EBM
• Per ogni test eseguito, l’errore α (fissato dal valore soglia di p) é basso. Se si
eseguono test multipli sugli stessi dati (es. analisi di sottogruppo), la
probabilità globale di errore α aumenta col numero dei tests.
• Esempio: su 100 analisi di sottogruppo eseguite sulla popolazione di studio
(maschi vs femmine, vecchi vs giovani, europei vs africani, etc), ci
aspettiamo che 5 siano positive per il solo effetto del caso.
• In presenza di test multipli, l’errore α va controllato riducendo il valore
soglia di p per ogni singolo test (es. correzione di Bonferroni: p
corr= p/n.
tests)
Esempio. ISIS-2 trial: aspirina vs placebo nell’infarto miocardico acuto
(2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto Lancet 2006; 367: 413–418 Lancet 2006; 367: 413–418
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto Lancet 2007; 369: 920–26 Lancet 2007; 369: 920–26
93
The U.K. blood system has nearly eliminated female donors from the
production of high plasma volume products (FFP).
The first reports suggest a significant
decrease in TRALI reactions reported to the national transfusion surveillance system (SHOT [serious hazards of transfusion]).
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato (3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di controllo studio di coorte
caso-controllo survey
(5) Studio descrittivo (6) Case report
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato (3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
BACKGROUND: Large intervention studies suggest that aspirin may reduce mortality when given to patients who present with strokes or transient ischemic attacks. We sought to determine whether patients who were already using aspirin at the time of an ischemic stroke had a lower mortality than those who were not.
METHODS: A prospective study was undertaken in 1,457 patients with acute ischemic stroke, 650 (45%) of whom were using aspirin prior to the stroke. Mortality was measured 4 weeks after the initial episode.
RESULTS: Prior use of aspirin was associated with lower 4-week mortality (14% versus 20%, P <0.01). The effect of prior aspirin use on mortality was independent of age, gender, other risk factors, and use of other medication. CONCLUSIONS: Prior use of low-dose aspirin may be associated with a small but significant reduction in stroke mortality.
Kalra L, et al. Does prior use of aspirin affect outcome in ischemic stroke? Am J Med 2000; 108:205
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
Vienna, ma non nelle donne che partoriscono a casa.
METHODS: Ho riguardato tutti i documenti di donne che sviluppano sepsi e di quelle che non la sviluppano; ho anche parlato con il personale dell’Ospedale per cercare di scoprire possibili cause.
RESULTS: Ho scoperto che la maggior parte delle sepsi avviene nella I Divisione, dove ad assistere le gravide sono medici e studenti. Questi eseguono tutti i giorni numerose autopsie e non si lavano le mani al termine. Questo non succede nella II Divisione dove sono le ostetriche ad assistere le gravide.
CONCLUSIONS: Medici e studenti trasferiscono
materiale cadaverico letale dalla sala autoptica nel canale vaginale delle gravide.
Semmelweiss IP. Assassini. Wien Med J 1847
(2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
(2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
BACKGROUND: Medici e studenti trasferiscono
materiale cadaverico letale dalla sala autoptica nel canale vaginale delle gravide. La mortalità è molto alta.
METHODS: Ho obbligato tutti i medici e gli studenti a lavarsi (disinfettarsi) le mani dopo l’autopsia e prima del parto.
RESULTS: Il numero di sepsi puerperali è diminuito drasticamente dal 18,0% all’1,1%
CONCLUSIONS: Coloro che non dovessero seguire il metodo da me indicato sono da considerarsi degli
assassini
Semmelweiss IP. Assassini2. Wien Med J 1848
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
(1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato
(3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di
controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto
Che tipo di studio fu quello realizzato da
Semmelweis nella I parte?
Che tipo di studio fu quello realizzato da
Semmelweis nella II parte?
Come avrebbe potuto migliorare le sue
prove di efficacia del trattamento
antisettico?
omande
EBMOsservazionale
caso-controllo
Osservazionale
caso-controllo
Sperimentale con
controllo storico
Sperimentale con
controllo storico
Introducendo un
gruppo di controllo
e randomizzando i
pazienti
Introducendo un
gruppo di controllo
e randomizzando i
pazienti
pseudonimo di Louis Destouches
Lo scrittore maledetto 1894-1961
Tesi di laurea in Medicina, Sorbona 1924:
“Il dottor Semmelweis”.
ubblicare
EBM
1. scegliere outcome importanti per i malati
2. disegnare studi di qualità elevata
3. presentare i risultati in modo chiaro ed efficace
…
By STEPHEN J. DUBNER and STEVEN D. LEVITT Published: September 24, 2006
How do you get doctors to wash their hands?
nce Semmelweis had these doctors wash their hands with an antiseptic solution, the mortality rate plummeted. But Semmelweis’s mandate, as crucial and obvious as it now seems, has proved devilishly hard to enforce. A
multitude of medical studies have shown that hospital personnel wash or disinfect their hands in fewer than half the instances they should. And doctors are the worst offenders, more lax than either nurses or aides.
Reasons? Arrogance? ‘Hey, I couldn’t be carrying the bad bugs. It’s the other hospital personnel.’
……So the hospital needed to devise some kind of incentive scheme that would increase compliance ………. They’d try to “catch” a doctor who was washing up, giving him a $10 Starbucks card as reward. You might think that the highest earners in a hospital wouldn’t much care about a $10 incentive — “but none of them turned down the card”.
…….When the nurse spies reported back the latest data, it was clear that the hospital’s efforts were working — but not nearly enough. Compliance had risen to about 80 percent from 65 percent, but the Joint Commission required 90 percent compliance.
…… after they finished their lunch, Murthy handed each of them an agar plate — a sterile petri dish loaded with a spongy layer of agar. “I would love to culture your hand,” she told them. They pressed their palms into the plates, and Murthy sent them to the lab to be cultured and photographed.
Statistica descrittiva
Statistica inferenziale e test d’ipotesi
Dimensione campionaria
Classificazione degli studi primari
Studi secondari: revisioni sistematiche e meta-analisi
Definizione di outcome
Misure di rischio
Sintesi qualitativa: Revisione condotta in maniera sistematica, con
protocollo che preveda l’uso di metodologia standardizzata e
riproducibile
Nasce in alternativa alla review tradizionale (“narrativa”) condotta
da esperti del settore. Rispetto a questa e’:
Decisamente piu’ impegnativa
Libera (se ben condotta) dalla soggettivita’ di giudizio
La review sistematica
EBM
Prevede la raccolta di (possibilmente) tutti gli studi effettuati su
un dato argomento
Prevede definizione a priori di:
Tipo di studio da includere (es.: RCT)
Strumenti di ricerca:
1. database computerizzati
2. voci bibliografiche
3. contatti con gli autori, meetings, dissertazioni, abstract, tesi, altro
(“gray literature”)
Ramritu et al.
Flow-chart di inclusione/esclusione degli studi
Kelly et al.
Ann Intern Med 2008; 148:284-94
Meta-analysis: Effectiveness of Drugs for Preventing Contrast-Induced Nephropathy
Estrazione dei dati
From: Conducting the review. Data extraction. Centre for Reviews and
Dissemination (CRD). University of York, UK.
Definizione “a priori” dei criteri di valutazione della qualita’
Problema: troppe scale di valutazione, con scarsa concordanza
nel giudizio
In generale, sconsigliato l’uso di un punteggio di qualita’ nella
meta-analisi
EBM
Guida alla valutazione della qualita’ di RCT
From: Conducting the review. Study quality assessment. Centre for
Reviews and Dissemination (CRD). University of York, UK.
Sintesi quantitativa: Analisi statistica dei risultati di un insieme di
studi su un argomento specifico, ottenuta raggruppando i dati dei
singoli studi in un pool unico e calcolando una stima combinata
dell’effetto di interesse
Non sempre possibile combinare i risultati dei differenti studi
(eterogeneità)
Talvolta l'utilità si limita ad evidenziare fonti possibili di
disaccordo (eterogeneita’) tra gli studi
EBM
La meta-analisi
Scopi principali:
Fornire stime dell'effetto più precise
Identificare possibili cause di eterogeneità dei risultati degli studi
Aumentare la generalizzabilità dei risultati
Benefit of anticoagulant prophylaxis
Harm of anticoagulant prophylaxis
Calcolo di una stima combinata dell’effetto
Stima combinata ottenuta come media pesata dei risultati degli studi
Il peso di ogni studio e’ basato sulla varianza del risultato, quindi
sulla dimensione campionaria dello studio
Modelli statistici per la meta-analisi
Modello a effetto fisso – in assenza di eterogeneita’
Modello a effetti random – in presenza di eterogeneita’
Importante quindi la valutazione dell’eterogeneita’ tra studi
Quantificare il grado di eterogeneita’
Capirne le cause (differenze di popolazione studiata, modalità di
trattamento, etc.)
Test statistici
Test di eterogeneità –
2test (significativo se p<0.10)
Basso potere statistico
Valutazione del grado di eterogeneità tra studi
Analisi di sensibilità
EBM
Egger et al. British Medical Journal 1997; 315:1533-7
Metanalisi sui ß-bloccanti nella
prevenzione secondaria dopo
infarto miocardico
Studi con risultati positivi, negativi o di effetto nullo hanno minor
probabilità di essere pubblicati
Verifica della presenza di bias di pubblicazione
Funnel plot
Tests – il piu’ comune e’ il test di Egger che valuta formalmente
l’asimmetria del funnel plot
Ramritu et al.