STUDI SPERIMENTALI
Dott.ssa
Domenica Gazineo
domenica.gazineo@aosp.bo.it
Premessa
• Negli anni si sono moltiplicati i termini utilizzati per descrivere le numerose varianti di trial
• La terminologia si è progressivamente arricchita dando vita a un “linguaggio dei trial”, non
sempre intuitivo né di immediata comprensione
• Se alcuni termini sono mutuamente esclusivi, altri si sovrappongono in maniera variabile e/o possono essere utilizzati in maniera
complementare
Classificazione dei trial in relazione a…
• Modalità di assegnazione dei partecipanti
• Unità di randomizzazione
• Numero dei partecipanti
• Numero dei centri
• Conoscenza del trattamento assegnato
• Preferenze dei partecipanti
• Obiettivi
Classificazione dei trial in relazione a…
• Obiettivi
• 1.1. Explanatory (efficacy) vs pragmatic (effectiveness)
• 1.2. Trial di fase I, II, III, IV
• 1.3. Trial di superiorità, di equivalenza, di non-inferiorità
1.1. Explanatory vs pragmatic trial
• Gli explanatory trial hanno l’obiettivo di dimostrare
l’efficacia degli interventi sanitari (farmaci in particolare) in contesti sperimentali ideali (efficacy) .
• Gli explanatory trial generalmente arruolano popolazioni selezionate e omogenee escludendo pazienti
“complessi” (comorbidità, polifarmacia, anziani, donne);
spesso l’intervento in studio è confrontato con il placebo, con un farmaco meno efficace o utilizzato a dosaggi inferiori; prevedono spesso periodi di run-in e/o di wash- out; competenze e motivazioni dei professionisti e
standard organizzativo-assistenziali ideali rispetto alla realtà.
1.1. Explanatory vs pragmatic trial
• Poiché l’efficacia reale (effectiveness) degli
interventi sanitari viene influenzata da numerosi fattori – grado di accuratezza diagnostica,
aderenza dei professionisti ai risultati del trial, compliance dei pazienti, diffusione delle
tecnologie, equità d’accesso ai servizi sanitari – per dimostrare l’efficacia nel mondo reale si fa spesso riferimento agli studi osservazionali che, rispetto ai trial, tendono a sovrastimare l’efficacia dei trattamenti
1.1. Explanatory vs pragmatic trial
• I pragmatic trial hanno l’obiettivo di dimostrare l’efficacia reale (effectiveness) di interventi sanitari di provata
efficacy
• I partecipanti vengono randomizzati per prevenire il bias di assegnazione, ma i criteri di selezione sono molto ampi, al fine di arruolare un campione quanto più simile alla popolazione reale
• I pazienti vengono inclusi nello studio in base ai sintomi, piuttosto che sulla base di test diagnostici molto accurati;
i regimi terapeutici sono flessibili prevedono che il paziente possa rifiutare il trattamento proposto
1.1. Explanatory vs pragmatic trial
• Le condizioni assistenziali e il training dei professionisti sono simili a quelli reali.
• Di fatto, è impossibile classificare i trial in due categorie mutuamente esclusive,
perchè nello stesso studio generalmente convivono “attitudini” sia explanatory, sia pragmatic
1.2. Trial di fase I, II, III, IV
• I trial di fase I vengono avviati dopo la conclusione della ricerca pre-clinica con l'obiettivo di valutare sicurezza dei farmaci sull’uomo
• Sono studi non controllati, condotti su poche decine di volontari sani o di pazienti in fase terminale e/o senza altre alternative terapeutiche (AIDS, oncologia, malattie rare)
• Il farmaco viene somministrato a dosaggi crescenti per verificare l’eventuale comparsa di effetti collaterali
1.2. Trial di fase I, II, III, IV
• I trial di fase II hanno l’obiettivo primario di valutare la potenziale efficacia del nuovo farmaco studiando differenti dosaggi e frequenze di somministrazione.
• Possono identificare effetti avversi non rilevati nella fase I.
• In coerenza con i loro obiettivi primari, i trial di fase II
dovrebbero sempre essere non controllati, ma negli ultimi anni - per l’incalzante necessità di anticipare l’immissione in mercato di nuovi farmaci - un numero sempre maggiore di studi di fase II prevedono il gruppo di controllo vs
placebo
1.2. Trial di fase I, II, III, IV
• I trial di fase III corrispondono ai trial controllati randomizzati, evidenze scientifiche che
permettono, nella maggior parte dei casi, di ottenere la registrazione del farmaco e la conseguente immissione sul mercato
• Gli studi di fase III, per ragioni etiche, dovrebbero sempre confrontare il nuovo farmaco con il miglior trattamento disponibile
1.2. Trial di fase I, II, III, IV
• I trial di fase IV possono essere condotti solo dopo l’immissione in commercio del nuovo farmaco e oggi, di fatto, si identificano con i trial pragmatici
• La fase IV della ricerca farmacologica (costituita prevalentemente da studi osservazionali post- marketing con l’obiettivo di valutare la sicurezza dei farmaci a seguito del loro uso su larga scala) non coincide con i trial di fase IV, condotti con l’obiettivo di valutare l’effectiveness di trattamenti di dimostrata efficacy
1.3. Trial di superiorità
• L’obiettivo dei trial di superiorità è dimostrare che il trattamento sperimentale è più efficace rispetto a quello standard (o al placebo)
• Un trial di superiorità risulta statisticamente significativo quando viene rifiutata l’ipotesi nulla, secondo la quale gli interventi sanitari a confronto hanno la stessa efficacia
1.3. Trial di superiorità
1.3. Trial di equivalenza
• Hanno l’obiettivo di dimostrare che il trattamento sperimentale è equivalente a quello standard
• Non permettono di dimostrare l’equivalenza assoluta dei trattamenti a confronto, ma solo l’assenza di differenze all’interno di un intervallo definito (margine di
equivalenza) che, oltre a essere molto ristretto - dovrebbe identificare una differenza clinicamente irrilevante
• I trial di equivalenza sono poco diffusi perché richiedono l’arruolamento di un numero molto elevato di
partecipanti, senza offrire grandi vantaggi organizzativo- economici rispetto ai trial di superiorità
Trial di equivalenza
1.3. Trial di non-inferiorità
• Hanno l'obiettivo di dimostrare che il
trattamento sperimentale non è inferiore rispetto al controllo, accettando che possa anche essere meno efficace di un valore predefinito (margine di non-inferiorità) che identifica una differenza non rilevante dal punto di vista clinico.
1.3. Trial di non-inferiorità
• Senza entrare nel merito della non eticità di questi trial, né delle loro criticità metodologiche, questa tipologia di studi si è progressivamente diffusa in un particolare momento storico della ricerca clinica (in particolare farmacologica)
dove, se è molto difficile e costoso dimostrare la superiorità di una nuova terapia rispetto a quella standard, i trial di non-inferiorità assicurano
comunque al prodotto l’immissione sul mercato.
1.3. Trial di non-inferiorità
Classificazione dei trial in relazione a…
2. Modalità di assegnazione dei partecipanti
• 2.1. Disegno parallelo
• 2.2. Disegno crossover
• 2.3. Disegno fattoriale
2.1. Trial con disegno parallelo
• Ciascun gruppo di partecipanti riceve un intervento differente
• Nella sua struttura più semplice a due bracci il gruppo dei trattati riceve
l’intervento sperimentale e il gruppo dei controlli il trattamento standard o il
placebo
2.2. Trial con disegno crossover
• Ciascun partecipante riceve entrambi gli
interventi in studio: sperimentale (A) e controllo (B) con sequenza differente definita dalla
randomizzazione.
• I partecipanti vengono randomizzati a ricevere due (o più trattamenti): il gruppo sperimentale riceve la sequenza A → B e il gruppo di controllo la sequenza B → A.
• La criticità principale è l’estensione degli effetti del primo trattamento che possono alterare la risposta del secondo (carry over effect)
2.2. Trial con disegno crossover
• Per tale ragione i trial con disegno crossover spesso prevedono un periodo di wash-out tra la sospensione del primo trattamento e l’inizio del secondo.
• Hanno un utilizzo abbastanza limitato: in
particolare per valutare l’efficacia di interventi sanitari, possibilmente senza effetti prolungati, su outcome a breve termine in malattie croniche relativamente stabili.
2.3. Trial con disegno fattoriale
• L’efficacia di due (o più) interventi sanitari non è valutata solo individualmente, ma anche in
associazione e vs placebo.
• In un trial con disegno fattoriale che valuta l’efficacia degli interventi A e B i partecipanti vengo randomizzati in quattro bracci: A, B, A+B, placebo
• Questo disegno è spesso utilizzato per valutare l’efficacia d’interventi di prevenzione primaria
Classificazione dei trial in relazione a…
3. Unità di randomizzazione
• 3.1. Partecipanti
• 3.2. Gruppi di partecipanti
• 3.3. Parti del corpo
3.1. Partecipanti
• Nella maggior parte dei trial l’unità di randomizzazione è rappresentata dal singolo partecipante, sia malato o sano
3.2. Gruppi di partecipanti
• Nei trial con randomizzazione cluster vengono assegnati in maniera casuale
gruppi di partecipanti costituiti da ospedali, distretti sanitari, famiglie, scuole, comuni, etc.
3.3. Parti del corpo
• Alcuni trial randomizzano organi o parti del corpo bilaterali
• In oculistica, ortopedia, dermatologia sono pubblicati RCTs in cui l’unità di randomizzazione è costituita, rispettivamente, dall’occhio o da un arto.
• Uno dei presupposti fondamentali per la pianificazione di questi trial è che l’efficacia
dell’intervento in studio possa essere valutata solo nell’organo randomizzato e non abbia effetti
sistemici (es. chirurgia della cataratta, protesica, terapie topiche in dermatologia)
Classificazione dei trial in relazione a…
4. Numero dei partecipanti
• 4.1. N-of-1 RCT vs mega-trial
• 4.2. Campione fisso vs campione variabile
4.1. N-of-1 RCT
• Il N-of-1 trial è una sperimentazione clinica condotta sul paziente individuale che viene sottoposto a periodi, assegnati in maniera random, in cui si alternano trattamento sperimentale e controllo, rappresentato generalmente dal placebo.
• Sia il medico che il paziente dovrebbero essere mantenuti in cieco rispetto al trattamento
ricevuto e la valutazione degli outcome,
prevalentemente soggettivi, viene effettuata dal paziente utilizzando un diario standardizzato.
4.1. Mega-trials
• Trial, generalmente multicentrici, che arruolano migliaia di partecipanti.
• Anche se nell’immaginario collettivo il numero di soggetti arruolati è uno dei
criteri di qualità di un trial, i “grandi numeri”
sono in realtà necessari per dimostrare la significatività statistica di differenze
sempre minori tra i nuovi trattamenti e quelli tradizionali.
4.2. Campione fisso vs sequenziali
• Nei trial a campione fisso (fixed-size) viene effettuata a priori la stima della dimensione del campione
necessario.
• Nei trial sequenziali i partecipanti vengono
progressivamente arruolati sino al raggiungimento di una differenza statisticamente significativa tra i due gruppi, oppure alla ragionevole certezza di equivalenza tra i due trattamenti.
• Un trial sequenziale dovrebbe essere considerato solo quando è possibile verificare il raggiungimento
dell’outcome primario in tempi molto brevi
Classificazione dei trial in relazione a…
5. Numero dei centri
• 5.1. Monocentrici
• 5.2. Multicentrici
5. Monocentrici vs multicentrici
• Nei trial monocentrici i partecipanti vengono arruolati da un unico centro
• Nei trial multicentrici da due o più centri, senza alcuna limitazione di numero e di area geografica.
• I trial multicentrici richiedono consistenti investimenti per l’identificazione e il reclutamento dei centri, consentono l’arruolamento di un numero molto elevato di partecipanti e aumentano l’applicabilità clinica dei risultati, in quanto le popolazioni provengono da differenti setting
assistenziali ubicati in paesi o in continenti
5. Monocentrici vs multicentrici
• Le eventuali differenze di risultati tra i diversi centri, svelate dalle analisi per sottogruppi, sono condizionate sia dalle performance dei vari setting assistenziali, sia da fattori etnici, genetici e ambientali delle popolazioni arruolate.
Classificazione dei trial in relazione a…
6. Conoscenza del trattamento assegnato
7. Conoscenza del trattamento assegnato
• Il blinding è lo strumento metodologico che impedisce a una o più categorie di soggetti coinvolti nel trial di
conoscere il trattamento è assegnato ai due (o più) gruppi di partecipanti
• L’obiettivo del blinding è di prevenire il performance bias e, soprattutto, il detection bias che conseguono al fatto che una o più categorie di soggetti coinvolti nello studio sono a conoscenza del trattamento assegnato
• Considerato che la terminologia classica (singolo, doppio, triplo cieco) è poco riproducibile e ambigua, il CONSORT Statement 2010 raccomanda di riportare quali categorie di soggetti coinvolti nel trial sono blinded
•Participants: soggetti randomizzati
•Healthcare providers: medici e altri professionisti sanitari che assistono i partecipanti e/o somministrano l’intervento
•Data collectors: soggetti che raccolgono i dati (segni, sintomi, questionari, etc); possono identificarsi con gli healtcare providers e/o con gli outcomes assessors
•Outcomes assessors: hanno il compito di definire se il partecipante ha raggiunto, o meno, l’outcome di
interesse
•Data analysts: statistici che analizzano i dati
•Data safety and monitoring committee: comitato che rivede i dati sulla sicurezza-efficacia dei
trattamenti
•Writers: autori del manoscritto
Classificazione dei trial in relazione a…
7. Preferenze del paziente
7. Preferenze del paziente
• In un RCT i partecipanti hanno la stessa probabilità di essere assegnati al gruppo sperimentale o a quello di controllo.
• Questa peculiarità metodologica determina inevitabilmente un errore sistematico nella popolazione che accetta di partecipare al trial.
• Infatti, i pazienti che vorrebbero essere
assegnati all’intervento “preferito” rifiutano di partecipare allo studio
7. Preferenze del paziente
• Il problema si presenta quando i partecipanti hanno una maggiore preferenza sia per
l’intervento tradizionale, sia per quello
sperimentale, in particolare se accessibile solo all’interno di una sperimentazione clinica perchè non ancora disponibile sul mercato.
• In alcune situazioni questo bias può essere
prevenuto utilizzando specifici disegni di trial che considerano le preferenze dei pazienti (patient preferences trials): disegno di Zelen, disegno di Brewin-Bradley (comprehensive cohort design) e il disegno di Wennberg.
Studi Randomizzati e Controllati - RCT
• TRIAL = prova, studio, esperimento.
• RANDOMISED = randomizzato, campione preso a caso.
• CONTROLLED = controllato, raffrontato con un campione di controllo.
Trial randomizzati e controllati
• Sono gli studi sperimentali considerati il
“gold standard” per la valutazione dei
trattamenti, grazie al loro disegno formulato in modo da minimizzare i bias rispetto ad altri disegni.
Trial randomizzato e controllato
• Negli RCT i membri del campione sono assegnati in modo randomizzato ai due
gruppi: ciò consente di costituire due gruppi in cui i fattori prognostici, sia noti che non, sono equamente distribuiti, e quindi identici ad eccezione del trattamento sperimentato.
RCT
Pazienti eleggibili Randomizzazione
Intervento sperimentale
Intervento di controllo
Outcome
No outcome
Outcome
No outcome
Direzione della raccolta dati: esposizione Outcome
Valutazione critica degli RCTs
Come valutare criticamente un RCT
• Durante la lettura di una pubblicazione si devono trovare informazioni sufficienti, presentate chiaramente e coerentemente, affinché si possa decidere, in base alle evidenze fornite dagli autori, se le
conclusioni a cui arrivano sono logiche e credibili.
Le dimensioni da valutare
• Valutazione preliminare
• Validità interna
• Rilevanza clinica
• Validità esterna
Elementi del PICO
• P: sono descritti i criteri di inclusione/esclusione e il setting
• I & C: devono essere descritti chiaramente,
• O: l’endpoint primario dovrebbe essere clinicamente rilevante. Se surrogato deve essere validato.
• M: appropriatezza del disegno dello studio
Endpoint negli RCTs
• Gli endpoint sono gli esiti che vengono valutatati nello studio.
• La loro definizione influenza la rilevanza clinica dello studio.
Endpoint
• Umanistici
• Economici
• Clinici:
– Clinicamente rilevanti – Surrogati
• Validati
• Non validati
• Hard vs Soft
End-point
Clinicamente rilevanti
• Misurano come un individuo si sente, funziona,
sopravvive.
Surrogati
• sono il risultato di indagini
laboratoristiche o radiologiche che non sono connesse a situazioni
clinicamente rilevanti.
Esempi di endpoint surrogati
• Valutazione della conta delle colonie
batteriche, anziché dell’insorgenza di infezioni delle ferite;
• Valutazione del colesterolo totale anziché della mortalità coronarica o degli eventi coronarici;
• La densitometria ossea per lo screening della osteoporosi.
• Ecc……….
Intervento
Patologia
End point surrogato
Outcome clinico reale
Endpoint surrogato funziona
se…
Domande preliminari
• Se lo studio non risponde positivamente alle domande preliminari possiamo anche terminarne la lettura.
• Se invece gli elementi del PICO sono ben descritti e se il disegno è coerente
possiamo valutare la validità interna.
Validità interna
Validità interna
• La valutazione della validità interna
presuppone la verifica dell’assenza di bias che possono avere compromesso la
validità dei risultati ottenuti, qualsiasi essi siano.
• Il riscontro di un bias in questa fase può far cessare la necessità di continuare la valutazione critica dello studio.
Bias negli RCTs
• Bias di selezione/allocazione
• Bias di accertamento
• Bias di violazione del protocollo
• Follow up non sufficientemente lungo e completo.
Bias di selezione/allocazione
• Accade quando gli outcome di uno studio sono influenzati dalle differenze
sistematiche (reali e non casuali) dei due gruppi di studio, che dipendono dalle
modalità con cui le persone sono state selezionate a partecipare al trial o con cui sono state assegnate ai due gruppi.
Bias di selezione/allocazione
• La prevenzione di questo tipo di bias si realizza con una corretta
randomizzazione
, che sia casuale ed implementata in modo nascosto.Bias di selezione/allocazione
• Se uno studio è realmente randomizzato, l’allocazione ai gruppi non può essere influenzata dai ricercatori o dai
partecipanti allo studio.
Cosa valutare
• Per verificare la presenza di selection bias verificare che non siano stati posti dei filtri al di là dei criteri dichiarati.
• Occorre verificare che la generazione della lista di randomizzazione sia stata casuale e che questa sia stata mantenuta nascosta.
Bias di accertamento
• Accade quando i risultati o le conclusioni di un trial sono distorte dalla conoscenza relativa all’intervento a cui ogni partecipante è stato sottoposto.
• Questo tipo di errore può essere determinato da chi eroga l’intervento, dai soggetti studiati, dai ricercatori che valutano o analizzano gli
outcome e da coloro che scrivono l’articolo descrivente il trial.
Bias di accertamento
• Il miglior modo per evitare questo bias è mantenere le persone coinvolte nello studio non a conoscenza dell’identità dell’intervento il più a lungo possibile, realizzando quella che è detta CECITA’.
Cecità
• Si tratta di uno degli accorgimenti fondamentali per evitare la
compromissione della validità interna dello studio.
Tipologie di Cecità
– Open trial o open label
– Cieco specificando chi è stato reso cieco rispetto al trattamento e con quali modalità è stata realizzata la cecità
– Non è più accettata la semplice descrizione di cecità
La violazione del protocollo
• La violazione del protocollo si realizza in questi casi:
– Withdrowal o drop-out: hanno sospeso il trattamento;
– Non compliant: hanno assunto farmaci proibiti o i farmaci giusti nei modi/tempi sbagliati
– Cross over: hanno ricevuto il trattamento del gruppo opposto.
Come si tratta la violazione del protocollo?
• In due modi:
– Mediante i criteri di selezione.
– Con l’analisi secondo l’INTENTION TO TREAT
Intention to treat
• L’analisi secondo Intention to treat è un tipo di analisi dei risultati in cui non
vengono valutati solo coloro che hanno effettivamente assunto il trattamento, ma tutti coloro che sono stati assegnati a quel tipo di trattamento.
Intention to treat
• Ciò si giustifica con il fatto che, se il trattamento procura effetti indesiderati tali da non
consentire al soggetto di seguire correttamente la terapia, considerare il suo esito negativo nel gruppo di controllo, piuttosto che non
considerarlo affatto, ne accrescerebbe l’efficacia (è dimostrato infatti che chi non segue il protocollo ha esiti peggiori).
Come facciamo a capire se è stata fatta?
• Al di là delle dichiarazioni degli autori nel testo, che spesso riportano che l’analisi è stata fatta secondo l’intention to treat, è sufficiente verificare che il numero dei pazienti analizzati corrisponda al numero dei pazienti randomizzati.
Intention to treat
Il follow up
• Deve essere sufficientemente lungo e completo.
• Varia a seconda del tipo di intervento che si vuola studiare
Persi al follow up
• I pazienti persi (lost) al follow up sono quelli di cui si sono perse le notizie, per cui non si sa se hanno presentato l’esito o meno,
indipendentemente dall’assunzione del trattamento secondo il protocollo.
In ogni caso
• Rispetto ai persi al follow up gli autori dovrebbero:
– Verificare che i gruppi dei pazienti rimasti nello studio siano rimasti omogenei anche dopo l’eliminazione dei persi.
– Verificare che la numerosità residua sia sufficiente per mantenere la potenza dello studio.
– Discutere laddove possibile delle cause per il ritiro dallo studio.
Rilevanza clinica
Misure di efficacia nei trials
• Nella lettura degli studi troveremo indicate diverse misure di efficacia.
• La comprensione del loro significato,
l’interpretazione del loro valore e della loro precisione ci servono per capire la forza e la direzione dell’associazione che vi è tra trattamento e outcome (e quindi di capire se l’intervento è efficace e in che misura.
L’efficacia negli studi
• I dati all’interno degli studi possono riguardare variabili continue (glicemia, temperatura,
pressione, colesterolemia) o variabili discrete o dicotomiche (vivo o morto, frattura o non
frattura, guarito o non guarito).
• Nel primo caso i ricercatori riportano
l’intervallo di valori nel quale si modificano i parametri in seguito all’intervento,
confrontando le medie o le mediane dei valori.
• Nel secondo caso i ricercatori riportano la frequenza con cui si verifica l’evento.
Es. con variabili discrete
• Cullen l, et al. Nebulized lidocaine decrease the
discomfort of nasogastric tube insertion: a randomized, doubleblind trial. Ann Emerg Med 2004; 44: 131-7.
• La somministrazione di lidocaina nebulizzata prima dell’inserimento del sondino naso gastrico riduce il discomfort del paziente?
• P: Adulti da sottoporre a posizionamento del SNG in pronto soccorso.
• Intervento: nebulizzazione di lidocaina nella narice da utilizzare.
• Confronto: nebulizzazione di soluzione fisiologica.
• Outcome: disagio misurato attraverso una scala visuale analogica (misura discreta), difficoltà di inserimento del sondino (misura discreta).
Disagio riferito (media dei punteggi della scala visuale analogica)
37.7 59.3 21.6 (5.3 a
38.0)
Difficoltà percepita dall’infermiere nell’inserimento del SNG
2 2 0 (-1 a 1)
Esempio
Misure di associazione
relative ed assolute
Misure di associazione
Endpoint dicotomici
• Tutte le volte che lo studio riporta i dati espressi come variabili dicotomiche al
fine di calcolare le misure di associazione occorre porre i dati in una tabella 2 x 2 o tabella di contingenza.
Misure di efficacia per gli esiti discreti
• Il primo passaggio per capire le diverse misure di efficacia consiste nel tabellare i dati.
Evento Sì Evento No
Gruppo sperimentale
a b a + b
Gruppo di controllo
c d c + d
a + c b + d
Un esempio reale
• Trivedi DP, Doll R, Khaw KT. Effect of four montly oral vitamin D3 supplementation on fracutres and mortality in men and women living in the community: randomised double blind controlled trial. BMJ 2003; 326:469-72.
• La somministrazione di un integratore di Vitamina D3 per via orale riduce l’incidenza di fratture negli anziani (65-85) residenti al domicilio?
• P: anziani residenti al domicilio.
• Intervento: somministrazione di un integratore di Vit D3.
• Confronto: somministrazione di un placebo.
• Outcome: Incidenza di fratture e mortalità da tutte le cause.
• Metodo: RCT
Gruppo intervento
Frattura Non frattura
N. Tot.
Trattamento
sperimentale 119 1226 1345
Trattamento
controllo 149 1192 1341
a d c
b
Questa è la partenza per calcolare:
RR RRR
OR ARR NNT
La frequenza dell’evento nei due gruppi:
EER e CER
Per calcolare RRR, RR, ARR, una volta tabellati i dati occorre calcolare la frequenza dell’evento nei due gruppi:
EER (Experimental Event Rate) CER (Control Event Rate)
La misura degli effetti quando si utilizzano outcome dicotomici
Experimental Event Rate Frequenza (o rischio) nel gruppo sperimentale
a EER = ---
a + b
La EER ci dice con che frequenza l’endpoint
si è verificato
nel gruppo sperimentale
La misura degli effetti quando si utilizzano outcome dicotomici
Control Event Rate
Frequenza (o rischio) nel gruppo di controllo
c
CER = --- c + d
La CER ci dice con che frequenza l’endpoint
si è verificato nel gruppo di controllo
Rischio Relativo
• Il rischio relativo esprime il rapporto tra il rischio che si verifichi l’evento nel gruppo sperimentale ed il rischio che si verifichi nel gruppo di controllo.
• Per calcolarlo, una volta tabellati i dati occorre calcolare la frequenza dell’evento nei due gruppi:
EER (Experimental Event Rate) e CER (Control Event Rate)
La misura degli effetti quando si utilizzano outcome discreti
Rischio Relativo a EER ---
a + b RR = --- = ---
c CER ---
c + d
Dal rapporto tra EER e CER individuiamo il rischio relativo che ci dice quanto è grande
il rischio di
manifestare l’evento negativo nel gruppo sperimentale
rispetto
a quello del gruppo di controllo.
Un esempio reale sul trattamento
Gruppo intervento
Frattura Non frattura
N. Tot.
Trattamento
sperimentale 119 1226 1345
Trattamento
controllo 149 1192 1341
a d c
b
Rischio Relativo
EER 0,088
RR = --- = --- = 0,8 CER 0,11
Come interpretare RR
• Nel caso in cui lo studio abbia valutato come endpoint un evento sfavorevole (frattura, morte, infezione, ecc.) RR ha le seguenti
interpretazioni:
• Se l’intervento ha un effetto benefico RR<1
• Se peggiora l’esito RR>1
• Se non c’è differenza RR=1
Come interpretare RR
• Nel caso in cui lo studio abbia valutato come endpoint un evento favorevole (guarigione della ferita, recupero funzionale, ripresa della
peristalsi, ecc.) RR ha le seguenti interpretazioni:
• Se l’intervento ha un effetto benefico RR>1
• Se peggiora l’esito RR<1
• Se non c’è differenza RR=1
Riduzione relativa del rischio
• Si utilizza negli studi sul trattamento che abbiano valutato un endpoint sfavorevole
(frattura, morte, infezione, ecc.), se si rileva un effetto positivo del trattamento.
• La RRR indica in percentuale, la riduzione del rischio che il trattamento determina nei trattati rispetto ai controlli.
Riduzione relativa del rischio
Calcolo della riduzione relativa del rischio
CER – EER RRR = ---
CER
RRI
• Nel caso in cui lo studio abbia valutato come endpoint un evento sfavorevole (frattura, morte, infezione, ecc.), ma ne abbia individuato la dannosità, RRR diventa RRI, Relative Risk Increase:
Aumento del rischio relativo.
Rischio attribuibile ARR
Ci dice quanto il trattamento incide nell’intera popolazione dello studio.
Calcolo del rischio attribuibile
ARR = CER - EER
Rischio attribuibile ARR
Un esempio reale sul trattamento
Gruppo intervento
Frattura Non frattura
N. Tot.
Trattamento
sperimentale 119 1226 1345
Trattamento
controllo 149 1192 1341
a d c
b
Riduzione del Rischio Relativo EER = 0.088
CER = 0.11
RRR= [(0.11-0.088)/0.11] x 100 = 20%
Oppure
RRR = [1- (0.088/0.11)] x 100 = 20%
La terapia con Vitamina D3 riduce le fratture di femore del 20%
Un esempio finto sul trattamento
Gruppo intervento
Frattura Non frattura
N. Tot.
Trattamento
sperimentale 149 1192 1341
Trattamento
controllo 119 1226 1345
a d c
b
Riduzione del Rischio Relativo EER = 0.11
CER = 0.088
RRI= [(0.11-0.088)/0.088] x 100 = 25%
Oppure
RRI = [(0.11/0.088)-1] x 100 = 25%
La terapia con il
farmaco Z aumenta il rischio di fratture di femore del 25%
I “difetti” di e RRR di RR
• La RR e RRR sono misure relative, che non danno l’idea della frequenza, e quindi dell’importanza, della riduzione degli
eventi negativi ridotti dal trattamento sperimentato.
Il “difetto” di ARR
• Al contrario ARR è proprio espressione di questa misura, ma essendo un numero decimale non è facile da ricordare.
• Per questo motivo la misura che rende al meglio l’importanza clinica
dell’associazione tra trattamento ed outcome è il NNT.
Number Needed To Treat (NNT)
• È il numero di pazienti da trattare per ottenere un beneficio terapeutico.
NNT = 1/ARR
NNT e NNH
• NNT = Number Needed to Treat
Quando il trattamento produce dei danni anziché dei benefici, il valore di ARR
diventa negativo ed anche l’NNT si presenta con il segno “-”.
L’NNT negativo si legge NNH in quanto il trattamento produce un danno.
• NNH = Number Needed to Harm
Odds Ratio
Cos’è l’ODDS?
• È il rapporto delle persone che incorrono in un evento, rispetto alle persone che non vi
incorrono.
Se si verifica una caduta su 20 anziani ricoverati in riabilitazione su 100, il rischio di caduta è 20/100 = 0.20 = 20%
Nello stesso scenario l’odds è rappresentato dal rapporto tra i caduti (20) rispetto ai non caduti (80), ossia 20/80=0.25 (ossia 1:4)
Cadute negli anziani Rischio Odds
2 on 100 2/100 = 0,02 2/98 = O,O2
20 on 100 20/100 = 0,20 20/80 = 0,25
50 on 100 50/100 = 0,50 50/50 = 1
80 on 100 80/100 = 0,80 80/20 = 4
Odds vs Rischio
Cos’è l’Odds Ratio?
• È’ il rapporto tra l’odds delle persone esposte al trattamento e l’odds delle persone del gruppo di controllo.
• OR è una misura di associazione indiretta (non calcola un rischio, ma una
probabilità).
• È espressione della forza dell’associazione tra una esposizione ed un esito.
Un esempio reale sul trattamento
Gruppo intervento
Frattura Non frattura
N. Tot.
Trattamento sperimental e
119 1226 1345 Trattamento
controllo 149 1192 1341
a d c
b
Odds Ratio
OR = (119/1226)/(149/1192)= 0.097/0.125= 0.77
Interpretare OR
Come interpretare OR
• Nel caso in cui lo studio abbia valutato come outcome un evento sfavorevole (frattura, morte, infezione, insorgenza di una patologia, ecc.) OR ha le seguenti interpretazioni:
Se l’intervento (o esposizione ad un agente eziologico o fattore prognostico)
• ha un effetto benefico OR<1
• Se peggiora l’esito OR>1
• Se non c’è differenza OR=1
Come interpretare OR
• Nel caso in cui lo studio abbia valutato come outcome un evento favorevole (guarigione della ferita, recupero funzionale, ripresa della
peristalsi, guarigione, ecc.) OR ha le seguenti interpretazioni:
• Se l’intervento (o esposizione ad un agente eziologico o fattore prognostico) ha
• un effetto benefico OR>1
• Se peggiora l’esito OR<1
• Se non c’è differenza OR=1
RR Vs OR
• OR è simile a RR se il rischio di base nei controlli (CER) è basso (<10%);
• Se il rischio di base è alto OR tende a valori costantemente più piccoli e lontani dall’unità rispetto a RR (↑ c e quindi il denominatore).
RR e OR
Al crescere del numero degli eventi nel gruppo di controllo, e quindi di CER, OR si riduce
progressivamente perché aumenta il suo denominatore!
Ipotesi nulla nei parametri dicotomici
Parametro Valore nullo
RR, OR 1
RRR, ARR 0
NNT Infinito
Se questo valore è 1, il rischio o la
probabilità di incorrere nell’evento sono uguali in presenza
o in assenza del trattamento
ARR non deve essere 0, perché significherebbe che il beneficio ottenuto in termini di riduzione assoluta del rischio è 0, nel qual caso NNT diventerebbe un valore tendente ad infinito.
Ipotesi nulla nei parametri continui
• Nel caso in cui lo studio misuri parametri continui, mediante la dimostrazione della differenza della media, essa non deve essere 0.
Gli intervalli di confidenza a cosa servono e come si
interpretano
I C : a cosa serve?
• Vengono utilizzati in tutti gli studi in cui non è possibile studiare l’intera
popolazione
, della quale viene studiato solo uncampione
rappresentativo.
Il significato dell’IC
• Se si potesse ripetere uno studio un numero infinito di volte, reclutando campioni sempre diversi, la distribuzione della stima della misura dell’effetto (o di associazione), si distribuirebbe su una curva normale (o gaussiana), intorno ad un valore centrale che è quello ottenibile se si potesse studiare la popolazione.
La curva gaussiana
Perché ci interessa?
• L’ampiezza
dell’intervallo diconfidenza (Intervallo di Confidenza – IC - o Confidence Interval - CI) fornisce la
misura della precisione
(odell’incertezza) dei risultati di uno studio, così da poter trarre deduzioni sulla
popolazione da cui sono tratti quei pazienti.
Cosa ci interessa sapere del IC?
• In particolare dobbiamo verificare:
-Quanto è ampio l’intervallo di confidenza.
-Che i valori dei suoi estremi, non devono cadere oltre il valore che
conferma
l’ipotesi nulla.
Ampiezza dell’intervallo di confidenza
• Tanto più è ampio l’intervallo di confidenza, tanto meno precisa è la stima dell’efficacia del trattamento (e meno dobbiamo fidarci del
risultato dello studio).
• L’ampiezza dell’IC è inversamente proporzionale alla dimensione del campione
(se ho incluso pochi soggetti il risultato ottenuto è necessariamente poco preciso).
Test di significatività:
valore di p
Lo zampino del caso
• Il risultato di uno studio potrebbe
dipendere non dalla associazione tra trattamento/fattore prognostico/ agente eziologico ed endpoint, ma derivare da:
• Variabilità campionaria
• Variabilità biologica
• Errore di misurazione
P = significatività statistica
• In questi casi siamo di fronte ad un
risultato dovuto essenzialmente al caso.
• La misura di p ci dice qual’è la probabilità che il risultato a cui è pervenuto lo studio possa essere dovuto semplicemente al caso e non alla reale associazione.
Test di significatività statistica
• Il valore di p misura la probabilità che un’associazione osservata possa essere dovuta a fluttuazioni casuali, ossia alla possibile variabilità tra campioni, e possa quindi non corrispondere a fenomeni reali.
• Quanto deve essere il valore di p per poter escludere l’ipotesi nulla?
Test di significatività statistica
• Viene deciso dai ricercatori, al momento di stabilire la numerosità del campione.
• Il valore di p corrisponde all’errore alfa, che dice in che misura i ricercatori hanno ritenuto tollerabile che lo studio possa essere arrivato a dimostrare un risultato positivo, quando in realtà esso non esiste (per cui è scaturito per caso).
Test di significatività statistica
• Può essere stabilita allo 0,05 (5%) o allo 0,01(1%).
• Il livello di significatività più comune è 0,05: si conclude cioè che una associazione non è
dovuta al caso se p è uguale o inferiore a 0,05, che vuole dire che il risultato ottenuto potrebbe dipendere dal caso nella misura del 5%, ossia di 5 volte ogni 100 ripetizioni dello stesso studio…
insomma una evenienza piuttosto improbabile.
Da cosa deriva p?
• Da due elementi:
– dalla numerosità del campione che si è riusciti a reclutare;
– Dall’entità della associazione.
Come interpretare il valore di p
• Se è al di sopra di 0,05 o di 0,01, significa che i risultati a cui gli autori sono pervenuti sono casuali e quindi non possiamo
rifiutare l’ipotesi nulla.
• Insomma,
lo studio non è in
grado di dimostrare niente
.Significatività non vuole dire importanza
• È chiaro quindi che
–“Significativo” non è sinonimo di
“importante”
–“Significativo” = difficilmente
dovuto al puro caso.
Significatività statistica e significato clinico
• La significatività statistica non è l’unico criterio utile per decidere se utilizzare i risultati di uno studio.
• La significatività statistica dipende dalla numerosità del campione e dall’entità dell’efficacia del trattamento (differenze degli esiti).
Significatività statistica e significato clinico
• Differenze clinicamente irrilevanti possono divenire statisticamente significative se le dimensioni dei campioni sono
sufficientemente grandi.
• Al contrario, differenze clinicamente
rilevanti possono essere statisticamente non significative se i campioni sono troppo piccoli (in gergo statistico, se lo studio
manca di potenza statistica).
Validità esterna
• Dopo avere valutato che i risultati non sono affetti da bias e che sono
clinicamente rilevanti, si valuta la validità esterna. Ci chiediamo cioè se per noi i risultati dello studio sono applicabili e se è il caso di cambiare la nostra pratica alla luce delle evidenze.
Validità esterna
• I risultati possono essere applicati alla popolazione locale?
– I pazienti considerati nel trial sono così diversi da quelli da voi assistiti?
– Le caratteristiche del setting possono avere avuto un effetto determinante sui risultati (professionals/skills)?
– Il setting in cui si è svolto lo studio ha delle caratteristiche che lo rendono estremamente diverso dal vostro?
Validità esterna
• Gli outcome considerati sono clinicamente rilevanti?
– Occorre considerare se lo studio ha risposto alla propria domanda iniziale, se si sono evidenziati o se sono stati trascurati altri outcomes rilevanti.
Validità esterna
• I benefici bilanciano i rischi ed i costi?
– Generalmente è difficile rispondere a questa domanda in assenza di analisi economiche.