Prof. Paolo Chiari
Dipartimento Scienze Mediche e Chirurgiche Università di Bologna Alma Mater Studiorum
Studi di Trattamento
Una curiosità
• Il 20 maggio è stata la ricorrenza della
Giornata Internazionale dei Trial Clinici
per commemorare il giorno in cui, nel
1747, James Lind avviò il primo trial
randomizzato che confrontava diversi
trattamenti per lo scorbuto tra i marinai
della British Royal Navy.
Trial Clinici
Studi di trattamenti, RCT, Trial clinici ...
Ma chi sono questi sconosciuti???
Studio di coorte longitudinale
Studio di coorte longitudinale
Studio randomizzato e controllato Studio randomizzato e controllato
5
Piramide di studi primari
Disegni dei trials
• Trials senza gruppo di controllo
• Trials quasi randomizzati
• Trials randomizzati e controllati
Trial non controllato NCCTs
P T
Esiti T
Trials non randomizzati
P
T
Esiti T/C
C
Limiti dei trials non controllati/non
randomizzati
Randomized controlled trials
P
T
Esiti T/C
C
R
Follow up
Studi Randomizzati e Controllati - RCT
• TRIAL = prova, studio , esperimento.
• RANDOMISED = randomizzato, campione preso a caso.
• CONTROLLED = controllato, raffrontato
con un campione di controllo.
Trial randomizzati e controllati
• Sono gli studi sperimentali considerati il
“gold standard” per la valutazione dei
trattamenti, grazie al loro disegno formulato in modo da minimizzare i bias rispetto ad altri disegni.
Trial randomizzato e controllato
• Negli RCT i membri del campione sono
assegnati in modo randomizzato ai due
gruppi: ciò consente di costituire due gruppi
in cui i fattori prognostici, sia noti che non,
sono equamente distribuiti, e quindi identici
ad eccezione del trattamento sperimentato.
RCT
Pazienti eleggibili Randomizzazione
Intervento sperimentale
Intervento di controllo
Outcome
No outcome
Outcome
No outcome
Direzione della raccolta dati: esposizione Outcome
Trials esplicativi
• Explanatory study: sono gli studi pilota che vengono effettuati su pazienti molto selezionati e ad altissima compliance.
Valutano la efficacy (efficacia in condizioni
ottimali).
Trials pragmatici
• Pragmatic study: si realizzano su
campioni più eterogenei e per questo più simili alla popolazione incontrata nella pratica clinica. Valutano l’effectiveness.
Fasi degli studi farmacologici
• La fase I degli studi sui farmaci viene eseguita su volontari sani (- di 30).
• Gli obiettivi sono il dose finding per produrre effetti sull’organismo, lo studio della farmacodinamica, della farmacocinetica.
• Se il farmaco ha effetti così pericolosi da non potersi studiare sui volontari sani, può essere studiato su pazienti per i quali i possibili vantaggi terapeutici superano i rischi collegati ai farmaci (pazienti terminali).
• Vengono effettuati in centri ospedalieri, vicino a servizi di
rianimazione.
Fasi degli studi farmacologici
• Gli studi di fase II sono studi pilota per gli studi di fase III. Vengono realizzati su pochi pazienti ammalati, che sono stati bene inquadrati da un punto di vista
diagnostico, anamnestico e che hanno altissima compliance.
• L’obiettivo dello studio è il dose finding (per la dose terapeutica) e il suo intervallo terapeutico (distanza tra la dose terapeutica e quella tossica).
• Vengono effettuati in centri selezionati.
Fasi degli studi farmacologici
• La fase III dei trials rappresenta il vero
RCT multicentrico e pragmatico, in cui si
cerca di comparare l’efficacia di un nuovo
farmaco con quella del placebo o di un
farmaco esistente o di un intervento
ritenuto efficace.
Fasi degli studi farmacologici
• La fase IV riguarda gli studi che cercano di monitorare gli effetti indesiderati di un
nuovo farmaco dopo che è stato approvato per il marketing (farmaco-vigilanza).
Valutazione critica degli RCTs
Come valutare criticamente un RCT
• Durante la lettura di una pubblicazione si devono trovare informazioni sufficienti, presentate chiaramente e coerentemente, affinché si possa decidere, in base alle evidenze fornite dagli autori, se le
conclusioni a cui arrivano sono logiche e credibili.
Le dimensioni da valutare
• Valutazione preliminare
• Validità interna
• Rilevanza clinica
• Validità esterna
• Lettura dell’abstract: consente di comprendere se:
• l’articolo è pertinente al nostro quesito
• Il disegno è congruente con il metodo che vogliamo leggere
• Inoltre, ci dà la possibilità di farci una idea generale su come è stato condotto lo studio.
Valutazione preliminare
25
Elementi del PICO
• P: sono descritti i criteri di inclusione/esclusione e il setting
• I & C: devono essere descritti chiaramente,
• O: l’endpoint primario dovrebbe essere clinicamente rilevante. Se surrogato deve essere validato.
• M: appropriatezza del disegno dello studio
Endpoint negli RCTs
• Gli endpoint sono gli esiti che vengono valutatati nello studio. La loro definizione influenza la rilevanza clinica dello studio.
Endpoint
• Umanistici
• Economici
• Clinici:
• Clinicamente rilevanti
• Surrogati
• Validati
End-point
• Clinicamente rilevanti
• Misurano come un individuo si sente, funziona, sopravvive.
• Surrogati
• sono il risultato di indagini
laboratoristiche o radiologiche che non sono
connesse a situazioni clinicamente rilevanti.
Esempi di endpoint surrogati
• Valutazione della conta delle colonie batteriche, anziché dell’insorgenza di infezioni delle ferite;
• Valutazione del colesterolo totale anziché della mortalità coronarica o degli eventi coronarici;
• La densitometria ossea per lo screening della osteoporosi.
• Il valore dell’emoglobina glicosilata, anziché le complicanze da diabete
• ………..
Perché vengono utilizzati?
• Più rapidi
• Più facili da valutare
• Meno costosi da rilevare
• Meno invasivi da rilevare
• Insomma possono essere funzionali a concludere prima e meglio un trial…
31
Limiti degli endpoint surrogati
• Solo pochi outcomes surrogati sono fortemente collegati a quelli clinicamente rilevanti.
• Sfortunatamente, la maggior parte di loro sono
solo CORRELATI (direttamente o inversamente)
all’outcome clinico e rappresentano dei sostituti
inaffidabili dei reali esiti clinici.
Intervento
Patologia
End point surrogato
Outcome clinico reale
Endpoint surrogato funziona se…
Domande preliminari
• Se lo studio non risponde positivamente alle domande preliminari possiamo anche
terminarne la lettura.
• Se invece gli elementi del PICO sono ben
descritti e se il disegno è coerente possiamo
valutare la validità interna.
Validità interna
Validità interna
• Presuppone la verifica dell’assenza di bias che possono avere compromesso la
validità dei risultati ottenuti.
• Il riscontro di un bias in questa fase può
far cessare la necessità di continuare la
valutazione critica.
Bias negli RCTs
• Bias di allocazione
• Bias di violazione del protocollo
• Bias di accertamento
• Bias di attrito
37
Bias di allocazione
• Nasce in presenza di un difetto nella
assegnazione dei pazienti al trattamento o al controllo, che produce due gruppi non “identici”.
Questo bias modifica i risultati dello studio, che
possono dipendere, non dal trattamento, ma
dalla diversa distribuzione delle variabili
prognostiche all’interno dei due gruppi (ad
esempio perché i meno gravi sono stati
assegnati al gruppo sperimentale).
Allocazione
• Per escludere la presenza di bias di allocazione occorre verificare che la
generazione della lista di randomizzazione sia stata casuale e che questa sia stata mantenuta nascosta.
39
Bias di allocazione
• Se uno studio è realmente randomizzato, l’allocazione ai gruppi non può essere influenzata dai ricercatori o dai
partecipanti allo studio.
Cosa valutare
• Per verificare la presenza di bias di
allocazione verificare che non siano stati posti dei filtri al di là dei criteri dichiarati.
• Occorre verificare che la generazione della lista di randomizzazione sia stata casuale e che questa sia stata mantenuta nascosta.
… e la tab 1
Nella griglia di valutazione corrispondere alle domande:
• 3.1 L’assegnazione dei pazienti al trattamento era randomizzata?
• 3.2 La randomizzazione era tenuta nascosta?
• 3.4 I gruppi erano simili per tutti i determinanti conosciuti per l’outcome considerato?
43
Bias di violazione del protocollo
• Può succedere che durante la
conduzione di uno studio non tutto vada per il verso giusto: possono esserci degli errori nell’erogazione dell’intervento o del
controllo; possono esserci dei bassi livelli di
compliance da parte dei pazienti; i pazienti
o il medico responsabile possono decidere
La violazione del protocollo
• La violazione del protocollo si realizza in questi casi:
• Withdrowal o drop-out: hanno sospeso il trattamento;
• Protocol violators/non compliant: hanno assunto farmaci proibiti o i farmaci giusti nei modi/tempi sbagliati (bassa compliance)
• Cross over: i pazienti posso avere ricevuto il trattamento del gruppo opposto.
45
Come si tratta la violazione del protocollo?
• In due modi:
• Mediante i criteri di selezione.
• Con l’analisi secondo l’INTENTION
TO TREAT
Intenzione di trattamento
• L’analisi secondo ITT è un tipo di analisi dei risultati, in cui vengono valutati tutti coloro che sono stati assegnati a quel tipo di trattamento e non solo coloro che hanno effettivamente assunto il trattamento.
Intention to treat
• Ciò si giustifica con il fatto che, se il
trattamento procura effetti indesiderati tali
da non consentire al soggetto di seguire
correttamente la terapia, considerare il
suo esito negativo nel gruppo di controllo,
piuttosto che non considerarlo affatto, ne
accrescerebbe l’efficacia (è dimostrato
Come facciamo a capire se è stata fatta?
• Al di là delle dichiarazioni degli autori nel testo, che spesso riportano che l’analisi è stata fatta secondo l’intention to treat, è sufficiente verificare che il numero dei pazienti analizzati corrisponda al numero dei pazienti randomizzati.
Intention to treat
Eccezione
• L’unica eccezione ammissibile
all’intention to treat si verifica quando il paziente non assume neanche la prima dose del trattamento a cui era stato assegnato (ad esempio perché decede o perché ritira il consenso).
51
Esistono casi in cui è lecita l’intention to treat?
• Sì quando anziché misurare l’efficacia si è misurata la safety del trattamento.
• Se si misurano effetti collaterali, l’analisi secondo intention to treat li diluirebbe con coloro che non hanno assunto il
trattamento.
• È lecito che all’interno dello studio i
Nella griglia di valutazione corrisponde alla domanda
• 3.3 I pazienti sono stati analizzati nel gruppo a cui erano stati randomizzati (intention to treat)?
53
Bias di accertamento
• Accade quando i risultati o le conclusioni di un trial sono distorte dalla conoscenza relativa all’intervento a cui ogni partecipante è stato sottoposto.
• Questo tipo di errore può essere determinato da chi eroga l’intervento, dai soggetti studiati, dai ricercatori che valutano o analizzano gli
outcome e da coloro che scrivono l’articolo
descrivente il trial.
Bias di accertamento
• Il miglior modo per evitare questo bias è mantenere le persone coinvolte nello studio non a conoscenza dell’identità dell’intervento il più a lungo possibile, realizzando quella che è detta CECITA’.
Tipologie di Cecità
• Open trial o open label
• Cieco (solo paziente o sanitario erogatore o sanitario rilevatore)
• Doppio cieco (paziente + sanitario erogatore o rilevatore)
• Triplo cieco (paziente + sanitario erogatore +
sanitario rilevatore)
Il giusto livello di cecità
• Non tutti gli interventi possono essere studiati applicando la cecità.
• Ci poniamo il problema quando la cecità era possibile e non è stata applicata.
• Quello che è veramente rilevante è
verificare che chi ha rilevato l’esito NON era a conoscenza dell’esposizione dei pazienti.
Bias di attrito
• Si chiama attrito, il bias prodotto dai persi al follow up.
• In generale il follow up deve essere:
• sufficientemente lungo da consentire agli esiti di verificarsi;
• sufficientemente completo da non compromettere la numerosità
campionaria.
Persi al follow up
• I pazienti persi (lost) al follow up sono quelli di cui si sono perse le notizie, per cui non si sa se hanno presentato l’esito o meno,
indipendentemente dall’assunzione del trattamento secondo il protocollo.
In ogni caso
• Rispetto ai persi al follow up gli autori dovrebbero:
• Verificare che i gruppi dei pazienti rimasti nello studio siano rimasti omogenei anche dopo l’eliminazione dei persi.
• Verificare che la numerosità residua sia
sufficiente per mantenere la potenza dello
Esempio 1
• Follow up 4,1 anni in media.
Nella griglia di valutazione corrisponde alle domande
• 4. Il gruppo sperimentale ed il gruppo di controllo mantenevano una stessa
prognosi anche dopo l’avvio dello studio?
• 4.1 I pazienti erano ciechi rispetto al trattamento?
• 4.2 Gli operatori erano ciechi rispetto al trattamento?
• 4.3 Gli analisti degli outcome erano ciechi
rispetto al trattamento?
Valutazione della rilevanza clinica
Misure di efficacia nei trials
• Nella lettura degli studi troveremo indicate diverse misure di efficacia.
• La comprensione del loro significato,
l’interpretazione del loro valore e della loro
precisione ci servono per capire la forza e
la direzione dell’associazione che vi è tra
L’efficacia negli studi
I dati all’interno degli studi possono riguardare variabili continue (glicemia, temperatura,
pressione, colesterolemia) o variabili discrete o dicotomiche (vivo o morto, frattura o non frattura, guarito o non guarito).
Nel primo caso i ricercatori riportano
l’intervallo di valori confrontando le medie o le mediane dei valori.
Nel secondo caso i ricercatori riportano la frequenza con cui si verifica l’evento.
Es. con variabili discrete
Cullen l, et al. Nebulized lidocaine decrease the discomfort of nasogastric tube insertion: a randomized, doubleblind trial. Ann Emerg Med 2004; 44: 131-7.
La somministrazione di lidocaina nebulizzata prima dell’inserimento del sondino naso gastrico riduce il discomfort del paziente?
P: Adulti da sottoporre a posizionamento del SNG in pronto soccorso.
Intervento: nebulizzazione di lidocaina nella narice da utilizzare.
Confronto: nebulizzazione di soluzione fisiologica.
Outcome: disagio misurato attraverso una scala visuale analogica
(misura discreta), difficoltà di inserimento del sondino (misura
discreta).
Disagio riferito (media dei punteggi della scala visuale analogica)
37.7 59.3 21.6 (5.3 a
38.0)
Difficoltà percepita dall’infermiere nell’inserimento del SNG
2 2 0 (-1 a 1)
Esempio
Endpoint discreti o dicotomici
Tutte le volte che lo studio riporta i dati
espressi come variabili discreti/dicotomiche
al fine di calcolare le misure di associazione
occorre porre i dati in una tabella 2 x 2 o
tabella di contingenza.
Misure di efficacia per gli esiti discreti o dicotomici
• Il primo passaggio per capire le diverse misure di efficacia consiste nel tabellare i dati.
Evento Sì Evento No
Gruppo
sperimentale a b a + b
Gruppo di
controllo c d c + d
a + c b + d
Un esempio reale
Trivedi DP, Doll R, Khaw KT. Effect of four montly oral vitamin D3 supplementation on fracutres and mortality in men and women living in the community: randomised double blind controlled trial.
BMJ 2003; 326:469-72.
La somministrazione di un integratore di Vitamina D3 per via orale riduce l’incidenza di fratture negli anziani (65-85) residenti al domicilio?
P: anziani residenti al domicilio.
Intervento: somministrazione di un integratore di Vit D3.
Confronto: somministrazione di un placebo.
Outcome: Incidenza di fratture e mortalità da tutte le cause.
Metodo: RCT
Gruppo intervento
Frattura Non frattura
N. Tot.
Trattamento
sperimentale 119 1226 1345
Trattamento
controllo 149 1192 1341
a d c
b
Questa è la partenza per calcolare:
RR RRR ARR NNT
La frequenza dell’evento nei due gruppi:
EER e CER
Per calcolare RRR, RR, ARR, una volta tabellati i dati occorre calcolare la frequenza dell’evento nei due gruppi:
EER (Experimental Event Rate) CER (Control Event Rate)
La misura degli effetti quando si utilizzano outcome dicotomici
Experimental Event Rate Frequenza (o rischio) nel gruppo sperimentale
a EER = ---
a + b
La EER ci dice con che frequenza l’endpoint
si è verificato
nel gruppo sperimentale
La misura degli effetti quando si utilizzano outcome dicotomici
Control Event Rate Frequenza (o rischio) nel gruppo di controllo
c CER = ---
c + d
La CER ci dice con che frequenza l’endpoint
si è verificato nel gruppo di controllo
Rischio Relativo
il rischio relativo ci dice quanto è grande il rischio di manifestare l’evento negativo nel gruppo
sperimentale rispetto a quello del gruppo di controllo.
Per calcolarlo, è necessaria la frequenza dell’evento nei due gruppi:
- EER (Experimental Event Rate) e - CER (Control Event Rate)
La misura degli effetti quando si utilizzano outcome discreti
Rischio Relativo a EER ---
a + b RR = --- = ---
c CER ---
c + d
Dal rapporto tra EER e CER individuiamo il rischio relativo che ci dice quanto è grande
il rischio di
manifestare l’evento negativo nel gruppo sperimentale
rispetto a quello del gruppo
di controllo.
Un esempio reale sul trattamento
Gruppo intervento
Frattura Non frattura
N. Tot.
Trattamento
sperimentale 119 1226 1345
Trattamento
controllo 149 1192 1341
a d c
b
Rischio Relativo
EER 0,088
RR = --- = --- = 0,8 CER 0,11
Nel caso in cui lo studio abbia valutato un outcome sfavorevole (frattura, morte, infezione, ecc.) RR ha le seguenti interpretazioni:
Se RR<1 l’intervento/esposizione ha un effetto benefico
Se RR>1 l’intervento/esposizione peggiora l’esito
Interpretare RR
Nel caso in cui lo studio abbia valutato come outcome un evento favorevole (guarigione della ferita, recupero funzionale, ripresa della peristalsi, ecc.) RR ha le seguenti interpretazioni:
Se RR>1, l’intervento/esposizione ha un effetto benefico
Se RR<1 l’intervento/esposizione peggiora l’esito Se RR=1 non c’è differenza
81
Interpretare RR
Riduzione relativa del rischio
Si utilizza negli studi sul trattamento che abbiano valutato un endpoint sfavorevole (frattura, morte, infezione, ecc.), se si rileva un effetto positivo del trattamento.
La RRR indica in percentuale, la riduzione del rischio che il trattamento determina nei
trattati rispetto ai controlli.
Riduzione relativa del rischio
Calcolo della riduzione relativa del rischio
CER – EER RRR = ---
CER
RRI
Nel caso in cui lo studio abbia valutato come endpoint un evento sfavorevole (frattura, morte, infezione, ecc.), ma ne abbia
individuato la dannosità, RRR diventa RRI, Relative Risk Increase: Aumento del
rischio relativo.
• Al fine di facilitare l’interpretazione del RR, si può velocemente calcolare di quanto è ridotto (o
aumentato) il rischio del gruppo sperimentale, rispetto al gruppo di controllo:
RRR = (CER-EER)/CER = 1- RR
PS: se RR>1 allora avremo un relative risk increase RRI = RR-1
Esempio 1
L’assunzione di TOS aumenta del 22% il rischio di morte per CHD
Esempio 2
L’uso della clorexidina alcolica riduce del 41%
l’incidenza di infezioni della ferita chirurgica
RRR
La RR e RRR sono misure relative, che non danno l’idea della frequenza, e quindi dell’importanza, della riduzione degli eventi negativi ridotti dal
trattamento sperimentato.
I difetti di RR e RRR
87
31/08/2017 87
• ARR è anche detto Risk Difference.
• È misura assoluta della riduzione del rischio. ARR = CER - EER
Esempio 2
66 pazienti su 1000 non hanno sviluppato infezione della ferita chirurgica grazie all’uso della
clorexidina alcolica
ARR = RD
89
NNT
Number Needed to Treat
• E’ il numero di pazienti da trattare
per ottenere un beneficio terapeutico in un paziente, ad esempio prevenire un evento negativo.
Ad esempio: a quanti pazienti deve essere praticata l’antisepsi con clorexidina alcolica, anziché iodopovidone, per evitare l’infezione della ferita chirurgica?
NNT
Cosa sapevamo in merito?
Il calcolo del Risk Difference, che è 0.066, aveva dimostrato che 66 pazienti su 1000 non hanno sviluppato infezione della ferita chirurgica grazie all’uso della clorexidina alcolica.
Se ipoteticamente mettessimo in fila questi 1000 pazienti, ogni quanto troveremmo il fortunato? 1000/66 = 16 (15,15 arrotondato per eccesso).
1
NNT = --- = ARR
1000 1
--- = --- = 15,15 16 66 0,066
91
Come la mettiamo con l’esempio 1?
Essendo l’incidenza degli eventi > nel gruppo sperimentale, il trattamento si è dimostrato dannoso, dato che aumenta il rischio di eventi negativi. Quando si verifica questa situazione non si parla di Number Needed to Treat, ma di Number Needed to Harm, che rappresenta il numero dei pazienti che se trattati incorrono nell’evento negativo.
1
NNH = --- =
1000 1
--- = --- = 100
Riprendiamo l’esempio di apertura
Gruppo intervento
Frattura Non frattura
N. Tot.
Trattamento
sperimentale 119 1226 1345
Trattamento
controllo 149 1192 1341
a c d
b
Riduzione del Rischio Relativo EER = 0.088
CER = 0.11
EER 0,088
RR = --- = --- = 0,8 CER 0,11
RRR= [(0.11-0.088)/0.11] x 100 = 20%
Oppure
RRR = [1- (0.088/0.11)] x 100 = 20%
La terapia con Vitamina D3 riduce le fratture di femore del 20%
NNT e NNH
• NNT = Number Needed to Treat
Quando il trattamento produce dei danni anziché dei benefici, il valore di ARR diventa negativo ed anche l’NNT si presenta con il segno “-”.
L’NNT negativo si legge NNH in quanto il trattamento produce un danno.
• NNT = Number Needed to Harm
Ipotesi nulla nei parametri dicotomici
Parametro Valore nullo
RR, OR 1
RRR, ARR 0
NNT Infinito
Se questo valore è 1, il rischio o la
probabilità di incorrere nell’evento sono uguali in presenza
o in assenza del trattamento
ARR non deve essere 0, perché significherebbe che il beneficio ottenuto in termini di riduzione assoluta del rischio è 0, nel qual caso NNT diventerebbe un valore tendente ad infinito.
Ipotesi nulla nei parametri continui
• Nel caso in cui lo studio misuri parametri
continui, mediante la dimostrazione della
differenza della media, essa non deve
essere 0.
Gli intervalli di confidenza
IC: a cosa serve?
• Vengono utilizzati in tutti gli studi in cui non è possibile studiare l’intera
popolazione , della quale viene studiato solo un campione
rappresentativo.
La curva gaussiana
Perché ci interessa?
• L’ampiezza dell’intervallo di
confidenza (Intervallo di Confidenza – IC - o Confidence Interval - CI) fornisce la
misura della precisione (o
dell’incertezza) dei risultati di uno studio, così da poter trarre deduzioni sulla
popolazione da cui sono tratti quei pazienti.
Cosa ci interessa sapere del IC?
• In particolare dobbiamo verificare:
-Quanto è ampio l’intervallo di confidenza.
-Che i valori dei suoi estremi, non devono
cadere oltre il valore che conferma
l’ipotesi nulla.
Test di significatività:
valore di p
Lo zampino del caso
• Il risultato di uno studio potrebbe dipendere non dalla associazione tra trattamento/fattore prognostico/ agente eziologico ed endpoint, ma derivare da:
• Variabilità campionaria
• Variabilità biologica
• Errore di misurazione
P = significatività statistica
• In questi casi siamo di fronte ad un risultato dovuto essenzialmente al caso.
• La misura di p ci dice qual è la probabilità che il risultato a cui è pervenuto lo studio possa essere dovuto semplicemente al caso e non alla reale associazione.
• Quanto deve essere il valore di p per poter escludere l’ipotesi nulla?
Test di significatività statistica
• Viene deciso dai ricercatori, al momento di stabilire la numerosità del campione.
• Il valore di p corrisponde all’errore alfa,
che dice in che misura i ricercatori hanno
ritenuto tollerabile che lo studio possa
essere arrivato a dimostrare un risultato
positivo, quando in realtà esso non esiste
(per cui è scaturito per caso).
Test di significatività statistica
• Può essere stabilita allo 0,05 (5%) o allo 0,01(1%) o …..
• Il livello di significatività più comune è 0,05: si conclude cioè che una associazione non è dovuta al caso se p è uguale o inferiore a 0,05, che vuole dire che il risultato ottenuto potrebbe dipendere dal caso nella misura del 5%, ossia di 5 volte ogni 100 ripetizioni dello stesso studio…
insomma una evenienza piuttosto improbabile.
Da cosa deriva p?
• Da due elementi:
• dalla numerosità del campione che si è riusciti a reclutare;
• Dall’entità della associazione.
Come interpretare il valore di p
• Se p è al di sopra di 0,05 o di 0,01, significa che i risultati a cui gli autori sono pervenuti sono casuali e quindi non possiamo rifiutare l’ipotesi nulla.
• Insomma, lo studio non è in grado di dimostrare niente.
Significatività non vuole dire importanza
• È chiaro quindi che
• "Significativo" non è sinonimo di
"importante”
• "Significativo" = difficilmente dovuto al
puro caso.
Significatività statistica e significato clinico
• La significatività statistica non è l’unico criterio utile per decidere se utilizzare i risultati di uno studio.
• La significatività statistica dipende dalla numerosità del campione e dall’entità dell’efficacia del trattamento (differenze degli esiti).
Significatività statistica e significato clinico
• Differenze clinicamente irrilevanti possono divenire statisticamente significative se le
dimensioni dei campioni sono sufficientemente grandi.
• Al contrario, differenze clinicamente rilevanti possono essere statisticamente non
significative se i campioni sono troppo piccoli
Nella griglia di valutazione corrisponde alle domande
• 5. Quant’è grande l’effetto del trattamento (considerare i diversi end points)?
• 6. Quant’è precisa la stima dell’effetto del trattamento?
A questo punto
• Dopo avere valutato che i risultati non sono affetti da bias e che sono
clinicamente rilevanti, si valuta la validità
esterna. Ci chiediamo cioè se per noi i
risultati dello studio sono applicabili e se è
il caso di cambiare la nostra pratica alla
luce delle evidenze.
Validità esterna
• I risultati possono essere applicati alla popolazione locale?
• I pazienti considerati nel trial sono così diversi da quelli da voi assistiti?
• Le caratteristiche del setting possono avere avuto un effetto determinante sui risultati (professionals/skills)?
• Il setting in cui si è svolto lo studio ha delle caratteristiche che lo rendono
estremamente diverso dal vostro?
Validità esterna
• Gli outcome considerati sono clinicamente rilevanti?
• Occorre considerare se lo studio ha
risposto alla propria domanda iniziale,
se si sono evidenziati o se sono stati
trascurati altri outcomes rilevanti.
Validità esterna
• I benefici bilanciano i rischi ed i costi?
• Generalmente è difficile rispondere a questa domanda in assenza di analisi economiche.
Nella griglia di valutazione corrisponde alle domande
• 7. I pazienti dello studio sono simili a quelli del mio ambito clinico?
• 8. Gli outcome considerati sono clinicamente rilevanti?
• 9. I benefici bilanciano i danni potenziali ed i
costi?
Paolo Chiari
Corso di Laurea Magistrale in Scienze Infermieristiche e Ostetriche paolo.chiari@unibo.it
www.unibo.it