Studi di TrattamentoUna curiosità

(1)

Prof. Paolo Chiari

Dipartimento Scienze Mediche e Chirurgiche Università di Bologna Alma Mater Studiorum

Studi di Trattamento

Una curiosità

• Il 20 maggio è stata la ricorrenza della

Giornata Internazionale dei Trial Clinici

per commemorare il giorno in cui, nel

1747, James Lind avviò il primo trial

randomizzato che confrontava diversi

trattamenti per lo scorbuto tra i marinai

della British Royal Navy.

(2)

Trial Clinici

Studi di trattamenti, RCT, Trial clinici ...

Ma chi sono questi sconosciuti???

Studio di coorte longitudinale

(3)

Studio randomizzato e controllato Studio randomizzato e controllato

5

Piramide di studi primari

(4)

Disegni dei trials

• Trials senza gruppo di controllo

• Trials quasi randomizzati

• Trials randomizzati e controllati

Trial non controllato NCCTs

P T

Esiti T

(5)

Trials non randomizzati

P

T

Esiti T/C

C

Limiti dei trials non controllati/non

randomizzati

(6)

Randomized controlled trials

P

T

Esiti T/C

C

R

Follow up

Studi Randomizzati e Controllati - RCT

• TRIAL = prova, studio , esperimento.

• RANDOMISED = randomizzato, campione preso a caso.

• CONTROLLED = controllato, raffrontato

con un campione di controllo.

(7)

Trial randomizzati e controllati

• Sono gli studi sperimentali considerati il

“gold standard” per la valutazione dei

trattamenti, grazie al loro disegno formulato in modo da minimizzare i bias rispetto ad altri disegni.

Trial randomizzato e controllato

• Negli RCT i membri del campione sono

assegnati in modo randomizzato ai due

gruppi: ciò consente di costituire due gruppi

in cui i fattori prognostici, sia noti che non,

sono equamente distribuiti, e quindi identici

ad eccezione del trattamento sperimentato.

(8)

RCT

Pazienti eleggibili Randomizzazione

Intervento sperimentale

Intervento di controllo

Outcome

No outcome

Outcome

No outcome

Direzione della raccolta dati: esposizione Outcome

Trials esplicativi

• Explanatory study: sono gli studi pilota che vengono effettuati su pazienti molto selezionati e ad altissima compliance.

Valutano la efficacy (efficacia in condizioni

ottimali).

(9)

Trials pragmatici

• Pragmatic study: si realizzano su

campioni più eterogenei e per questo più simili alla popolazione incontrata nella pratica clinica. Valutano l’effectiveness.

Fasi degli studi farmacologici

• La fase I degli studi sui farmaci viene eseguita su volontari sani (- di 30).

• Gli obiettivi sono il dose finding per produrre effetti sull’organismo, lo studio della farmacodinamica, della farmacocinetica.

• Se il farmaco ha effetti così pericolosi da non potersi studiare sui volontari sani, può essere studiato su pazienti per i quali i possibili vantaggi terapeutici superano i rischi collegati ai farmaci (pazienti terminali).

• Vengono effettuati in centri ospedalieri, vicino a servizi di

rianimazione.

(10)

Fasi degli studi farmacologici

• Gli studi di fase II sono studi pilota per gli studi di fase III. Vengono realizzati su pochi pazienti ammalati, che sono stati bene inquadrati da un punto di vista

diagnostico, anamnestico e che hanno altissima compliance.

• L’obiettivo dello studio è il dose finding (per la dose terapeutica) e il suo intervallo terapeutico (distanza tra la dose terapeutica e quella tossica).

• Vengono effettuati in centri selezionati.

Fasi degli studi farmacologici

• La fase III dei trials rappresenta il vero

RCT multicentrico e pragmatico, in cui si

cerca di comparare l’efficacia di un nuovo

farmaco con quella del placebo o di un

farmaco esistente o di un intervento

ritenuto efficace.

(11)

Fasi degli studi farmacologici

• La fase IV riguarda gli studi che cercano di monitorare gli effetti indesiderati di un

nuovo farmaco dopo che è stato approvato per il marketing (farmaco-vigilanza).

Valutazione critica degli RCTs

(12)

Come valutare criticamente un RCT

• Durante la lettura di una pubblicazione si devono trovare informazioni sufficienti, presentate chiaramente e coerentemente, affinché si possa decidere, in base alle evidenze fornite dagli autori, se le

conclusioni a cui arrivano sono logiche e credibili.

Le dimensioni da valutare

• Valutazione preliminare

• Validità interna

• Rilevanza clinica

• Validità esterna

(13)

• Lettura dell’abstract: consente di comprendere se:

• l’articolo è pertinente al nostro quesito

• Il disegno è congruente con il metodo che vogliamo leggere

• Inoltre, ci dà la possibilità di farci una idea generale su come è stato condotto lo studio.

Valutazione preliminare

25

Elementi del PICO

• P: sono descritti i criteri di inclusione/esclusione e il setting

• I & C: devono essere descritti chiaramente,

• O: l’endpoint primario dovrebbe essere clinicamente rilevante. Se surrogato deve essere validato.

• M: appropriatezza del disegno dello studio

(14)

Endpoint negli RCTs

• Gli endpoint sono gli esiti che vengono valutatati nello studio. La loro definizione influenza la rilevanza clinica dello studio.

Endpoint

• Umanistici

• Economici

• Clinici:

• Clinicamente rilevanti

• Surrogati

• Validati

(15)

End-point

• Clinicamente rilevanti

• Misurano come un individuo si sente, funziona, sopravvive.

• Surrogati

• sono il risultato di indagini

laboratoristiche o radiologiche che non sono

connesse a situazioni clinicamente rilevanti.

Esempi di endpoint surrogati

• Valutazione della conta delle colonie batteriche, anziché dell’insorgenza di infezioni delle ferite;

• Valutazione del colesterolo totale anziché della mortalità coronarica o degli eventi coronarici;

• La densitometria ossea per lo screening della osteoporosi.

• Il valore dell’emoglobina glicosilata, anziché le complicanze da diabete

• ………..

(16)

Perché vengono utilizzati?

• Più rapidi

• Più facili da valutare

• Meno costosi da rilevare

• Meno invasivi da rilevare

• Insomma possono essere funzionali a concludere prima e meglio un trial…

31

Limiti degli endpoint surrogati

• Solo pochi outcomes surrogati sono fortemente collegati a quelli clinicamente rilevanti.

• Sfortunatamente, la maggior parte di loro sono

solo CORRELATI (direttamente o inversamente)

all’outcome clinico e rappresentano dei sostituti

inaffidabili dei reali esiti clinici.

(17)

Intervento

Patologia

End point surrogato

Outcome clinico reale

Endpoint surrogato funziona se…

Domande preliminari

• Se lo studio non risponde positivamente alle domande preliminari possiamo anche

terminarne la lettura.

• Se invece gli elementi del PICO sono ben

descritti e se il disegno è coerente possiamo

valutare la validità interna.

(18)

Validità interna

• Presuppone la verifica dell’assenza di bias che possono avere compromesso la

validità dei risultati ottenuti.

• Il riscontro di un bias in questa fase può

far cessare la necessità di continuare la

valutazione critica.

(19)

Bias negli RCTs

• Bias di allocazione

• Bias di violazione del protocollo

• Bias di accertamento

• Bias di attrito

37

Bias di allocazione

• Nasce in presenza di un difetto nella

assegnazione dei pazienti al trattamento o al controllo, che produce due gruppi non “identici”.

Questo bias modifica i risultati dello studio, che

possono dipendere, non dal trattamento, ma

dalla diversa distribuzione delle variabili

prognostiche all’interno dei due gruppi (ad

esempio perché i meno gravi sono stati

assegnati al gruppo sperimentale).

(20)

Allocazione

• Per escludere la presenza di bias di allocazione occorre verificare che la

generazione della lista di randomizzazione sia stata casuale e che questa sia stata mantenuta nascosta.

39

Bias di allocazione

• Se uno studio è realmente randomizzato, l’allocazione ai gruppi non può essere influenzata dai ricercatori o dai

partecipanti allo studio.

(21)

Cosa valutare

• Per verificare la presenza di bias di

allocazione verificare che non siano stati posti dei filtri al di là dei criteri dichiarati.

• Occorre verificare che la generazione della lista di randomizzazione sia stata casuale e che questa sia stata mantenuta nascosta.

… e la tab 1

(22)

Nella griglia di valutazione corrispondere alle domande:

• 3.1 L’assegnazione dei pazienti al trattamento era randomizzata?

• 3.2 La randomizzazione era tenuta nascosta?

• 3.4 I gruppi erano simili per tutti i determinanti conosciuti per l’outcome considerato?

43

Bias di violazione del protocollo

• Può succedere che durante la

conduzione di uno studio non tutto vada per il verso giusto: possono esserci degli errori nell’erogazione dell’intervento o del

controllo; possono esserci dei bassi livelli di

compliance da parte dei pazienti; i pazienti

o il medico responsabile possono decidere

(23)

La violazione del protocollo

• La violazione del protocollo si realizza in questi casi:

• Withdrowal o drop-out: hanno sospeso il trattamento;

• Protocol violators/non compliant: hanno assunto farmaci proibiti o i farmaci giusti nei modi/tempi sbagliati (bassa compliance)

• Cross over: i pazienti posso avere ricevuto il trattamento del gruppo opposto.

45

Come si tratta la violazione del protocollo?

• In due modi:

• Mediante i criteri di selezione.

• Con l’analisi secondo l’INTENTION

TO TREAT

(24)

Intenzione di trattamento

• L’analisi secondo ITT è un tipo di analisi dei risultati, in cui vengono valutati tutti coloro che sono stati assegnati a quel tipo di trattamento e non solo coloro che hanno effettivamente assunto il trattamento.

Intention to treat

• Ciò si giustifica con il fatto che, se il

trattamento procura effetti indesiderati tali

da non consentire al soggetto di seguire

correttamente la terapia, considerare il

suo esito negativo nel gruppo di controllo,

piuttosto che non considerarlo affatto, ne

accrescerebbe l’efficacia (è dimostrato

(25)

Come facciamo a capire se è stata fatta?

• Al di là delle dichiarazioni degli autori nel testo, che spesso riportano che l’analisi è stata fatta secondo l’intention to treat, è sufficiente verificare che il numero dei pazienti analizzati corrisponda al numero dei pazienti randomizzati.

Intention to treat

(26)

Eccezione

• L’unica eccezione ammissibile

all’intention to treat si verifica quando il paziente non assume neanche la prima dose del trattamento a cui era stato assegnato (ad esempio perché decede o perché ritira il consenso).

51

Esistono casi in cui è lecita l’intention to treat?

• Sì quando anziché misurare l’efficacia si è misurata la safety del trattamento.

• Se si misurano effetti collaterali, l’analisi secondo intention to treat li diluirebbe con coloro che non hanno assunto il

trattamento.

• È lecito che all’interno dello studio i

(27)

Nella griglia di valutazione corrisponde alla domanda

• 3.3 I pazienti sono stati analizzati nel gruppo a cui erano stati randomizzati (intention to treat)?

53

Bias di accertamento

• Accade quando i risultati o le conclusioni di un trial sono distorte dalla conoscenza relativa all’intervento a cui ogni partecipante è stato sottoposto.

• Questo tipo di errore può essere determinato da chi eroga l’intervento, dai soggetti studiati, dai ricercatori che valutano o analizzano gli

outcome e da coloro che scrivono l’articolo

descrivente il trial.

(28)

Bias di accertamento

• Il miglior modo per evitare questo bias è mantenere le persone coinvolte nello studio non a conoscenza dell’identità dell’intervento il più a lungo possibile, realizzando quella che è detta CECITA’.

Tipologie di Cecità

• Open trial o open label

• Cieco (solo paziente o sanitario erogatore o sanitario rilevatore)

• Doppio cieco (paziente + sanitario erogatore o rilevatore)

• Triplo cieco (paziente + sanitario erogatore +

sanitario rilevatore)

(29)

Il giusto livello di cecità

• Non tutti gli interventi possono essere studiati applicando la cecità.

• Ci poniamo il problema quando la cecità era possibile e non è stata applicata.

• Quello che è veramente rilevante è

verificare che chi ha rilevato l’esito NON era a conoscenza dell’esposizione dei pazienti.

Bias di attrito

• Si chiama attrito, il bias prodotto dai persi al follow up.

• In generale il follow up deve essere:

• sufficientemente lungo da consentire agli esiti di verificarsi;

• sufficientemente completo da non compromettere la numerosità

campionaria.

(30)

Persi al follow up

• I pazienti persi (lost) al follow up sono quelli di cui si sono perse le notizie, per cui non si sa se hanno presentato l’esito o meno,

indipendentemente dall’assunzione del trattamento secondo il protocollo.

In ogni caso

• Rispetto ai persi al follow up gli autori dovrebbero:

• Verificare che i gruppi dei pazienti rimasti nello studio siano rimasti omogenei anche dopo l’eliminazione dei persi.

• Verificare che la numerosità residua sia

sufficiente per mantenere la potenza dello

(31)

Esempio 1

• Follow up 4,1 anni in media.

Nella griglia di valutazione corrisponde alle domande

• 4. Il gruppo sperimentale ed il gruppo di controllo mantenevano una stessa

prognosi anche dopo l’avvio dello studio?

• 4.1 I pazienti erano ciechi rispetto al trattamento?

• 4.2 Gli operatori erano ciechi rispetto al trattamento?

• 4.3 Gli analisti degli outcome erano ciechi

rispetto al trattamento?

(32)

Valutazione della rilevanza clinica

Misure di efficacia nei trials

• Nella lettura degli studi troveremo indicate diverse misure di efficacia.

• La comprensione del loro significato,

l’interpretazione del loro valore e della loro

precisione ci servono per capire la forza e

la direzione dell’associazione che vi è tra

(33)

L’efficacia negli studi

I dati all’interno degli studi possono riguardare variabili continue (glicemia, temperatura,

pressione, colesterolemia) o variabili discrete o dicotomiche (vivo o morto, frattura o non frattura, guarito o non guarito).

Nel primo caso i ricercatori riportano

l’intervallo di valori confrontando le medie o le mediane dei valori.

Nel secondo caso i ricercatori riportano la frequenza con cui si verifica l’evento.

Es. con variabili discrete

Cullen l, et al. Nebulized lidocaine decrease the discomfort of nasogastric tube insertion: a randomized, doubleblind trial. Ann Emerg Med 2004; 44: 131-7.

La somministrazione di lidocaina nebulizzata prima dell’inserimento del sondino naso gastrico riduce il discomfort del paziente?

P: Adulti da sottoporre a posizionamento del SNG in pronto soccorso.

Intervento: nebulizzazione di lidocaina nella narice da utilizzare.

Confronto: nebulizzazione di soluzione fisiologica.

Outcome: disagio misurato attraverso una scala visuale analogica

(misura discreta), difficoltà di inserimento del sondino (misura

discreta).

(34)

Disagio riferito (media dei punteggi della scala visuale analogica)

37.7 59.3 21.6 (5.3 a

38.0)

Difficoltà percepita dall’infermiere nell’inserimento del SNG

2 2 0 (-1 a 1)

Esempio

Endpoint discreti o dicotomici

Tutte le volte che lo studio riporta i dati

espressi come variabili discreti/dicotomiche

al fine di calcolare le misure di associazione

occorre porre i dati in una tabella 2 x 2 o

tabella di contingenza.

(35)

Misure di efficacia per gli esiti discreti o dicotomici

• Il primo passaggio per capire le diverse misure di efficacia consiste nel tabellare i dati.

Evento Sì Evento No

Gruppo

sperimentale a b a + b

Gruppo di

controllo c d c + d

a + c b + d

Un esempio reale

Trivedi DP, Doll R, Khaw KT. Effect of four montly oral vitamin D3 supplementation on fracutres and mortality in men and women living in the community: randomised double blind controlled trial.

BMJ 2003; 326:469-72.

La somministrazione di un integratore di Vitamina D3 per via orale riduce l’incidenza di fratture negli anziani (65-85) residenti al domicilio?

P: anziani residenti al domicilio.

Intervento: somministrazione di un integratore di Vit D3.

Confronto: somministrazione di un placebo.

Outcome: Incidenza di fratture e mortalità da tutte le cause.

Metodo: RCT

(36)

Gruppo intervento

Frattura Non frattura

N. Tot.

Trattamento

sperimentale 119 1226 1345

Trattamento

controllo 149 1192 1341

a d c

b

Questa è la partenza per calcolare:

RR RRR ARR NNT

La frequenza dell’evento nei due gruppi:

EER e CER

(37)

Per calcolare RRR, RR, ARR, una volta tabellati i dati occorre calcolare la frequenza dell’evento nei due gruppi:

EER (Experimental Event Rate) CER (Control Event Rate)

La misura degli effetti quando si utilizzano outcome dicotomici

Experimental Event Rate Frequenza (o rischio) nel gruppo sperimentale

a EER = ---

a + b

La EER ci dice con che frequenza l’endpoint

si è verificato

nel gruppo sperimentale

(38)

La misura degli effetti quando si utilizzano outcome dicotomici

Control Event Rate Frequenza (o rischio) nel gruppo di controllo

c CER = ---

c + d

La CER ci dice con che frequenza l’endpoint

si è verificato nel gruppo di controllo

Rischio Relativo

(39)

il rischio relativo ci dice quanto è grande il rischio di manifestare l’evento negativo nel gruppo

sperimentale rispetto a quello del gruppo di controllo.

Per calcolarlo, è necessaria la frequenza dell’evento nei due gruppi:

- EER (Experimental Event Rate) e - CER (Control Event Rate)

La misura degli effetti quando si utilizzano outcome discreti

Rischio Relativo a EER ---

a + b RR = --- = ---

c CER ---

c + d

Dal rapporto tra EER e CER individuiamo il rischio relativo che ci dice quanto è grande

il rischio di

manifestare l’evento negativo nel gruppo sperimentale

rispetto a quello del gruppo

di controllo.

(40)

Un esempio reale sul trattamento

Gruppo intervento

Frattura Non frattura

N. Tot.

Trattamento

sperimentale 119 1226 1345

Trattamento

controllo 149 1192 1341

a d c

b

Rischio Relativo

EER 0,088

RR = --- = --- = 0,8 CER 0,11

Nel caso in cui lo studio abbia valutato un outcome sfavorevole (frattura, morte, infezione, ecc.) RR ha le seguenti interpretazioni:

Se RR<1 l’intervento/esposizione ha un effetto benefico

Se RR>1 l’intervento/esposizione peggiora l’esito

Interpretare RR

(41)

Nel caso in cui lo studio abbia valutato come outcome un evento favorevole (guarigione della ferita, recupero funzionale, ripresa della peristalsi, ecc.) RR ha le seguenti interpretazioni:

Se RR>1, l’intervento/esposizione ha un effetto benefico

Se RR<1 l’intervento/esposizione peggiora l’esito Se RR=1 non c’è differenza

81

Interpretare RR

Riduzione relativa del rischio

Si utilizza negli studi sul trattamento che abbiano valutato un endpoint sfavorevole (frattura, morte, infezione, ecc.), se si rileva un effetto positivo del trattamento.

La RRR indica in percentuale, la riduzione del rischio che il trattamento determina nei

trattati rispetto ai controlli.

(42)

Riduzione relativa del rischio

Calcolo della riduzione relativa del rischio

CER – EER RRR = ---

CER

RRI

Nel caso in cui lo studio abbia valutato come endpoint un evento sfavorevole (frattura, morte, infezione, ecc.), ma ne abbia

individuato la dannosità, RRR diventa RRI, Relative Risk Increase: Aumento del

rischio relativo.

(43)

• Al fine di facilitare l’interpretazione del RR, si può velocemente calcolare di quanto è ridotto (o

aumentato) il rischio del gruppo sperimentale, rispetto al gruppo di controllo:

RRR = (CER-EER)/CER = 1- RR

PS: se RR>1 allora avremo un relative risk increase RRI = RR-1

Esempio 1

L’assunzione di TOS aumenta del 22% il rischio di morte per CHD

Esempio 2

L’uso della clorexidina alcolica riduce del 41%

l’incidenza di infezioni della ferita chirurgica

RRR

La RR e RRR sono misure relative, che non danno l’idea della frequenza, e quindi dell’importanza, della riduzione degli eventi negativi ridotti dal

trattamento sperimentato.

I difetti di RR e RRR

(44)

87

31/08/2017 87

• ARR è anche detto Risk Difference.

• È misura assoluta della riduzione del rischio. ARR = CER - EER

Esempio 2

66 pazienti su 1000 non hanno sviluppato infezione della ferita chirurgica grazie all’uso della

clorexidina alcolica

ARR = RD

(45)

89

NNT

Number Needed to Treat

• E’ il numero di pazienti da trattare

per ottenere un beneficio terapeutico in un paziente, ad esempio prevenire un evento negativo.

Ad esempio: a quanti pazienti deve essere praticata l’antisepsi con clorexidina alcolica, anziché iodopovidone, per evitare l’infezione della ferita chirurgica?

NNT

(46)

Cosa sapevamo in merito?

Il calcolo del Risk Difference, che è 0.066, aveva dimostrato che 66 pazienti su 1000 non hanno sviluppato infezione della ferita chirurgica grazie all’uso della clorexidina alcolica.

Se ipoteticamente mettessimo in fila questi 1000 pazienti, ogni quanto troveremmo il fortunato? 1000/66 = 16 (15,15 arrotondato per eccesso).

1 NNT = --- = ARR

1000 1

--- = --- = 15,15  16 66 0,066

91

Come la mettiamo con l’esempio 1?

Essendo l’incidenza degli eventi > nel gruppo sperimentale, il trattamento si è dimostrato dannoso, dato che aumenta il rischio di eventi negativi. Quando si verifica questa situazione non si parla di Number Needed to Treat, ma di Number Needed to Harm, che rappresenta il numero dei pazienti che se trattati incorrono nell’evento negativo.

1 NNH = --- =

1000 1

--- = --- = 100

(47)

Riprendiamo l’esempio di apertura

Gruppo intervento

Frattura Non frattura

N. Tot.

Trattamento

sperimentale 119 1226 1345

Trattamento

controllo 149 1192 1341

a c d

b

Riduzione del Rischio Relativo EER = 0.088

CER = 0.11

EER 0,088

RR = --- = --- = 0,8 CER 0,11

RRR= [(0.11-0.088)/0.11] x 100 = 20%

Oppure

RRR = [1- (0.088/0.11)] x 100 = 20%

La terapia con Vitamina D3 riduce le fratture di femore del 20%

NNT e NNH

• NNT = Number Needed to Treat

Quando il trattamento produce dei danni anziché dei benefici, il valore di ARR diventa negativo ed anche l’NNT si presenta con il segno “-”.

L’NNT negativo si legge NNH in quanto il trattamento produce un danno.

• NNT = Number Needed to Harm

(48)

Ipotesi nulla nei parametri dicotomici

Parametro Valore nullo

RR, OR 1

RRR, ARR 0

NNT Infinito

Se questo valore è 1, il rischio o la

probabilità di incorrere nell’evento sono uguali in presenza

o in assenza del trattamento

ARR non deve essere 0, perché significherebbe che il beneficio ottenuto in termini di riduzione assoluta del rischio è 0, nel qual caso NNT diventerebbe un valore tendente ad infinito.

Ipotesi nulla nei parametri continui

• Nel caso in cui lo studio misuri parametri

continui, mediante la dimostrazione della

differenza della media, essa non deve

essere 0.

(49)

Gli intervalli di confidenza

IC: a cosa serve?

• Vengono utilizzati in tutti gli studi in cui non è possibile studiare l’intera

popolazione , della quale viene studiato solo un campione

rappresentativo.

(50)

La curva gaussiana

Perché ci interessa?

• L’ampiezza dell’intervallo di

confidenza (Intervallo di Confidenza – IC - o Confidence Interval - CI) fornisce la

misura della precisione ^(o

dell’incertezza) dei risultati di uno studio, così da poter trarre deduzioni sulla

popolazione da cui sono tratti quei pazienti.

(51)

Cosa ci interessa sapere del IC?

• In particolare dobbiamo verificare:

-Quanto è ampio l’intervallo di confidenza.

-Che i valori dei suoi estremi, non devono

cadere oltre il valore che conferma

l’ipotesi nulla.

(52)

Test di significatività:

valore di p

Lo zampino del caso

• Il risultato di uno studio potrebbe dipendere non dalla associazione tra trattamento/fattore prognostico/ agente eziologico ed endpoint, ma derivare da:

• Variabilità campionaria

• Variabilità biologica

• Errore di misurazione

(53)

P = significatività statistica

• In questi casi siamo di fronte ad un risultato dovuto essenzialmente al caso.

• La misura di p ci dice qual è la probabilità che il risultato a cui è pervenuto lo studio possa essere dovuto semplicemente al caso e non alla reale associazione.

• Quanto deve essere il valore di p per poter escludere l’ipotesi nulla?

Test di significatività statistica

• Viene deciso dai ricercatori, al momento di stabilire la numerosità del campione.

• Il valore di p corrisponde all’errore alfa,

che dice in che misura i ricercatori hanno

ritenuto tollerabile che lo studio possa

essere arrivato a dimostrare un risultato

positivo, quando in realtà esso non esiste

(per cui è scaturito per caso).

(54)

Test di significatività statistica

• Può essere stabilita allo 0,05 (5%) o allo 0,01(1%) o …..

• Il livello di significatività più comune è 0,05: si conclude cioè che una associazione non è dovuta al caso se p è uguale o inferiore a 0,05, che vuole dire che il risultato ottenuto potrebbe dipendere dal caso nella misura del 5%, ossia di 5 volte ogni 100 ripetizioni dello stesso studio…

insomma una evenienza piuttosto improbabile.

Da cosa deriva p?

• Da due elementi:

• dalla numerosità del campione che si è riusciti a reclutare;

• Dall’entità della associazione.

(55)

Come interpretare il valore di p

• Se p è al di sopra di 0,05 o di 0,01, significa che i risultati a cui gli autori sono pervenuti sono casuali e quindi non possiamo rifiutare l’ipotesi nulla.

• Insomma, lo studio non è in grado di dimostrare niente.

Significatività non vuole dire importanza

• È chiaro quindi che

• "Significativo" non è sinonimo di

"importante”

• "Significativo" = difficilmente dovuto al

puro caso.

(56)

Significatività statistica e significato clinico

• La significatività statistica non è l’unico criterio utile per decidere se utilizzare i risultati di uno studio.

• La significatività statistica dipende dalla numerosità del campione e dall’entità dell’efficacia del trattamento (differenze degli esiti).

Significatività statistica e significato clinico

• Differenze clinicamente irrilevanti possono divenire statisticamente significative se le

dimensioni dei campioni sono sufficientemente grandi.

• Al contrario, differenze clinicamente rilevanti possono essere statisticamente non

significative se i campioni sono troppo piccoli

(57)

Nella griglia di valutazione corrisponde alle domande

• 5. Quant’è grande l’effetto del trattamento (considerare i diversi end points)?

• 6. Quant’è precisa la stima dell’effetto del trattamento?

A questo punto

• Dopo avere valutato che i risultati non sono affetti da bias e che sono

clinicamente rilevanti, si valuta la validità

esterna. Ci chiediamo cioè se per noi i

risultati dello studio sono applicabili e se è

il caso di cambiare la nostra pratica alla

luce delle evidenze.

(58)

Validità esterna

• I risultati possono essere applicati alla popolazione locale?

• I pazienti considerati nel trial sono così diversi da quelli da voi assistiti?

• Le caratteristiche del setting possono avere avuto un effetto determinante sui risultati (professionals/skills)?

• Il setting in cui si è svolto lo studio ha delle caratteristiche che lo rendono

estremamente diverso dal vostro?

Validità esterna

• Gli outcome considerati sono clinicamente rilevanti?

• Occorre considerare se lo studio ha

risposto alla propria domanda iniziale,

se si sono evidenziati o se sono stati

trascurati altri outcomes rilevanti.

(59)

Validità esterna

• I benefici bilanciano i rischi ed i costi?

• Generalmente è difficile rispondere a questa domanda in assenza di analisi economiche.

Nella griglia di valutazione corrisponde alle domande

• 7. I pazienti dello studio sono simili a quelli del mio ambito clinico?

• 8. Gli outcome considerati sono clinicamente rilevanti?

• 9. I benefici bilanciano i danni potenziali ed i

costi?

(60)

Paolo Chiari

Corso di Laurea Magistrale in Scienze Infermieristiche e Ostetriche [email protected]

www.unibo.it