STUDI SPERIMENTALI

(1)

STUDI SPERIMENTALI

Dott.ssa

Domenica Gazineo

[email protected]

(2)

Premessa

• Negli anni si sono moltiplicati i termini utilizzati per descrivere le numerose varianti di trial

• La terminologia si è progressivamente arricchita dando vita a un “linguaggio dei trial”, non

sempre intuitivo né di immediata comprensione

• Se alcuni termini sono mutuamente esclusivi, altri si sovrappongono in maniera variabile e/o possono essere utilizzati in maniera

complementare

(3)

Classificazione dei trial in relazione a…

• Modalità di assegnazione dei partecipanti

• Unità di randomizzazione

• Numero dei partecipanti

• Numero dei centri

• Conoscenza del trattamento assegnato

• Preferenze dei partecipanti

• Obiettivi

(4)

Classificazione dei trial in relazione a…

• Obiettivi

• 1.1. Explanatory (efficacy) vs pragmatic (effectiveness)

• 1.2. Trial di fase I, II, III, IV

• 1.3. Trial di superiorità, di equivalenza, di non-inferiorità

(5)

1.1. Explanatory vs pragmatic trial

• Gli explanatory trial hanno l’obiettivo di dimostrare

l’efficacia degli interventi sanitari (farmaci in particolare) in contesti sperimentali ideali (efficacy) .

• Gli explanatory trial generalmente arruolano popolazioni selezionate e omogenee escludendo pazienti

“complessi” (comorbidità, polifarmacia, anziani, donne);

spesso l’intervento in studio è confrontato con il placebo, con un farmaco meno efficace o utilizzato a dosaggi inferiori; prevedono spesso periodi di run-in e/o di wash- out; competenze e motivazioni dei professionisti e

standard organizzativo-assistenziali ideali rispetto alla realtà.

(6)

1.1. Explanatory vs pragmatic trial

• Poiché l’efficacia reale (effectiveness) degli

interventi sanitari viene influenzata da numerosi fattori – grado di accuratezza diagnostica,

aderenza dei professionisti ai risultati del trial, compliance dei pazienti, diffusione delle

tecnologie, equità d’accesso ai servizi sanitari – per dimostrare l’efficacia nel mondo reale si fa spesso riferimento agli studi osservazionali che, rispetto ai trial, tendono a sovrastimare l’efficacia dei trattamenti

(7)

1.1. Explanatory vs pragmatic trial

• I pragmatic trial hanno l’obiettivo di dimostrare l’efficacia reale (effectiveness) di interventi sanitari di provata

efficacy

• I partecipanti vengono randomizzati per prevenire il bias di assegnazione, ma i criteri di selezione sono molto ampi, al fine di arruolare un campione quanto più simile alla popolazione reale

• I pazienti vengono inclusi nello studio in base ai sintomi, piuttosto che sulla base di test diagnostici molto accurati;

i regimi terapeutici sono flessibili prevedono che il paziente possa rifiutare il trattamento proposto

(8)

1.1. Explanatory vs pragmatic trial

• Le condizioni assistenziali e il training dei professionisti sono simili a quelli reali.

• Di fatto, è impossibile classificare i trial in due categorie mutuamente esclusive,

perchè nello stesso studio generalmente convivono “attitudini” sia explanatory, sia pragmatic

(9)

(10)

1.2. Trial di fase I, II, III, IV

• I trial di fase I vengono avviati dopo la conclusione della ricerca pre-clinica con l'obiettivo di valutare sicurezza dei farmaci sull’uomo

• Sono studi non controllati, condotti su poche decine di volontari sani o di pazienti in fase terminale e/o senza altre alternative terapeutiche (AIDS, oncologia, malattie rare)

• Il farmaco viene somministrato a dosaggi crescenti per verificare l’eventuale comparsa di effetti collaterali

(11)

1.2. Trial di fase I, II, III, IV

• I trial di fase II hanno l’obiettivo primario di valutare la potenziale efficacia del nuovo farmaco studiando differenti dosaggi e frequenze di somministrazione.

• Possono identificare effetti avversi non rilevati nella fase I.

• In coerenza con i loro obiettivi primari, i trial di fase II

dovrebbero sempre essere non controllati, ma negli ultimi anni - per l’incalzante necessità di anticipare l’immissione in mercato di nuovi farmaci - un numero sempre maggiore di studi di fase II prevedono il gruppo di controllo vs

placebo

(12)

1.2. Trial di fase I, II, III, IV

• I trial di fase III corrispondono ai trial controllati randomizzati, evidenze scientifiche che

permettono, nella maggior parte dei casi, di ottenere la registrazione del farmaco e la conseguente immissione sul mercato

• Gli studi di fase III, per ragioni etiche, dovrebbero sempre confrontare il nuovo farmaco con il miglior trattamento disponibile

(13)

1.2. Trial di fase I, II, III, IV

• I trial di fase IV possono essere condotti solo dopo l’immissione in commercio del nuovo farmaco e oggi, di fatto, si identificano con i trial pragmatici

• La fase IV della ricerca farmacologica (costituita prevalentemente da studi osservazionali post- marketing con l’obiettivo di valutare la sicurezza dei farmaci a seguito del loro uso su larga scala) non coincide con i trial di fase IV, condotti con l’obiettivo di valutare l’effectiveness di trattamenti di dimostrata efficacy

(14)

1.3. Trial di superiorità

• L’obiettivo dei trial di superiorità è dimostrare che il trattamento sperimentale è più efficace rispetto a quello standard (o al placebo)

• Un trial di superiorità risulta statisticamente significativo quando viene rifiutata l’ipotesi nulla, secondo la quale gli interventi sanitari a confronto hanno la stessa efficacia

(15)

1.3. Trial di superiorità

(16)

1.3. Trial di equivalenza

• Hanno l’obiettivo di dimostrare che il trattamento sperimentale è equivalente a quello standard

• Non permettono di dimostrare l’equivalenza assoluta dei trattamenti a confronto, ma solo l’assenza di differenze all’interno di un intervallo definito (margine di

equivalenza) che, oltre a essere molto ristretto - dovrebbe identificare una differenza clinicamente irrilevante

• I trial di equivalenza sono poco diffusi perché richiedono l’arruolamento di un numero molto elevato di

partecipanti, senza offrire grandi vantaggi organizzativo- economici rispetto ai trial di superiorità

(17)

Trial di equivalenza

(18)

1.3. Trial di non-inferiorità

• Hanno l'obiettivo di dimostrare che il

trattamento sperimentale non è inferiore rispetto al controllo, accettando che possa anche essere meno efficace di un valore predefinito (margine di non-inferiorità) che identifica una differenza non rilevante dal punto di vista clinico.

(19)

1.3. Trial di non-inferiorità

• Senza entrare nel merito della non eticità di questi trial, né delle loro criticità metodologiche, questa tipologia di studi si è progressivamente diffusa in un particolare momento storico della ricerca clinica (in particolare farmacologica)

dove, se è molto difficile e costoso dimostrare la superiorità di una nuova terapia rispetto a quella standard, i trial di non-inferiorità assicurano

comunque al prodotto l’immissione sul mercato.

(20)

1.3. Trial di non-inferiorità

(21)

(22)

Classificazione dei trial in relazione a…

2. Modalità di assegnazione dei partecipanti

• 2.1. Disegno parallelo

• 2.2. Disegno crossover

• 2.3. Disegno fattoriale

(23)

2.1. Trial con disegno parallelo

• Ciascun gruppo di partecipanti riceve un intervento differente

• Nella sua struttura più semplice a due bracci il gruppo dei trattati riceve

l’intervento sperimentale e il gruppo dei controlli il trattamento standard o il

placebo

(24)

2.2. Trial con disegno crossover

• Ciascun partecipante riceve entrambi gli

interventi in studio: sperimentale (A) e controllo (B) con sequenza differente definita dalla

randomizzazione.

• I partecipanti vengono randomizzati a ricevere due (o più trattamenti): il gruppo sperimentale riceve la sequenza A → B e il gruppo di controllo la sequenza B → A.

• La criticità principale è l’estensione degli effetti del primo trattamento che possono alterare la risposta del secondo (carry over effect)

(25)

2.2. Trial con disegno crossover

• Per tale ragione i trial con disegno crossover spesso prevedono un periodo di wash-out tra la sospensione del primo trattamento e l’inizio del secondo.

• Hanno un utilizzo abbastanza limitato: in

particolare per valutare l’efficacia di interventi sanitari, possibilmente senza effetti prolungati, su outcome a breve termine in malattie croniche relativamente stabili.

(26)

(27)

2.3. Trial con disegno fattoriale

• L’efficacia di due (o più) interventi sanitari non è valutata solo individualmente, ma anche in

associazione e vs placebo.

• In un trial con disegno fattoriale che valuta l’efficacia degli interventi A e B i partecipanti vengo randomizzati in quattro bracci: A, B, A+B, placebo

• Questo disegno è spesso utilizzato per valutare l’efficacia d’interventi di prevenzione primaria

(28)

(29)

Classificazione dei trial in relazione a…

3. Unità di randomizzazione

• 3.1. Partecipanti

• 3.2. Gruppi di partecipanti

• 3.3. Parti del corpo

(30)

3.1. Partecipanti

• Nella maggior parte dei trial l’unità di randomizzazione è rappresentata dal singolo partecipante, sia malato o sano

(31)

3.2. Gruppi di partecipanti

• Nei trial con randomizzazione cluster vengono assegnati in maniera casuale

gruppi di partecipanti costituiti da ospedali, distretti sanitari, famiglie, scuole, comuni, etc.

(32)

3.3. Parti del corpo

• Alcuni trial randomizzano organi o parti del corpo bilaterali

• In oculistica, ortopedia, dermatologia sono pubblicati RCTs in cui l’unità di randomizzazione è costituita, rispettivamente, dall’occhio o da un arto.

• Uno dei presupposti fondamentali per la pianificazione di questi trial è che l’efficacia

dell’intervento in studio possa essere valutata solo nell’organo randomizzato e non abbia effetti

sistemici (es. chirurgia della cataratta, protesica, terapie topiche in dermatologia)

(33)

Classificazione dei trial in relazione a…

4. Numero dei partecipanti

• 4.1. N-of-1 RCT vs mega-trial

• 4.2. Campione fisso vs campione variabile

(34)

4.1. N-of-1 RCT

• Il N-of-1 trial è una sperimentazione clinica condotta sul paziente individuale che viene sottoposto a periodi, assegnati in maniera random, in cui si alternano trattamento sperimentale e controllo, rappresentato generalmente dal placebo.

• Sia il medico che il paziente dovrebbero essere mantenuti in cieco rispetto al trattamento

ricevuto e la valutazione degli outcome,

prevalentemente soggettivi, viene effettuata dal paziente utilizzando un diario standardizzato.

(35)

4.1. Mega-trials

• Trial, generalmente multicentrici, che arruolano migliaia di partecipanti.

• Anche se nell’immaginario collettivo il numero di soggetti arruolati è uno dei

criteri di qualità di un trial, i “grandi numeri”

sono in realtà necessari per dimostrare la significatività statistica di differenze

sempre minori tra i nuovi trattamenti e quelli tradizionali.

(36)

4.2. Campione fisso vs sequenziali

• Nei trial a campione fisso (fixed-size) viene effettuata a priori la stima della dimensione del campione

necessario.

• Nei trial sequenziali i partecipanti vengono

progressivamente arruolati sino al raggiungimento di una differenza statisticamente significativa tra i due gruppi, oppure alla ragionevole certezza di equivalenza tra i due trattamenti.

• Un trial sequenziale dovrebbe essere considerato solo quando è possibile verificare il raggiungimento

dell’outcome primario in tempi molto brevi

(37)

Classificazione dei trial in relazione a…

5. Numero dei centri

• 5.1. Monocentrici

• 5.2. Multicentrici

(38)

5. Monocentrici vs multicentrici

• Nei trial monocentrici i partecipanti vengono arruolati da un unico centro

• Nei trial multicentrici da due o più centri, senza alcuna limitazione di numero e di area geografica.

• I trial multicentrici richiedono consistenti investimenti per l’identificazione e il reclutamento dei centri, consentono l’arruolamento di un numero molto elevato di partecipanti e aumentano l’applicabilità clinica dei risultati, in quanto le popolazioni provengono da differenti setting

assistenziali ubicati in paesi o in continenti

(39)

5. Monocentrici vs multicentrici

• Le eventuali differenze di risultati tra i diversi centri, svelate dalle analisi per sottogruppi, sono condizionate sia dalle performance dei vari setting assistenziali, sia da fattori etnici, genetici e ambientali delle popolazioni arruolate.

(40)

Classificazione dei trial in relazione a…

6. Conoscenza del trattamento assegnato

(41)

7. Conoscenza del trattamento assegnato

• Il blinding è lo strumento metodologico che impedisce a una o più categorie di soggetti coinvolti nel trial di

conoscere il trattamento è assegnato ai due (o più) gruppi di partecipanti

• L’obiettivo del blinding è di prevenire il performance bias e, soprattutto, il detection bias che conseguono al fatto che una o più categorie di soggetti coinvolti nello studio sono a conoscenza del trattamento assegnato

• Considerato che la terminologia classica (singolo, doppio, triplo cieco) è poco riproducibile e ambigua, il CONSORT Statement 2010 raccomanda di riportare quali categorie di soggetti coinvolti nel trial sono blinded

(42)

•Participants: soggetti randomizzati

•Healthcare providers: medici e altri professionisti sanitari che assistono i partecipanti e/o somministrano l’intervento

•Data collectors: soggetti che raccolgono i dati (segni, sintomi, questionari, etc); possono identificarsi con gli healtcare providers e/o con gli outcomes assessors

•Outcomes assessors: hanno il compito di definire se il partecipante ha raggiunto, o meno, l’outcome di

interesse

•Data analysts: statistici che analizzano i dati

•Data safety and monitoring committee: comitato che rivede i dati sulla sicurezza-efficacia dei

trattamenti

•Writers: autori del manoscritto

(43)

Classificazione dei trial in relazione a…

7. Preferenze del paziente

(44)

7. Preferenze del paziente

• In un RCT i partecipanti hanno la stessa probabilità di essere assegnati al gruppo sperimentale o a quello di controllo.

• Questa peculiarità metodologica determina inevitabilmente un errore sistematico nella popolazione che accetta di partecipare al trial.

• Infatti, i pazienti che vorrebbero essere

assegnati all’intervento “preferito” rifiutano di partecipare allo studio

(45)

7. Preferenze del paziente

• Il problema si presenta quando i partecipanti hanno una maggiore preferenza sia per

l’intervento tradizionale, sia per quello

sperimentale, in particolare se accessibile solo all’interno di una sperimentazione clinica perchè non ancora disponibile sul mercato.

• In alcune situazioni questo bias può essere

prevenuto utilizzando specifici disegni di trial che considerano le preferenze dei pazienti (patient preferences trials): disegno di Zelen, disegno di Brewin-Bradley (comprehensive cohort design) e il disegno di Wennberg.

(46)

Studi Randomizzati e Controllati - RCT

• TRIAL = prova, studio, esperimento.

• RANDOMISED = randomizzato, campione preso a caso.

• CONTROLLED = controllato, raffrontato con un campione di controllo.

(47)

Trial randomizzati e controllati

• Sono gli studi sperimentali considerati il

“gold standard” per la valutazione dei

trattamenti, grazie al loro disegno formulato in modo da minimizzare i bias rispetto ad altri disegni.

(48)

Trial randomizzato e controllato

• Negli RCT i membri del campione sono assegnati in modo randomizzato ai due

gruppi: ciò consente di costituire due gruppi in cui i fattori prognostici, sia noti che non, sono equamente distribuiti, e quindi identici ad eccezione del trattamento sperimentato.

(49)

RCT

Pazienti eleggibili Randomizzazione

Intervento sperimentale

Intervento di controllo

Outcome

No outcome

Outcome

No outcome

Direzione della raccolta dati: esposizione Outcome

(50)

Valutazione critica degli RCTs

(51)

Come valutare criticamente un RCT

• Durante la lettura di una pubblicazione si devono trovare informazioni sufficienti, presentate chiaramente e coerentemente, affinché si possa decidere, in base alle evidenze fornite dagli autori, se le

conclusioni a cui arrivano sono logiche e credibili.

(52)

Le dimensioni da valutare

• Valutazione preliminare

• Validità interna

• Rilevanza clinica

• Validità esterna

(53)

Elementi del PICO

• P: sono descritti i criteri di inclusione/esclusione e il setting

• I & C: devono essere descritti chiaramente,

• O: l’endpoint primario dovrebbe essere clinicamente rilevante. Se surrogato deve essere validato.

• M: appropriatezza del disegno dello studio

(54)

Endpoint negli RCTs

• Gli endpoint sono gli esiti che vengono valutatati nello studio.

• La loro definizione influenza la rilevanza clinica dello studio.

(55)

Endpoint

• Umanistici

• Economici

• Clinici:

– Clinicamente rilevanti – Surrogati

• Validati

• Non validati

• Hard vs Soft

(56)

End-point

Clinicamente rilevanti

• Misurano come un individuo si sente, funziona,

sopravvive.

Surrogati

• sono il risultato di indagini

laboratoristiche o radiologiche che non sono connesse a situazioni

clinicamente rilevanti.

(57)

Esempi di endpoint surrogati

• Valutazione della conta delle colonie

batteriche, anziché dell’insorgenza di infezioni delle ferite;

• Valutazione del colesterolo totale anziché della mortalità coronarica o degli eventi coronarici;

• La densitometria ossea per lo screening della osteoporosi.

• Ecc……….

(58)

Intervento

Patologia

End point surrogato

Outcome clinico reale

Endpoint surrogato funziona

se…

(59)

Domande preliminari

• Se lo studio non risponde positivamente alle domande preliminari possiamo anche terminarne la lettura.

• Se invece gli elementi del PICO sono ben descritti e se il disegno è coerente

possiamo valutare la validità interna.

(60)

Validità interna

(61)

Validità interna

• La valutazione della validità interna

presuppone la verifica dell’assenza di bias che possono avere compromesso la

validità dei risultati ottenuti, qualsiasi essi siano.

• Il riscontro di un bias in questa fase può far cessare la necessità di continuare la valutazione critica dello studio.

(62)

Bias negli RCTs

• Bias di selezione/allocazione

• Bias di accertamento

• Bias di violazione del protocollo

• Follow up non sufficientemente lungo e completo.

(63)

Bias di selezione/allocazione

• Accade quando gli outcome di uno studio sono influenzati dalle differenze

sistematiche (reali e non casuali) dei due gruppi di studio, che dipendono dalle

modalità con cui le persone sono state selezionate a partecipare al trial o con cui sono state assegnate ai due gruppi.

(64)

Bias di selezione/allocazione

• La prevenzione di questo tipo di bias si realizza con una corretta

randomizzazione

, che sia casuale ed implementata in modo nascosto.

(65)

Bias di selezione/allocazione

• Se uno studio è realmente randomizzato, l’allocazione ai gruppi non può essere influenzata dai ricercatori o dai

partecipanti allo studio.

(66)

Cosa valutare

• Per verificare la presenza di selection bias verificare che non siano stati posti dei filtri al di là dei criteri dichiarati.

• Occorre verificare che la generazione della lista di randomizzazione sia stata casuale e che questa sia stata mantenuta nascosta.

(67)

Bias di accertamento

• Accade quando i risultati o le conclusioni di un trial sono distorte dalla conoscenza relativa all’intervento a cui ogni partecipante è stato sottoposto.

• Questo tipo di errore può essere determinato da chi eroga l’intervento, dai soggetti studiati, dai ricercatori che valutano o analizzano gli

outcome e da coloro che scrivono l’articolo descrivente il trial.

(68)

Bias di accertamento

• Il miglior modo per evitare questo bias è mantenere le persone coinvolte nello studio non a conoscenza dell’identità dell’intervento il più a lungo possibile, realizzando quella che è detta CECITA’.

(69)

Cecità

• Si tratta di uno degli accorgimenti fondamentali per evitare la

compromissione della validità interna dello studio.

(70)

Tipologie di Cecità

– Open trial o open label

– Cieco specificando chi è stato reso cieco rispetto al trattamento e con quali modalità è stata realizzata la cecità

– Non è più accettata la semplice descrizione di cecità

(71)

La violazione del protocollo

• La violazione del protocollo si realizza in questi casi:

– Withdrowal o drop-out: hanno sospeso il trattamento;

– Non compliant: hanno assunto farmaci proibiti o i farmaci giusti nei modi/tempi sbagliati

– Cross over: hanno ricevuto il trattamento del gruppo opposto.

(72)

Come si tratta la violazione del protocollo?

• In due modi:

– Mediante i criteri di selezione.

– Con l’analisi secondo l’INTENTION TO TREAT

(73)

Intention to treat

• L’analisi secondo Intention to treat è un tipo di analisi dei risultati in cui non

vengono valutati solo coloro che hanno effettivamente assunto il trattamento, ma tutti coloro che sono stati assegnati a quel tipo di trattamento.

(74)

Intention to treat

• Ciò si giustifica con il fatto che, se il trattamento procura effetti indesiderati tali da non

consentire al soggetto di seguire correttamente la terapia, considerare il suo esito negativo nel gruppo di controllo, piuttosto che non

considerarlo affatto, ne accrescerebbe l’efficacia (è dimostrato infatti che chi non segue il protocollo ha esiti peggiori).

(75)

Come facciamo a capire se è stata fatta?

• Al di là delle dichiarazioni degli autori nel testo, che spesso riportano che l’analisi è stata fatta secondo l’intention to treat, è sufficiente verificare che il numero dei pazienti analizzati corrisponda al numero dei pazienti randomizzati.

(76)

Intention to treat

(77)

Il follow up

• Deve essere sufficientemente lungo e completo.

• Varia a seconda del tipo di intervento che si vuola studiare

(78)

Persi al follow up

• I pazienti persi (lost) al follow up sono quelli di cui si sono perse le notizie, per cui non si sa se hanno presentato l’esito o meno,

indipendentemente dall’assunzione del trattamento secondo il protocollo.

(79)

In ogni caso

• Rispetto ai persi al follow up gli autori dovrebbero:

– Verificare che i gruppi dei pazienti rimasti nello studio siano rimasti omogenei anche dopo l’eliminazione dei persi.

– Verificare che la numerosità residua sia sufficiente per mantenere la potenza dello studio.

– Discutere laddove possibile delle cause per il ritiro dallo studio.

(80)

Rilevanza clinica

(81)

Misure di efficacia nei trials

• Nella lettura degli studi troveremo indicate diverse misure di efficacia.

• La comprensione del loro significato,

l’interpretazione del loro valore e della loro precisione ci servono per capire la forza e la direzione dell’associazione che vi è tra trattamento e outcome (e quindi di capire se l’intervento è efficace e in che misura.

(82)

L’efficacia negli studi

• I dati all’interno degli studi possono riguardare variabili continue (glicemia, temperatura,

pressione, colesterolemia) o variabili discrete o dicotomiche (vivo o morto, frattura o non

frattura, guarito o non guarito).

• Nel primo caso i ricercatori riportano

l’intervallo di valori nel quale si modificano i parametri in seguito all’intervento,

confrontando le medie o le mediane dei valori.

• Nel secondo caso i ricercatori riportano la frequenza con cui si verifica l’evento.

(83)

Es. con variabili discrete

• Cullen l, et al. Nebulized lidocaine decrease the

discomfort of nasogastric tube insertion: a randomized, doubleblind trial. Ann Emerg Med 2004; 44: 131-7.

• La somministrazione di lidocaina nebulizzata prima dell’inserimento del sondino naso gastrico riduce il discomfort del paziente?

• P: Adulti da sottoporre a posizionamento del SNG in pronto soccorso.

• Intervento: nebulizzazione di lidocaina nella narice da utilizzare.

• Confronto: nebulizzazione di soluzione fisiologica.

• Outcome: disagio misurato attraverso una scala visuale analogica (misura discreta), difficoltà di inserimento del sondino (misura discreta).

(84)

Disagio riferito (media dei punteggi della scala visuale analogica)

37.7 59.3 21.6 (5.3 a

38.0)

Difficoltà percepita dall’infermiere nell’inserimento del SNG

2 2 0 (-1 a 1)

Esempio

(85)

Misure di associazione

relative ed assolute

(86)

Misure di associazione

(87)

Endpoint dicotomici

• Tutte le volte che lo studio riporta i dati espressi come variabili dicotomiche al

fine di calcolare le misure di associazione occorre porre i dati in una tabella 2 x 2 o tabella di contingenza.

(88)

Misure di efficacia per gli esiti discreti

• Il primo passaggio per capire le diverse misure di efficacia consiste nel tabellare i dati.

Evento Sì Evento No

Gruppo sperimentale

a b a + b

Gruppo di controllo

c d c + d

a + c b + d

(89)

Un esempio reale

• Trivedi DP, Doll R, Khaw KT. Effect of four montly oral vitamin D3 supplementation on fracutres and mortality in men and women living in the community: randomised double blind controlled trial. BMJ 2003; 326:469-72.

• La somministrazione di un integratore di Vitamina D3 per via orale riduce l’incidenza di fratture negli anziani (65-85) residenti al domicilio?

• P: anziani residenti al domicilio.

• Intervento: somministrazione di un integratore di Vit D3.

• Confronto: somministrazione di un placebo.

• Outcome: Incidenza di fratture e mortalità da tutte le cause.

• Metodo: RCT

(90)

Gruppo intervento

Frattura Non frattura

N. Tot.

Trattamento

sperimentale 119 1226 1345

Trattamento

controllo 149 1192 1341

a d c

b

Questa è la partenza per calcolare:

RR RRR

OR ARR NNT

(91)

La frequenza dell’evento nei due gruppi:

EER e CER

(92)

Per calcolare RRR, RR, ARR, una volta tabellati i dati occorre calcolare la frequenza dell’evento nei due gruppi:

EER (Experimental Event Rate) CER (Control Event Rate)

(93)

La misura degli effetti quando si utilizzano outcome dicotomici

Experimental Event Rate Frequenza (o rischio) nel gruppo sperimentale

a EER = ---

a + b

La EER ci dice con che frequenza l’endpoint

si è verificato

nel gruppo sperimentale

(94)

La misura degli effetti quando si utilizzano outcome dicotomici

Control Event Rate

Frequenza (o rischio) nel gruppo di controllo

c

CER = --- c + d

La CER ci dice con che frequenza l’endpoint

si è verificato nel gruppo di controllo

(95)

Rischio Relativo

(96)

• Il rischio relativo esprime il rapporto tra il rischio che si verifichi l’evento nel gruppo sperimentale ed il rischio che si verifichi nel gruppo di controllo.

• Per calcolarlo, una volta tabellati i dati occorre calcolare la frequenza dell’evento nei due gruppi:

EER (Experimental Event Rate) e CER (Control Event Rate)

(97)

La misura degli effetti quando si utilizzano outcome discreti

Rischio Relativo a EER ---

a + b RR = --- = ---

c CER ---

c + d

Dal rapporto tra EER e CER individuiamo il rischio relativo che ci dice quanto è grande

il rischio di

manifestare l’evento negativo nel gruppo sperimentale

rispetto

a quello del gruppo di controllo.

(98)

Un esempio reale sul trattamento

Gruppo intervento

N. Tot.

Trattamento

controllo 149 1192 1341

a d c

b

Rischio Relativo

EER 0,088

RR = --- = --- = 0,8 CER 0,11

(99)

Come interpretare RR

• Nel caso in cui lo studio abbia valutato come endpoint un evento sfavorevole (frattura, morte, infezione, ecc.) RR ha le seguenti

interpretazioni:

• Se l’intervento ha un effetto benefico RR<1

• Se peggiora l’esito RR>1

• Se non c’è differenza RR=1

(100)

Come interpretare RR

• Nel caso in cui lo studio abbia valutato come endpoint un evento favorevole (guarigione della ferita, recupero funzionale, ripresa della

peristalsi, ecc.) RR ha le seguenti interpretazioni:

• Se l’intervento ha un effetto benefico RR>1

• Se peggiora l’esito RR<1

• Se non c’è differenza RR=1

(101)

Riduzione relativa del rischio

• Si utilizza negli studi sul trattamento che abbiano valutato un endpoint sfavorevole

(frattura, morte, infezione, ecc.), se si rileva un effetto positivo del trattamento.

• La RRR indica in percentuale, la riduzione del rischio che il trattamento determina nei trattati rispetto ai controlli.

(102)

Riduzione relativa del rischio

Calcolo della riduzione relativa del rischio

CER – EER RRR = ---

CER

(103)

RRI

• Nel caso in cui lo studio abbia valutato come endpoint un evento sfavorevole (frattura, morte, infezione, ecc.), ma ne abbia individuato la dannosità, RRR diventa RRI, Relative Risk Increase:

Aumento del rischio relativo.

(104)

Rischio attribuibile ARR

Ci dice quanto il trattamento incide nell’intera popolazione dello studio.

(105)

Calcolo del rischio attribuibile

ARR = CER - EER

Rischio attribuibile ARR

(106)

Un esempio reale sul trattamento

Gruppo intervento

N. Tot.

Trattamento

controllo 149 1192 1341

a d c

b

Riduzione del Rischio Relativo EER = 0.088

CER = 0.11

RRR= [(0.11-0.088)/0.11] x 100 = 20%

Oppure

RRR = [1- (0.088/0.11)] x 100 = 20%

La terapia con Vitamina D3 riduce le fratture di femore del 20%

(107)

Un esempio finto sul trattamento

Gruppo intervento

N. Tot.

Trattamento

controllo 119 1226 1345

a d c

b

Riduzione del Rischio Relativo EER = 0.11

CER = 0.088

RRI= [(0.11-0.088)/0.088] x 100 = 25%

Oppure

RRI = [(0.11/0.088)-1] x 100 = 25%

La terapia con il

farmaco Z aumenta il rischio di fratture di femore del 25%

(108)

I “difetti” di e RRR di RR

• La RR e RRR sono misure relative, che non danno l’idea della frequenza, e quindi dell’importanza, della riduzione degli

eventi negativi ridotti dal trattamento sperimentato.

(109)

Il “difetto” di ARR

• Al contrario ARR è proprio espressione di questa misura, ma essendo un numero decimale non è facile da ricordare.

• Per questo motivo la misura che rende al meglio l’importanza clinica

dell’associazione tra trattamento ed outcome è il NNT.

(110)

Number Needed To Treat (NNT)

• È il numero di pazienti da trattare per ottenere un beneficio terapeutico.

NNT = 1/ARR

(111)

NNT e NNH

• NNT = Number Needed to Treat

Quando il trattamento produce dei danni anziché dei benefici, il valore di ARR

diventa negativo ed anche l’NNT si presenta con il segno “-”.

L’NNT negativo si legge NNH in quanto il trattamento produce un danno.

• NNH = Number Needed to Harm

(112)

Odds Ratio

(113)

Cos’è l’ODDS?

• È il rapporto delle persone che incorrono in un evento, rispetto alle persone che non vi

incorrono.

(114)

Se si verifica una caduta su 20 anziani ricoverati in riabilitazione su 100, il rischio di caduta è 20/100 = 0.20 = 20%

Nello stesso scenario l’odds è rappresentato dal rapporto tra i caduti (20) rispetto ai non caduti (80), ossia 20/80=0.25 (ossia 1:4)

Cadute negli anziani Rischio Odds

2 on 100 2/100 = 0,02 2/98 = O,O2

20 on 100 20/100 = 0,20 20/80 = 0,25

50 on 100 50/100 = 0,50 50/50 = 1

80 on 100 80/100 = 0,80 80/20 = 4

Odds vs Rischio

(115)

Cos’è l’Odds Ratio?

• È’ il rapporto tra l’odds delle persone esposte al trattamento e l’odds delle persone del gruppo di controllo.

• OR è una misura di associazione indiretta (non calcola un rischio, ma una

probabilità).

• È espressione della forza dell’associazione tra una esposizione ed un esito.

(116)

Un esempio reale sul trattamento

Gruppo intervento

N. Tot.

Trattamento sperimental e

119 1226 1345 Trattamento

controllo 149 1192 1341

a d c

b

Odds Ratio

OR = (119/1226)/(149/1192)= 0.097/0.125= 0.77

(117)

Interpretare OR

(118)

Come interpretare OR

• Nel caso in cui lo studio abbia valutato come outcome un evento sfavorevole (frattura, morte, infezione, insorgenza di una patologia, ecc.) OR ha le seguenti interpretazioni:

Se l’intervento (o esposizione ad un agente eziologico o fattore prognostico)

• ha un effetto benefico OR<1

• Se peggiora l’esito OR>1

• Se non c’è differenza OR=1

(119)

Come interpretare OR

• Nel caso in cui lo studio abbia valutato come outcome un evento favorevole (guarigione della ferita, recupero funzionale, ripresa della

peristalsi, guarigione, ecc.) OR ha le seguenti interpretazioni:

• Se l’intervento (o esposizione ad un agente eziologico o fattore prognostico) ha

• un effetto benefico OR>1

• Se peggiora l’esito OR<1

• Se non c’è differenza OR=1

(120)

RR Vs OR

• OR è simile a RR se il rischio di base nei controlli (CER) è basso (<10%);

• Se il rischio di base è alto OR tende a valori costantemente più piccoli e lontani dall’unità rispetto a RR (↑ c e quindi il denominatore).

(121)

RR e OR

Al crescere del numero degli eventi nel gruppo di controllo, e quindi di CER, OR si riduce

progressivamente perché aumenta il suo denominatore!

(122)

Ipotesi nulla nei parametri dicotomici

Parametro Valore nullo

RR, OR 1

RRR, ARR 0

NNT Infinito

Se questo valore è 1, il rischio o la

probabilità di incorrere nell’evento sono uguali in presenza

o in assenza del trattamento

ARR non deve essere 0, perché significherebbe che il beneficio ottenuto in termini di riduzione assoluta del rischio è 0, nel qual caso NNT diventerebbe un valore tendente ad infinito.

(123)

Ipotesi nulla nei parametri continui

• Nel caso in cui lo studio misuri parametri continui, mediante la dimostrazione della differenza della media, essa non deve essere 0.

(124)

Gli intervalli di confidenza a cosa servono e come si

interpretano

(125)

I C : a cosa serve?

• Vengono utilizzati in tutti gli studi in cui non è possibile studiare l’intera

popolazione

, della quale viene studiato solo un

campione

rappresentativo.

(126)

Il significato dell’IC

• Se si potesse ripetere uno studio un numero infinito di volte, reclutando campioni sempre diversi, la distribuzione della stima della misura dell’effetto (o di associazione), si distribuirebbe su una curva normale (o gaussiana), intorno ad un valore centrale che è quello ottenibile se si potesse studiare la popolazione.

(127)

La curva gaussiana

(128)

Perché ci interessa?

• L’ampiezza

dell’intervallo di

confidenza (Intervallo di Confidenza – IC - o Confidence Interval - CI) fornisce la

misura della precisione

^(o

dell’incertezza) dei risultati di uno studio, così da poter trarre deduzioni sulla

popolazione da cui sono tratti quei pazienti.

(129)

Cosa ci interessa sapere del IC?

• In particolare dobbiamo verificare:

-Quanto è ampio l’intervallo di confidenza.

-Che i valori dei suoi estremi, non devono cadere oltre il valore che

conferma

l’ipotesi nulla.

(130)

Ampiezza dell’intervallo di confidenza

• Tanto più è ampio l’intervallo di confidenza, tanto meno precisa è la stima dell’efficacia del trattamento (e meno dobbiamo fidarci del

risultato dello studio).

• L’ampiezza dell’IC è inversamente proporzionale alla dimensione del campione

(se ho incluso pochi soggetti il risultato ottenuto è necessariamente poco preciso).

(131)

(132)

Test di significatività:

valore di p

(133)

Lo zampino del caso

• Il risultato di uno studio potrebbe

dipendere non dalla associazione tra trattamento/fattore prognostico/ agente eziologico ed endpoint, ma derivare da:

• Variabilità campionaria

• Variabilità biologica

• Errore di misurazione

(134)

P = significatività statistica

• In questi casi siamo di fronte ad un

risultato dovuto essenzialmente al caso.

• La misura di p ci dice qual’è la probabilità che il risultato a cui è pervenuto lo studio possa essere dovuto semplicemente al caso e non alla reale associazione.

(135)

Test di significatività statistica

• Il valore di p misura la probabilità che un’associazione osservata possa essere dovuta a fluttuazioni casuali, ossia alla possibile variabilità tra campioni, e possa quindi non corrispondere a fenomeni reali.

• Quanto deve essere il valore di p per poter escludere l’ipotesi nulla?

(136)

Test di significatività statistica

• Viene deciso dai ricercatori, al momento di stabilire la numerosità del campione.

• Il valore di p corrisponde all’errore alfa, che dice in che misura i ricercatori hanno ritenuto tollerabile che lo studio possa essere arrivato a dimostrare un risultato positivo, quando in realtà esso non esiste (per cui è scaturito per caso).

(137)

Test di significatività statistica

• Può essere stabilita allo 0,05 (5%) o allo 0,01(1%).

• Il livello di significatività più comune è 0,05: si conclude cioè che una associazione non è

dovuta al caso se p è uguale o inferiore a 0,05, che vuole dire che il risultato ottenuto potrebbe dipendere dal caso nella misura del 5%, ossia di 5 volte ogni 100 ripetizioni dello stesso studio…

insomma una evenienza piuttosto improbabile.

(138)

Da cosa deriva p?

• Da due elementi:

– dalla numerosità del campione che si è riusciti a reclutare;

– Dall’entità della associazione.

(139)

Come interpretare il valore di p

• Se è al di sopra di 0,05 o di 0,01, significa che i risultati a cui gli autori sono pervenuti sono casuali e quindi non possiamo

rifiutare l’ipotesi nulla.

• Insomma,

lo studio non è in

grado di dimostrare niente

^.

(140)

Significatività non vuole dire importanza

• È chiaro quindi che

–“Significativo” non è sinonimo di

“importante”

–“Significativo” = difficilmente

dovuto al puro caso.

(141)

Significatività statistica e significato clinico

• La significatività statistica non è l’unico criterio utile per decidere se utilizzare i risultati di uno studio.

• La significatività statistica dipende dalla numerosità del campione e dall’entità dell’efficacia del trattamento (differenze degli esiti).

(142)

Significatività statistica e significato clinico

• Differenze clinicamente irrilevanti possono divenire statisticamente significative se le dimensioni dei campioni sono

sufficientemente grandi.

• Al contrario, differenze clinicamente

rilevanti possono essere statisticamente non significative se i campioni sono troppo piccoli (in gergo statistico, se lo studio

manca di potenza statistica).

(143)

Validità esterna

• Dopo avere valutato che i risultati non sono affetti da bias e che sono

clinicamente rilevanti, si valuta la validità esterna. Ci chiediamo cioè se per noi i risultati dello studio sono applicabili e se è il caso di cambiare la nostra pratica alla luce delle evidenze.

(144)

Validità esterna

• I risultati possono essere applicati alla popolazione locale?

– I pazienti considerati nel trial sono così diversi da quelli da voi assistiti?

– Le caratteristiche del setting possono avere avuto un effetto determinante sui risultati (professionals/skills)?

– Il setting in cui si è svolto lo studio ha delle caratteristiche che lo rendono estremamente diverso dal vostro?

(145)

Validità esterna

• Gli outcome considerati sono clinicamente rilevanti?

– Occorre considerare se lo studio ha risposto alla propria domanda iniziale, se si sono evidenziati o se sono stati trascurati altri outcomes rilevanti.

(146)

Validità esterna

• I benefici bilanciano i rischi ed i costi?

– Generalmente è difficile rispondere a questa domanda in assenza di analisi economiche.

(147)