• Non ci sono risultati.

(scarica in PDF, 3.39 MB)

N/A
N/A
Protected

Academic year: 2022

Condividi "(scarica in PDF, 3.39 MB)"

Copied!
36
0
0

Testo completo

(1)
(2)

Leggere uno studio clinico

DOVE

(è stato pubblicato)

(G. Grignani)

COME

(è stato pianificato e condotto)

(G.L. Pappagallo)

(3)

Leggere uno studio clinico

COME

è stato pianificato

(Validità Interna)

Materiali e Metodi

COME

è stato condotto

(Validità Esterna)

Risultati

(4)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

What

makes

a good

Research

Question?

(5)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

• Gravità dell’affezione.

• Efficacia delle terapie disponibili.

Tossicità (scomodità) delle tera- pie disponibili rispetto a quelle alternative.

• Presumibile superiorità della te- rapia sperimentale.

Aspetti

meritevoli di

attenzione

(6)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

Dosi / tempi di somministrazione.

Attività (ricerca di esiti suscettibili di indurre un beneficio).

Efficacia (dimostrazione di un be- neficio nei confronti dell’alter- nativa terapeutica “standard”).

• “Effectiveness” (bilancio tra bene- fici e danni nella pratica quotidiana) Cosa si

intende

verificare?

(7)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

(8)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

Dosi / tempi di somministrazione.

Attività (ricerca di esiti suscettibili di indurre un beneficio).

Efficacia (dimostrazione di un be- neficio nei confronti dell’alter- nativa terapeutica “standard”).

• “Effectiveness” (bilancio tra bene- fici e danni nella pratica quotidiana) Cosa si

intende

verificare?

MAI practice changing POTENZIALMENTE practice changing

(9)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

The Iniparib Story

Phase II (NEJM) Phase III (J Clin Oncol)

(10)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

Perché (sempre) Random?

Al fine di assicurare che tutti i fattori prognostici (noti e sconosciuti) si distribuiscano omogeneamente nei due gruppi

Prerequisito

per l’effettua-

zione dei test

statistici

(11)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

Quale

braccio di controllo?

Studio di attività

 Altro trattamento sperimentale (screening for activity)

 Standard terapeutico Studio di efficacia

 Standard terapeutico

(12)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

Il braccio di

controllo può

essere un “non

trattamento”?

(13)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

(14)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

Necessità di validazione

statistica…

(15)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

(16)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

Il risultato del test statistico di confronto fra due trattamenti è influenzato (ma non sappiamo a

favore di chi, e in che misura) dal fatto che lo studio è condotto su un campione

(17)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

 Errore di 1° tipo (errore alpha)

• quando si conclude per un’efficacia del trattamento sperimentale, quando non lo è nella realtà; lo studio è falsamente positivo.

 Errore di 2° tipo (errore beta)

• quando si conclude per una non efficacia del trattamento sperimentale, quando invece lo è nella realtà; lo studio è falsamente negativo.

 Il calcolo delle dimensioni del campione mira a contenere la dimensione degli errori statistici entro valori accettabili (5%

per l’errore di 1° tipo e 20% per l’errore di 2° tipo)

(18)

Plausibilità − Obiettivo − Disegno − Endpoint − Statistiche

Validità Interna

E la “p”

a cosa serve?

• quando il valore di p risultante dal test di significatività è più piccolo del valore soglia (usualmente 5%), si considera lo studio (statisticamente) positivo;

• se il valore di p è maggiore del 5%, si considera lo studio (statisticamente) negativo

• non ha niente a che vedere con l'impor-

tanza clinica dell’effetto osservato

(19)

Confidence − Relevance − Directness

Validità Esterna

A ciascuno studio è richiesto di dare conto del flusso di pazienti

nelle fasi di arruolamento, assegnazione del trattamento,

follow-up e analisi

Permette di evidenziare eventuali bias connessi alla selezione dei pazienti e alla perdita al follow-up

(20)

Confidence − Relevance − Directness

Validità Esterna

Cos’è

il bias?

(21)

Confidence − Relevance − Directness

Validità Esterna

Quali sono i tipi di bias più comuni?

• Allocazione dei pazienti e/o degli interventi “sottratta”

al volere del caso (selection bias)

• violazione ITT

• selective crossover

• interruzione non programmata

(22)

Confidence − Relevance − Directness

Validità Esterna

Quali sono i tipi di bias più comuni?

• Allocazione dei pazienti e/o degli interventi “sottratta”

al volere del caso (selection bias)

• Perdita di pazienti alla valutazione, simmetrica (withdrawal bias) o a carico prevalente di uno dei due gruppi a confronto (attrition bias)

(23)

Confidence − Relevance − Directness

Validità Esterna

Quali sono i tipi di bias più comuni?

• Allocazione dei pazienti e/o degli interventi “sottratta”

al volere del caso (selection bias)

• Perdita di pazienti alla valutazione, simmetrica (withdrawal bias) o a carico prevalente di uno dei due gruppi a confronto (attrition bias)

• Distorsione della valutazione dell’esito derivante dal fatto che il paziente (performance bias) o il valutatore (detection bias) sono a conoscenza del trattamento in essere

• Comunicazione selettiva degli esiti, decisa a posteriori sulla base dei risultati (outcome reporting bias)

(24)

Confidence − Relevance − Directness

Validità Esterna

Cosa sono le analisi di

sottogruppo

Obiettivo: verificare se caratteristiche

peculiari di determinati strati siano in grado di condizionare l’efficacia globale del

trattamento (subgroup effect, interaction).

 quantitative interaction (diversa “forza”

ma identica direzione dell’effetto)

 qualitative interaction (differente dire- zione dell’effetto nei diversi sottogruppi)

(25)

Confidence − Relevance − Directness

Validità Esterna

Warning!

 Subgroup analyses can pose serious multiplicity concerns. By testing enough subgroups, a false- positive result will probably emerge by chance alone.

 Investigators might undertake many analyses but only report the significant effects, distort- ing the medical literature.

 In general, we discourage subgroup analyses.

However, if they are necessary, researchers should do statistical tests of interaction, rather than analyse every separate subgroup.

(26)

Confidence − Relevance − Directness

Validità Esterna

Warning!

 Subgroup analyses can pose serious multiplicity concerns. By testing enough subgroups, a false- positive result will probably emerge by chance alone.

 Investigators might undertake many analyses but only report the significant effects, distort- ing the medical literature.

(27)

Multiplicity Bias (Reporting Bias?)

(28)

Confidence − Relevance − Directness

Validità Esterna

Warning!

 Subgroup analyses can pose serious multiplicity concerns. By testing enough subgroups, a false- positive result will probably emerge by chance alone.

 Investigators might undertake many analyses but only report the significant effects, distort- ing the medical literature.

 In general, we discourage subgroup analyses.

However, if they are necessary, researchers should do statistical tests of interaction, rather than analyse every separate subgroup.

(29)

Confidence − Relevance − Directness

Validità Esterna

Test di interazione

Verifica dell’ipotesi di

efficacia

(30)

Confidence − Relevance − Directness

Validità Esterna

Le analisi di sotto- gruppo possono avere una diversa attendibilità?

• Post-hoc

– “Fishing Expedition”…

• Pre-specified (preannunciata)

– fattore di stratificazione? test di interazione?

– (in ogni caso) è solo generazione di ipotesi

• Pre-planned (pre-pianificata)

– definizione di un piano statistico

• hierarchical approach

• alpha-spending (tra confronto primario e sottogruppi di interesse)

• adeguamento delle dimensioni campionarie

– “superamento” della generazione di ipotesi

(31)

Confidence − Relevance − Directness

Validità Esterna

• Statistical Significance

“Is an observed difference likely to be real”

 dependent on the magnitude of the number of patients and/or the magnitude of the difference NOT on whether the difference is meaningful for patients

• Clinical Significance

“Is an observed difference likely to be meaningful for patients”

 dependent on the magnitude of the difference NOT the number of patients

(32)

Confidence − Relevance − Directness

Validità Esterna

Beneficio clinico minimo che si ritiene utile ottenere

(33)

Target Δ: HR erlotinib:placebo = 0.75 (2 months OS improvement) Analysis after 381 events (450 patients; α 5%, power 80%)

Effetto di dimensione inferiore al beneficio minimo preordinato (Δ)

(34)

Confidence − Relevance − Directness

Validità Esterna

Direct Evidence comes from

research that…

• is conducted in the Population that we are providing answers for;

• includes the Intervention that we are interested in…

• …and compares these interventions with the appropriate Alternatives;

• measures the Outcomes in which we are interested

(35)

Confidence − Relevance − Directness

Validità Esterna

(36)

Confidence Relevance Directness

Plausibilità Obiettivo Disegno Endpoint Statistiche

Riferimenti

Documenti correlati

To help patients under- stand the need for a daily focus on their weight loss program, I tell them suc- cessful treatment of obesity is like having a successful pregnancy.. No less

Attrition bias Valutazione degli endpoint Detection bias Analisi statistica Selection bias... Evoluzione

Method used to implement the random allocation sequence (eg, numbered containers or central telephone), clarifying whether the sequence was concealed until interventions

Fig.. Uomo di 37 anni sottoposto 13 anni prima a radioterapia e chemioterapia per linfoma di Hodgkin. Ricoverato per sindrome coronarica acuta. L’ esame ecocardiografico

Legenda: FPG = fasting plasma glucose; IGT = impaired glucose tolerance; IFG = impaired fasting glucose; 2hPG = 2-h post-load plasma glucose.. Valori di riferimento per la diagnosi

L’incidenza della malattia aumenta con l’età e nel 50% dei casi la diagnosi viene fatta in pazienti con oltre 70 anni... IL

Analisi esone 18 Non eseguibile (Metodo Analisi di sequenza). Analisi esone 19 Non eseguibile (Metodo Analisi

8 th European Symposium on Poultry Welfare Worging Group 9 of the WPSA4.