Quanti soggetti devono essere selezionati?
Quanti soggetti devono essere selezionati?
Ad esempio:
Ad esempio: in uno studio di confronto tra due gruppi anche quando una differenza esiste realmente può accadere che una numerosità campionaria
troppo esigua comporti un livello di significatività alto e un intervallo di confidenza ampio e ciò potrebbe portare il ricercatore alla conclusione
errata di assenza di differenza tra i due gruppi Determinare una appropriata numerosit
Determinare una appropriata numerositàà campionaria campionaria giàgià in fase di disegno dello studio in fase di disegno dello studio
è molto è molto importanteimportante
Studi basati su campioni troppo piccoli non hanno la sensibilit Studi basati su campioni troppo piccoli non hanno la sensibilità à adeguata per poter individuare un effetto
adeguata per poter individuare un effetto
La numerosit
La numerosit à à campionaria campionaria
A parit
A paritàà di altre condizioni, in genere uno studio èdi altre condizioni, in genere uno studio è tanto piùtanto più affidabile quante pi
affidabile quante piùù persone arruola.persone arruola.
la numerosit
la numerositàà del campione riduce la probabilitdel campione riduce la probabilitàà di due errori:di due errori:
il il falso positivofalso positivo ovvero lovvero l’’attribuzione al trattamento di attribuzione al trattamento di unun’’efficacia che in realtefficacia che in realtàà non hanon ha
Il falso negativoIl falso negativo, ovvero il mancato riconoscimento , ovvero il mancato riconoscimento
delldell’’efficacia che il trattamento ha ma che lo studio non efficacia che il trattamento ha ma che lo studio non documenta
documenta
Per convenzione in genere si accetta che il caso abbia non Per convenzione in genere si accetta che il caso abbia non piùpiù di 1 o 5 probabilitdi 1 o 5 probabilitàà su 100 di determinare un risultato falso su 100 di determinare un risultato falso positivo
positivo: p=0,01 oppure p=0,05, significa che ci sono 1 e : p=0,01 oppure p=0,05, significa che ci sono 1 e rispettivamente 5 probabilit
rispettivamente 5 probabilitàà su 100 che il risultato osservato su 100 che il risultato osservato sia dovuto al caso anzich
sia dovuto al caso anzichéé al trattamento e la probabilital trattamento e la probabilitàà che che sia stato proprio il trattamento a determinare il beneficio
sia stato proprio il trattamento a determinare il beneficio èè del del 99% o, rispettivamente del 95%:
99% o, rispettivamente del 95%:
solo in questi casi il risultato
solo in questi casi il risultato èè considerato considerato statisticamente significativo
statisticamente significativo
La numerosit
La numerosit à à campionaria: campionaria:
Falso positivo e livello di significativit
Falso positivo e livello di significativit à à
p-value significatività zcrit value
0,01 99% 2,58
0,02 98% 2,33
0,05 95% 1,96
0,1 99% 1,64
Valori della Normale standardizzata
corrispondente ai diversi livelli di significatività Livello di significativit
Livello di significativitàà e valori della Normale (Gaussiana)e valori della Normale (Gaussiana)
Ad ogni livello di significativit
Ad ogni livello di significativitàà corrisponde un valore della Normale standardizzata:corrisponde un valore della Normale standardizzata:
Al 95% di significativit
Al 95% di significativitàà corrisponde uno z critico pari a 1,96corrisponde uno z critico pari a 1,96
La numerosit
La numerosit à à campionaria: campionaria:
Falso negativo e potenza dello studio Falso negativo e potenza dello studio
Sempre per convenzione si accetta che il Sempre per convenzione si accetta che il caso abbia non pi
caso abbia non pi ù ù di 10 o 20 probabilit di 10 o 20 probabilit à à su 100 di non far emergere un vantaggio su 100 di non far emergere un vantaggio
relativo al trattamento
relativo al trattamento falso negativo falso negativo . In . In questo caso si dice che
questo caso si dice che lo studio ha una lo studio ha una POTENZA rispettivamente del 90 o
POTENZA rispettivamente del 90 o
dell dell ’ ’ 80% 80%
Potenza dello studio Potenza dello studio
la la potenza dello studiopotenza dello studio èè la probabilitla probabilitàà di identificare di identificare correttamente la differenza tra due gruppi nel campione in studi correttamente la differenza tra due gruppi nel campione in studio o quando effettivamente esiste nella popolazione da cui il campion quando effettivamente esiste nella popolazione da cui il campione e èè stato estratto (
stato estratto (veri positiviveri positivi).).
Potenza dello studio= 1 Potenza dello studio= 1--ββ
L’L’ errore di 2°errore di 2° tipo (tipo (β)β) èè la probabilitla probabilitàà di non identificare una differenza di non identificare una differenza significativa quando effettivamente esiste (
significativa quando effettivamente esiste (falsi negativifalsi negativi))
Quindi
per ββ=0,10=0,10 ovvero per una probabilità massima accettata di falsi negativifalsi negativi del 10%10% la potenza dello studio
potenza dello studio è 0,900,90ovvero il 90%90%
per ββ=0,20=0,20 ovvero 20%,20%, la potenza dello studiopotenza dello studio è 0,800,80 , cioè l’l’80%80%
Potenza zpwr value
80% 0,84
85% 1,04
90% 1,28
95% 1,64
Valori della Normale standardizzata corrispondenti a diversi valori di potenza
statistica dello studio
Potenza dello studio e valori della Normale (Gaussiana) Potenza dello studio e valori della Normale (Gaussiana)
Ad valore della Potenza corrisponde un valore della Normale stan
Ad valore della Potenza corrisponde un valore della Normale standardizzata:dardizzata:
Ad una potenza del 90% corrisponde uno z critico pari a 1,28 Ad una potenza del 90% corrisponde uno z critico pari a 1,28
Quanti soggetti devono essere selezionati?
Quanti soggetti devono essere selezionati?
per il calcolo della numerosit
per il calcolo della numerositàà del campione del campione èè necessario considerare:necessario considerare:
pp-value-value la probabilitàla probabilità di interpretare erroneamente come vero un di interpretare erroneamente come vero un risultato casuale (errore di I
risultato casuale (errore di I°° tipo) tipo)
Potenza: la probabilitPotenza: la probabilitàà di identificare correttamente una differenza tra di identificare correttamente una differenza tra due gruppi in studio quando questa differenza esiste nelle popol
due gruppi in studio quando questa differenza esiste nelle popolazioni azioni da cui i campioni sono stati estratti (1
da cui i campioni sono stati estratti (1--errore di IIerrore di II°° tipo)tipo)
EffettoEffetto: la differenza minima attesa tra i due gruppi (in termini di es: la differenza minima attesa tra i due gruppi (in termini di esiti in iti in studio) . E
studio) . E’’ una quantitàuna quantità soggettiva, basata sul giudizio clinico.soggettiva, basata sul giudizio clinico.
Deviazione standardDeviazione standard ovvero variabilitovvero variabilitàà casuale del fenomeno in studio. casuale del fenomeno in studio.
Si considerano dati di letteratura, indagini precedenti ecc.
Si considerano dati di letteratura, indagini precedenti ecc.
Quanti soggetti devono essere selezionati?
Quanti soggetti devono essere selezionati?
Il calcolo della numerosit
Il calcolo della numerositàà campionariacampionaria
DD22
N=N=
4σ4σ22 (Z(Zcritcrit + Z+ Zpwrpwr))22
σσ22= = èè la varianza ( il quadrato della deviazione standard) la varianza ( il quadrato della deviazione standard)
ZZcricritt= = il valore della normale in corrispondenza del pil valore della normale in corrispondenza del p--value fissatovalue fissato
ZZpwpwrr= = il valore della normale in corrispondenza della potenza fissatail valore della normale in corrispondenza della potenza fissata DD22
N=N=
4σ4σ22 (Z(Zcritcrit + Z+ Zpwrpwr))22
DD22= = èè il quadrato della differenza minima attesail quadrato della differenza minima attesa
p-value significatività zcrit value
0,01 99% 2,58
0,02 98% 2,33
0,05 95% 1,96
0,1 99% 1,64
Valori della Normale standardizzata
corrispondente ai diversi livelli di significatività
Potenza zpwr value
80% 0,84
85% 1,04
90% 1,28
95% 1,64
Valori della Normale standardizzata corrispondenti a diversi valori di potenza
statistica dello studio
Il calcolo della numerosit
Il calcolo della numerositàà campionaria esempiocampionaria esempio
Calcolare la numerosit
Calcolare la numerositàà campionaria fissato un livello di significativitcampionaria fissato un livello di significativitàà del 5% e una del 5% e una potenza dell
potenza dell’’90%. La differenza attesa 90%. La differenza attesa èè 3 e la varianza 203 e la varianza 20
3322
4 x 20 x (1,96 + 1,28) 4 x 20 x (1,96 + 1,28)22
== 9393 Studio di confronto tra due gruppi
Studio di confronto tra due gruppi
=== 9393
= 9393 4 x 20 x (1,96 + 1,28)
4 x 20 x (1,96 + 1,28)22
== 9393
==
3322
4 x 20 x (1,96 + 1,28) 4 x 20 x (1,96 + 1,28)22
== 9393
Studi descrittivi Studi descrittivi
Nel caso di studi descrittivi in cui non interessa il confronto tra gruppi Nel caso di studi descrittivi in cui non interessa il confronto tra gruppi ad esempio negli studi di prevalenza, in generale negli studi in
ad esempio negli studi di prevalenza, in generale negli studi in cui si cui si voglia stimare una proporzione di un fenomeno, il calcolo della
voglia stimare una proporzione di un fenomeno, il calcolo della numerosit
numerositàà campionaria si basa sulla seguente formula:campionaria si basa sulla seguente formula:
Il calcolo della numerosit
Il calcolo della numerositàà campionariacampionaria per studi descrittivi
per studi descrittivi
p(1p(1--p)p) = = èè la varianza della proporzione p. Il valore di p deriva da studla varianza della proporzione p. Il valore di p deriva da studi i precedenti o dati di letteratura e nel caso non si conosca viene
precedenti o dati di letteratura e nel caso non si conosca viene posto pari a posto pari a 0,50,5
DD22 = è la precisione della stima che si desidera ottenere, ovvero l’ampiezza dell’intervallo di confidenza
DD22 4p(14p(1-p) Z-p) Zcritcrit22
N =N =
Il calcolo della numerosit
Il calcolo della numerositàà campionariacampionaria per studi descrittivi esempio
per studi descrittivi esempio
LL’’obiettivo di uno studio sullobiettivo di uno studio sull’’alimentazione degli adolescenti, alimentazione degli adolescenti, èè di stimare il di stimare il loro consumo proteico medio giornaliero, misurato in grammi. Qua
loro consumo proteico medio giornaliero, misurato in grammi. Quanti nti adoloscenti
adoloscenti èè necessario reclutare nello studio, in modo da stimare il valorenecessario reclutare nello studio, in modo da stimare il valore medio entro un intervallo di confidenza di 10 grammi, ad un live
medio entro un intervallo di confidenza di 10 grammi, ad un livello di llo di significativit
significativitàà del 5% e sapendo che la varianza (ovvero la variabilitdel 5% e sapendo che la varianza (ovvero la variabilitàà intorno al intorno al valor medio), come risulta da precedenti studi
valor medio), come risulta da precedenti studi èè di 20 grammidi 20 grammi
p(1p(1--p)p) = 20= 20 DD22 = 102 ZZcritcrit22 =1,96=1,96
= = = 61,47= 61,47
Quindi per ottenere stime ad una significativit
Quindi per ottenere stime ad una significativitàà del 95% e intervallo di del 95% e intervallo di confidenza di ampiezza 10 grammi
confidenza di ampiezza 10 grammi
il campione deve essere composto da non meno di 62 adolescenti il campione deve essere composto da non meno di 62 adolescenti
101022 4x20x1,96 4x20x1,9622