La numerosit

(1)

Quanti soggetti devono essere selezionati?

Ad esempio:

Ad esempio: in uno studio di confronto tra due gruppi anche quando una differenza esiste realmente può accadere che una numerosità campionaria

troppo esigua comporti un livello di significatività alto e un intervallo di confidenza ampio e ciò potrebbe portare il ricercatore alla conclusione

errata di assenza di differenza tra i due gruppi Determinare una appropriata numerosit

Determinare una appropriata numerositàà campionaria campionaria giàgià in fase di disegno dello studio in fase di disegno dello studio

è molto è molto importanteimportante

Studi basati su campioni troppo piccoli non hanno la sensibilit Studi basati su campioni troppo piccoli non hanno la sensibilità à adeguata per poter individuare un effetto

adeguata per poter individuare un effetto

(2)

La numerosit

La numerosit à à campionaria campionaria

A parit

A paritàà di altre condizioni, in genere uno studio èdi altre condizioni, in genere uno studio è tanto piùtanto più affidabile quante pi

affidabile quante piùù persone arruola.persone arruola.

la numerosit

la numerositàà del campione riduce la probabilitdel campione riduce la probabilitàà di due errori:di due errori:

 il il falso positivofalso positivo ovvero lovvero l’’attribuzione al trattamento di attribuzione al trattamento di unun’’efficacia che in realtefficacia che in realtàà non hanon ha

 Il falso negativoIl falso negativo, ovvero il mancato riconoscimento , ovvero il mancato riconoscimento

delldell’’efficacia che il trattamento ha ma che lo studio non efficacia che il trattamento ha ma che lo studio non documenta

documenta

(3)

 Per convenzione in genere si accetta che il caso abbia non Per convenzione in genere si accetta che il caso abbia non piùpiù di 1 o 5 probabilitdi 1 o 5 probabilitàà su 100 di determinare un risultato falso su 100 di determinare un risultato falso positivo

positivo: p=0,01 oppure p=0,05, significa che ci sono 1 e : p=0,01 oppure p=0,05, significa che ci sono 1 e rispettivamente 5 probabilit

rispettivamente 5 probabilitàà su 100 che il risultato osservato su 100 che il risultato osservato sia dovuto al caso anzich

sia dovuto al caso anzichéé al trattamento e la probabilital trattamento e la probabilitàà che che sia stato proprio il trattamento a determinare il beneficio

sia stato proprio il trattamento a determinare il beneficio èè del del 99% o, rispettivamente del 95%:

99% o, rispettivamente del 95%:

solo in questi casi il risultato

solo in questi casi il risultato èè considerato considerato statisticamente significativo

statisticamente significativo

La numerosit

La numerosit à à campionaria: campionaria:

Falso positivo e livello di significativit

Falso positivo e livello di significativit à à

(4)

p-value significatività z^crit value

0,01 99% 2,58

0,02 98% 2,33

0,05 95% 1,96

0,1 99% 1,64

Valori della Normale standardizzata

corrispondente ai diversi livelli di significatività Livello di significativit

Livello di significativitàà e valori della Normale (Gaussiana)e valori della Normale (Gaussiana)

Ad ogni livello di significativit

Ad ogni livello di significativitàà corrisponde un valore della Normale standardizzata:corrisponde un valore della Normale standardizzata:

Al 95% di significativit

Al 95% di significativitàà corrisponde uno z critico pari a 1,96corrisponde uno z critico pari a 1,96

(5)

La numerosit

La numerosit à à campionaria: campionaria:

Falso negativo e potenza dello studio Falso negativo e potenza dello studio

  Sempre per convenzione si accetta che il Sempre per convenzione si accetta che il caso abbia non pi

caso abbia non pi ù ù di 10 o 20 probabilit di 10 o 20 probabilit à à su 100 di non far emergere un vantaggio su 100 di non far emergere un vantaggio

relativo al trattamento

relativo al trattamento falso negativo falso negativo . In . In questo caso si dice che

questo caso si dice che lo studio ha una lo studio ha una POTENZA rispettivamente del 90 o

POTENZA rispettivamente del 90 o

dell dell ’ ’ 80% 80%

(6)

Potenza dello studio Potenza dello studio

 la la potenza dello studiopotenza dello studio ^è^è la probabilitla probabilitàà di identificare di identificare correttamente la differenza tra due gruppi nel campione in studi correttamente la differenza tra due gruppi nel campione in studio o quando effettivamente esiste nella popolazione da cui il campion quando effettivamente esiste nella popolazione da cui il campione e èè stato estratto (

stato estratto (veri positiviveri positivi).).

Potenza dello studio= 1 Potenza dello studio= 1--ββ

 L’L’ errore di 2°errore di 2° tipo (tipo (β)β) èè la probabilitla probabilitàà di non identificare una differenza di non identificare una differenza significativa quando effettivamente esiste (

significativa quando effettivamente esiste (falsi negativifalsi negativi))

Quindi

per ββ=0,10=0,10 ovvero per una probabilità massima accettata di falsi negativifalsi negativi del 10%10% la potenza dello studio

potenza dello studio è 0,900,90ovvero il 90%90%

per ββ=0,20=0,20 ovvero 20%,20%, la potenza dello studiopotenza dello studio è 0,800,80 , cioè l’l’80%80%

(7)

Potenza z^pwr value

80% 0,84

85% 1,04

90% 1,28

95% 1,64

Valori della Normale standardizzata corrispondenti a diversi valori di potenza

statistica dello studio

Potenza dello studio e valori della Normale (Gaussiana) Potenza dello studio e valori della Normale (Gaussiana)

Ad valore della Potenza corrisponde un valore della Normale stan

Ad valore della Potenza corrisponde un valore della Normale standardizzata:dardizzata:

Ad una potenza del 90% corrisponde uno z critico pari a 1,28 Ad una potenza del 90% corrisponde uno z critico pari a 1,28

(8)

Quanti soggetti devono essere selezionati?

per il calcolo della numerosit

per il calcolo della numerositàà del campione del campione èè necessario considerare:necessario considerare:

 pp-value-value la probabilitàla probabilità di interpretare erroneamente come vero un di interpretare erroneamente come vero un risultato casuale (errore di I

risultato casuale (errore di I°° tipo) tipo)

 Potenza: la probabilitPotenza: la probabilitàà di identificare correttamente una differenza tra di identificare correttamente una differenza tra due gruppi in studio quando questa differenza esiste nelle popol

due gruppi in studio quando questa differenza esiste nelle popolazioni azioni da cui i campioni sono stati estratti (1

da cui i campioni sono stati estratti (1--errore di IIerrore di II°° tipo)tipo)

 EffettoEffetto: la differenza minima attesa tra i due gruppi (in termini di es: la differenza minima attesa tra i due gruppi (in termini di esiti in iti in studio) . E

studio) . E’’ una quantitàuna quantità soggettiva, basata sul giudizio clinico.soggettiva, basata sul giudizio clinico.

 Deviazione standardDeviazione standard ovvero variabilitovvero variabilitàà casuale del fenomeno in studio. casuale del fenomeno in studio.

Si considerano dati di letteratura, indagini precedenti ecc.

(9)

Quanti soggetti devono essere selezionati?

Il calcolo della numerosit

Il calcolo della numerositàà campionariacampionaria

DD²²

N=N=

4σ4σ²² (Z(Z_crit_crit + Z+ Z_pwr_pwr))²²

σσ²²= = èè la varianza ( il quadrato della deviazione standard) la varianza ( il quadrato della deviazione standard)

ZZ_cri_cri_t_t= = il valore della normale in corrispondenza del pil valore della normale in corrispondenza del p--value fissatovalue fissato

ZZ_pw_pw_r_r= = il valore della normale in corrispondenza della potenza fissatail valore della normale in corrispondenza della potenza fissata DD²²

N=N=

4σ4σ²² (Z(Z_crit_crit + Z+ Z_pwr_pwr))²²

DD²²= = èè il quadrato della differenza minima attesail quadrato della differenza minima attesa

(10)

p-value significatività zcrit value

0,01 99% 2,58

0,02 98% 2,33

0,05 95% 1,96

0,1 99% 1,64

Valori della Normale standardizzata

corrispondente ai diversi livelli di significatività

Potenza z^pwr value

80% 0,84

85% 1,04

90% 1,28

95% 1,64

Valori della Normale standardizzata corrispondenti a diversi valori di potenza

statistica dello studio

Il calcolo della numerositàà campionaria esempiocampionaria esempio

Calcolare la numerosit

Calcolare la numerositàà campionaria fissato un livello di significativitcampionaria fissato un livello di significativitàà del 5% e una del 5% e una potenza dell

potenza dell’’90%. La differenza attesa 90%. La differenza attesa èè 3 e la varianza 203 e la varianza 20

33²²

4 x 20 x (1,96 + 1,28) 4 x 20 x (1,96 + 1,28)²²

== 9393 Studio di confronto tra due gruppi

Studio di confronto tra due gruppi

=== 9393

= 9393 4 x 20 x (1,96 + 1,28)

4 x 20 x (1,96 + 1,28)²²

== 9393

==

33²²

4 x 20 x (1,96 + 1,28) 4 x 20 x (1,96 + 1,28)²²

== 9393

(11)

Studi descrittivi Studi descrittivi

 Nel caso di studi descrittivi in cui non interessa il confronto tra gruppi Nel caso di studi descrittivi in cui non interessa il confronto tra gruppi ad esempio negli studi di prevalenza, in generale negli studi in

ad esempio negli studi di prevalenza, in generale negli studi in cui si cui si voglia stimare una proporzione di un fenomeno, il calcolo della

voglia stimare una proporzione di un fenomeno, il calcolo della numerosit

numerositàà campionaria si basa sulla seguente formula:campionaria si basa sulla seguente formula:

Il calcolo della numerositàà campionariacampionaria per studi descrittivi

per studi descrittivi

p(1p(1--p)p) = = èè la varianza della proporzione p. Il valore di p deriva da studla varianza della proporzione p. Il valore di p deriva da studi i precedenti o dati di letteratura e nel caso non si conosca viene

precedenti o dati di letteratura e nel caso non si conosca viene posto pari a posto pari a 0,50,5

DD²² = è la precisione della stima che si desidera ottenere, ovvero l’ampiezza dell’intervallo di confidenza

DD²² 4p(14p(1-p) Z-p) Z_crit_crit²²

N =N =

(12)

Il calcolo della numerositàà campionariacampionaria per studi descrittivi esempio

per studi descrittivi esempio

LL’’obiettivo di uno studio sullobiettivo di uno studio sull’’alimentazione degli adolescenti, alimentazione degli adolescenti, èè di stimare il di stimare il loro consumo proteico medio giornaliero, misurato in grammi. Qua

loro consumo proteico medio giornaliero, misurato in grammi. Quanti nti adoloscenti

adoloscenti èè necessario reclutare nello studio, in modo da stimare il valorenecessario reclutare nello studio, in modo da stimare il valore medio entro un intervallo di confidenza di 10 grammi, ad un live

medio entro un intervallo di confidenza di 10 grammi, ad un livello di llo di significativit

significativitàà del 5% e sapendo che la varianza (ovvero la variabilitdel 5% e sapendo che la varianza (ovvero la variabilitàà intorno al intorno al valor medio), come risulta da precedenti studi

valor medio), come risulta da precedenti studi èè di 20 grammidi 20 grammi

p(1p(1--p)p) = 20= 20 DD²² = 10² ZZ_crit_crit²² =1,96=1,96

= = = 61,47= 61,47

Quindi per ottenere stime ad una significativit

Quindi per ottenere stime ad una significativitàà del 95% e intervallo di del 95% e intervallo di confidenza di ampiezza 10 grammi

confidenza di ampiezza 10 grammi

il campione deve essere composto da non meno di 62 adolescenti il campione deve essere composto da non meno di 62 adolescenti

1010²² 4x20x1,96 4x20x1,96²²