Il campione Il campione

(1)

a cura di Paolo Pandolfi a cura di Paolo Pandolfi

I metodi di campionamento ed accenno I metodi di campionamento ed accenno

alle dimensioni di uno studio alle dimensioni di uno studio

Il campione Il campione

Raramente in uno studio epidemiologico è possibile esaminare ogni singolo soggetto di una popolazione sia per difficoltà oggettive di indagine ma soprattutto per le limitate risorse disponibili.

La scelta quindi necessariamente è quella di individuare un campione che rappresenta “una parte del tutto”.

Scegliere un campione significa effettuare un

“campionamento”

Il campionamento Il campionamento

Il principale obiettivo di un campionamento è quello di raccogliere dati che consentiranno di generalizzare, con un certo grado di certezza, all’intera popolazione le conclusioni ottenute dal campione (INFERENZA)

Il campionamento Il campionamento

Per valutare la “bontà” di uno studio campionario è necessario tenere conto di vari fattori e principalmente di:

1) I criteri di scelta della popolazione in studio 2) Il metodo con cui si è selezionato il campione 3) Il periodo di osservazione

4) I metodi adottati per identificare i casi di malattia 5) Le tecniche di analisi

6) La precisione delle misure effettuate

Il campionamento Il campionamento

In qualsiasi modo il campione venga scelto i suoi caratteri non saranno mai identici a quelli della

POPOLAZIONE DI ORIGINE

La differenza fra il risultato ottenuto dal campione e la vera caratteristica della popolazione è detta ERRORE CAMPIONARIO

(può essere stimato)

Il campionamento Il campionamento

A questo punto, analizzando i dati provenienti da un campione, due sono le domande fondamentali da porsi:

a) Le conclusioni sono corrette per i soggetti che compongono il campione? (VALIDITA’ INTERNA) b) Se si, il campione rappresenta bene la popolazione

da cui è stato estratto? (VALIDITA’ ESTERNA)

(2)

Il campionamento

Il campionamento Il campionamento Il campionamento

VALIDITA’ INTERNA dipende da:

1) Corretta impostazione dello studio

2) Scelta di buone tecniche diagnostiche e loro corretto utilizzo

3) Buona elaborazione dei dai

VALIDITA’ ESTERNA dipende da Problemi di distorsione/bias

Il campionamento Il campionamento

Errori di campionamento possono essere ricondotti a:

A) Variazione casualeovvero deriva da un fattore ineliminabile (il caso); può essere stimata e quindi corretta

B) Selezione viziata ovvero si è scelta una porzione non rappresentativa della popolazione; avremo problemi a correggere questa situazione perché non stimabile

Metodi di campionamento Metodi di campionamento

Un buon campionamento offre a ciascun membro della popolazione la stessa probabilità di essere scelto. In questo senso un campionamento randomizzato o casuale offre il vantaggio di fornire un campione privo di errori sistematici.

Molti sono i metodi di campionamento. Di seguito ne descriveremo alcuni.

Metodi di campionamento Metodi di campionamento randomizzazione semplice randomizzazione semplice

E’ di facile applicazione quando si dispone di una popolazione gi à numerata e costituita da un numero di soggetti non elevato Le unità campionarie sono scelte a caso tra i degenti di un reparto ospedaliero con l’estrazione di numeri corrispondenti al numero di ogni letto.

Metodi di campionamento Metodi di campionamento randomizzazione sistematica randomizzazione sistematica

Le unità campionarie sono scelte ogni quattro letti di un reparto ospedaliero

Questo metodo è più pratico rispetto alla randomizzazione semplice ed assicura anche che le singole unità del campione siano distribuite uniformemente all’interno della popolazione. Bisogna però essere attenti che l’intervallo di campionamento prescelto non sia influenzato da qualche variabile esterna che agisce con la stessa ciclicità del campinamento

(3)

Metodi di campionamento Metodi di campionamento randomizzazione stratificata randomizzazione stratificata

Si applica nei casi in cui c’è il sospetto che un fattore presente nella popolazione influenzi il carattere in studio. La popolazio ne viene suddivisa in strati basati sul fattore ipotizzato. Quindi all’interno di ciascuno strato si sceglie un campione con il metodo della randomizzazione semplice o sistematica

Lo svantaggio è che lo stato di tutte le unità di campionamento deve essere noto prima di scegliere il campione

Metodi di campionamento Metodi di campionamento

a grappolo a grappolo

La popolazione viene suddivisa in gruppi (famiglie, comunità, ecc.) che diventano le unità su cui effettuare il

campionamento.

Rispetto alla randomizzazione semplice, sistematica o stratificata offre il vantaggio di facilitare molto il reclutamento dei soggetti (meno tempo e meno costi).

Tuttavia l’errore di campionamento può essere elevato rispetto agli altri metodi

Dimensioni di un campione Dimensioni di un campione

La risposta più semplice al problema di quanti soggetti selezionare è di scegliere il campione più grande possibile (si potranno avere risultati più precisi). E’ evidente che questa strada si scontra con un problema di risorse disponibili.

D’altronde, se ciò che ci interessa è essere precisi, sappiamo che la precisione di una stima si basa sull’ERRORE STANDARDe sull’INTERVALLO DI CONFIDENZA(ovvero capacità di cogliere il valore vero con un certo livello di probabilità)

Dimensioni di un campione Dimensioni di un campione

La grandezza di un campione va calcolata in funzione del parametro che si vuole stimare (una media, una

proporzione, un tasso, una differenza tra medie, ecc.) visto che ogni tipologia di parametro prevede una modalità relativamente diversa di calcolo delle due informazioni utili per dimensionare correttamente il campione stesso (errore massimo accettabile e Deviazione Standard).

Per dimensionare un campione si deve innanzittutto ipotizzare che i valori stimati campionari siano distribuiti in modo normale; inoltre si deve definire a priori un massimo errore di stima tollerabile.

Dimensioni di un campione per Dimensioni di un campione per

stima della media stima della media

Nel caso del parametro media la Deviazione Standard (DS) di una distribuzione media campionaria è formulata come

δ / n dove

δ è la deviazione standard delle osservazioni originali n la numerosità del campione

Errore standard

Dimensioni di un campione per Dimensioni di un campione per

stima della media stima della media

Se la distribuzione è normale il 95% delle medie campionarie derivate da ripetuti campioni cadrà nell’intervallo

μ ± 2 δ / n

Ovvero l’errore massimo probabile sarà due volte l’errore standard (vi ricordate il valore di z = 1,96 ad indicare probabilità al 95% di cogliere il valore vero all’interno di un intervallo) ovvero:

(4)

Dimensioni di un campione per Dimensioni di un campione per

stima della media stima della media

e = 2 δ / n

ovvero

e = 4 δ / n² ²

ovvero

n = 4 δ / e

2 2

Dimensioni di un campione per Dimensioni di un campione per

stima della media stima della media

Purtroppo la DS δ è sconosciuta; è per questo che va sostituita con una stima fornita dalla conoscenza di letteratura o dallo studio pilota.

Esempio

Si voglia stimare in una comunità il peso medio alla nascita dei neonati; per calcolare la numerosità appropriata del campione è necessario specificare due quantità

e = errore massimo verosimile (tollerabile) δ = deviazione standard

Dimensioni di un campione per Dimensioni di un campione per

stima della media stima della media

Da studi precedenti so che la DS è di 500 grammi e l’errore massimo che posso tollerare lo stabilisco a 50 grammi (10%

valore arbritrario)

La dimensione del campione a questo punto sarà n = 4 δ / e

2 2

ovvero nel nostro caso

4 x500 / 50 pari a 400 unità

2 2

Dimensioni di un campione per Dimensioni di un campione per

stima della media stima della media

In definitiva dato δ ed n posso calcolare e

viceversa

dato δ ed e posso calcolare n

Lo stesso procedimento utilizzando formule leggermente diverse può essere adottato per dimensionare campioni per una proporzione, differenza di medie, tassi, ecc.

Dimensioni di un campione per stima di una Dimensioni di un campione per stima di una

proporzione proporzione

In questo caso la DS (deviazione standard) è data da

 (1- )

dove  è la proporzione osservata mentre l’E.S. (errore standard) è uguale a

 (1- ) n

e = 2  (1- ) n

n = 4  (1- ) e²

Dimensioni di un campione per Dimensioni di un campione per

stima di un tasso (

in anni personain anni persona

) )

In questo caso si parlerà di tasso (m) e numero di eventi osservati (d) piuttosto che di n.

L’ES(m) sarà pari a m d

e = 2 ES(m) ovvero e= 2m d ovvero d= 4 m e

Visto che d= m*n dove n= anni persona allora

n = 4m e

2 2

2

(5)

Dimensioni di un campione per Dimensioni di un campione per stima della differenza tra due medie stima della differenza tra due medie

Se la vera differenza tra le medie di due popolazioni è δ ovvero δ = μ₁ - μ₂

la differenza tra due campioni è definibile come d L’errore standard di d sarà ES(d):

ES(d) = (δ₁²n) + (δ₂²n)

Se si può assumere che le varianze tra le due popolazione sono uguali allora:

ES(d) = δ (2 n)

Da qui si potrà calcolare il massimo errore verosimilee

e = 2δ (2 n)

n = 8 δ² e²

Allora potrò calcolare il massimo errore verosimile detto e così:

E quindi:

Dimensioni di un campione per Dimensioni di un campione per stima della differenza tra due medie stima della differenza tra due medie

n = 8 δ²e² Media:

Riassunto delle modalit

Riassunto delle modalità à di stima delle di stima delle dimensioni di un campione dimensioni di un campione

Proporzione/prevalenza:

Tasso anni persona:

Differenza tra medie:

n = 4m e n = 4  (1- ) e²

n = 4 δ / e² ²