• Non ci sono risultati.

rassegna letteraria sul caso specifico del vaccino HP

Capitolo 5: Disegno di campionamento

5.4 Il Campionamento a Grappol

5.4.1 Le motivazioni alla base della scelta

Definita la popolazione obiettivo era indispensabile scegliere opportunamente un disegno di campionamento per estrarre il nostro campione probabilistico. Teoricamente sarebbe possibile eseguire un censimento, poiché la popolazione obiettivo, già perfettamente caratterizzata, è finita nel numero. In pratica però è utopistico pensare di raggiungere e soprattutto ottenere risposta da parte di ogni singolo componente della popolazione target, ci aspettiamo al contrario un elevato tasso di non risposta. Senza considerare i costi in termini economici e di tempo.

Lo studio di un campione probabilistico opportunamente scelto, permette di estendere i risultati all’intera popolazione target di riferimento, sulla base dell’errore campionario stimato. In altri termini, il principale obiettivo di un’indagine campionaria è quello di raccogliere dati che consentiranno di generalizzare all'intera popolazione i risultati ottenuti dal campione. Questo processo di generalizzazione è detto inferenza. In verità dallo studio del campione potremo solo stimare i caratteri della popolazione di nostro interesse, non determinarli con esattezza, consapevoli dell’errore che commettiamo, direttamente correlato al numero di osservazioni del fenomeno oggetto di studio.

Si noti che la popolazione oggetto di indagine si compone di unità (studentesse) raggruppate in sottopopolazioni (classi e quindi scuole). Inoltre come discusso nella sezione5.1, non siamo in possesso della lista completa delle singole unità componenti la popolazione target di riferimento, ma siamo in grado di individuare degli aggregati delle suddette unità. La lista di tutte le scuole medie presenti nell’area di nostro interesse, cioè nella provincia di Pisa, sono di dominio pubblico e dunque consultabili. Per tali motivi lo schema di campionamento che dal punto di vista operativo meglio si adatta alle nostre esigenze è il campionamento a grappoli. In questo disegno campionario non si estraggono singoli individui ma unità complesse, definiti grappoli o cluster. Tutti gli individui appartenenti alle unità estratte saranno oggetto di rilevazione. Il campionamento a grappoli sfrutta l’esistenza di raggruppamenti naturali già presenti nella popolazione, come per esempio le scuole. Ogni scuola può essere pensata come una popolazione in miniatura che ne rispetta tutte le caratteristiche fondamentali, dunque paragonabile alla popolazione totale. L’elenco dei grappoli che nel nostro caso si identificano con le scuole, forma la lista dalla quale viene estratto il campione. È importante precisare che sebbene gli stessi aggregati di popolazione possano essere utilizzati sia come strati che come grappoli, gli scopi che si perseguitano con la stratificazione sono profondamente diversi da

90 quelli che si perseguono con la stadificazione. Nel campionamento stratificato ogni strato è rappresentato nel campione poiché vi si estraggono casualmente individui da ciascun gruppo. Gli strati devono quindi essere il più possibile omogenei internamente e normalmente eterogenei tra loro. Nel campionamento a grappoli si verifica esattamente il contrario. Solo alcuni dei grappoli verranno selezionati, i quali dovranno rappresentare anche quelli esclusi dalla selezione. Nell’ipotesi estrema che tutte le scuole siano uguali, ognuna costituirebbe una copia ridotta della popolazione, dunque sarebbe sufficiente indagare su una sola di queste per ottenere le stesse informazioni derivanti da una ricerca completa. L’ideale sarebbe quindi che tutti i grappoli fossero più eterogenei possibile internamente e omogenei tra loro. Senza dimenticare che mentre i cluster sono raggruppamenti naturali, gli strati vengono appositamente creati dai ricercatori, proprio per riuscire a coprire col campione estratto individui diversi per specifiche caratteristiche di interesse.

L’omogeneità nei cluster produce normalmente una perdita di precisione rispetto alla selezione casuale semplice, come vedremo nella sezione5.5.

[68-66] (A. Giommi) (V. Barnett 2002)

Questo disegno campionario dunque è efficace soprattutto nel caso in cui sussista una sufficientemente elevata omogeneità tra i vari cluster ed eterogeneità al loro interno. Nello specifico possiamo immaginare una certa omogeneità nelle caratteristiche delle ragazze frequentanti le varie scuole superiori di Pisa e provincia, ed una altrettanta eterogeneità all’interno di ciascuna, paragonabile a quanto si verifica nella collettività delle tredicenni e quattordicenni. A maggior ragione ci aspettiamo tale eterogeneità includendo nella ricerca istituti pubblici e privati, e trattandosi di classi la cui frequenza è obbligatoria per legge, scongiurando quindi il rischio di mancato raggiungimento di genitori appartenenti per esempio a classi sociali più basse e fasce reddito inferiori o con altre problematiche in ambito sociale.

Aspettandoci dunque una stadificazione naturale le scuole pisane costituiranno i nostri grappoli. A fronte di una perdita di precisione rispetto ad un campionamento semplice o a maggior ragione stratificato (guardare sezione 5.4.3), otteniamo vantaggi di riduzione in termini di costi, convenienza dal punto di vista amministrativo e facilitazione del processo di raccolta dei dati, principalmente per la minore dispersione delle unità del campione che facilita l’organizzazione e l’esecuzione della rilevazione (specificato nella sezione precedente). La riduzione dei costi si traduce nella possibilità di selezionare campioni di dimensione assai superiore di quella che avrebbe avuto per la stessa indagine un campione

91 casuale semplice. Dunque le dimensioni dei campioni a grappoli sono normalmente tali da compensare la perdita di precisione introdotta dal metodo di selezione. [68]

Come già segnalato nella sezione 5.1 nella citata survey olandese (Gefenaite et al 2012), sono stati campionati due diversi gruppi di rispondenti, i genitori che hanno aderito alla vaccinazione e quelli che all’opposto hanno rifiutato o posticipato la decisione. In questo caso quindi il disegno campionario è stato di tipo stratificato, la cui variabile di stratificazione era proprio la decisione riguardo la vaccinazione delle figlie contro il virus HPV.

Per la nostra ricerca di campo non opereremo tale distinzione, rivolgendosi indifferentemente a tutte le alunne delle scuole pisane opportunamente campionate. L’aumento della precisione sui risultati ottenuti operando la stratificazione del campione di riferimento, a nostro avviso non è tale da superare le perdite in termini di tempo, oltre alla difficoltà di reperire informazioni sensibili, quali la scelta vaccinale. Come dimostrato dalla citata ricerca olandese (Gefenaite et al 2012), infatti la forte eterogeneità delle percentuali di non risposta nei due strati pre-definiti, non ha consentito di avvicinare il target pianificato di numerosità campionaria nei due strati. In tale indagine infatti risposero il 31% dei vaccinati e solo il 16% dei non vaccinati, annullando evidentemente gli sforzi impiegati con la stratificazione.

La nostra scelta si è orientata verso un campionamento meno preciso ma più efficace, che meglio si adattasse al contesto di riferimento.