• Non ci sono risultati.

CAPITOLO 2: LA METODOLOGIA DELLA RICERCA SOCIALE DI TIPO QUANTITATIVO

2.5 La popolazione ed il campione

Una volta costruito il questionario ed aver deciso le modalità di somministrazione , si devono individuare i soggetti che possono fornirci le informazioni da raccogliere. Occorre definire chi é la popolazione sulla quale indagare. Possimao definire come ‘’ popolazione di una ricerca l’insieme dei casi che teoricamente costituiscono l’oggetto di indagine e che hanno in comune almeno una caratteristica osservabile ; essa é l’insieme degli esemplari dell’unità scelta esistenti entro l’ambito di una ricerca34’’. La popolazione di riferimento dipende totalmente dagli interrogativi di ricerca che sono alla base dell’indagine.Quest’ultima viene scelta in base alle proprietà che rispondono in una ricerca. La popolazione è un contenitore delle informazioni. Definire una popolazione significa individuare delle caratteristiche interessanti per la ricerca e che questa debba averle. La

34

58

popolazione deve esser il più precisa ed analitica possibile. La popolazione si può distinguere in popolazione teorica e popolazione accessibile.

La popolazione teorica comprende tutte le unità che costituiscono la popolazione oggetto di indagine. La popolazione accessibile è costutuita da tutte da tutte le unità appartenenti alla popolazione teorica potenzialmente raggiungibili e viene indicata con il simbolo N. Quando la popolazione teorica è accessibile significa che le due popolazioni coincidono e la rilevazione delle informazioni può essere esaustiva (enumerazione completa). Quando un’indagine è condotta su tutta la popolazione,invece,viene chiamata censimento. Non sempre,però, è possibile raggiungere la popolazione di riferimento nella sua totalità, per questo motivo si deve individuare un campione. Il ‘’campione è una parte della popolazione che presenta tutte le caratteristiche della popolazione originaria, che sia cioé rappresentativo di tutta la popolazione35’’. Per selezionare un campione da una popolazione occorre effettuare un campionamento. Un ‘’campionamento è la procedura attraverso la quale da una popolazione si estrae un numero finito di casi (campione) scelti con criteri tali da consentire la generalizzazione (inferenza) dei risultati ottenuti studiando il campione all’intera popolazione36‘’. Dall’analisi delle caratteristiche di un campione è possibile risalire alle caratteristiche dell’intera popolazione indagata. Per cui, a partire dai risultati ottenuti su un campione è possibile effettuare una stima delle caratteristiche della popolazione che sono sempre incognite. Le caratteristiche della popolazione vengono chiamate parametri. Stimare un parametro significa stabilire il valore o un range di valori statistici che una determinata caratteristica assume in una popolazione. Un parametro è il valore esatto di una statistica calcolato su tutti i casi interessati. Una stima è un valore approssimato calcolato su un campione estratto da quell’insieme di casi, che tenta di stimare il parametro. Se la rilevazione è esaustiva ( nel caso di un censimento) ovvimanete i valori coincido. Nel caso di un’indagine campionaria, i valori della popolazione e le stime del campione coincidono con una certa probabilità. La stima implica un errore dovuto all’impossibilità di determinare con esattezza il parametro. Possiamo però stabilire su un campione , il campo di di variazione che indica un certo livello di ‘’affidabilità’’. Questo livello di affidabilità viene detto ‘’intervallo di fiducia o di confidenza’’ entro il quale si colloca il valore della statistica della popolazione. L’intervallo di confidenza viene stabilito dal ricercatore e rappresenta la misura della bontà della stima. Se l’intervallo di fiducia è molto ampio il ricercatore non sa con esattezza dove si colloca il vero valore. Se al contrario l’intervallo di fiducia è minimo significa che il valore individuato nel 35Cfr. Ivi, pag.208.

59

campione è abbastanza vicino al campione della popolazione (che dev’essere di circa il 95%). La differenza tra i risultati ottenuti nel campione (stima del parametro) e il vero valore assunto nella popolazione da una caratteristica (valore del parametro nella popolazione) dipende dall’errore di campionamento o errore campionario. L’errore di campionamento o errore campionario è definito come l’errore casuale insito nelle procedure di formazione del campione. Proprio perché la reale caratteristica della popolazione è ignota, l’errore di campionamento non può essere determinato con esattezza. Un modo per limitare l’errore di campionamento è quello di selezionare i casi in modo casuale e il campione che ne deriva è probabilistico. Un altro modo per ridurre l’errore di campionamento è quello di ricorrere a dei campioni relativamente alti. L’ampiezza del campione oltre ad essere inversamente proporzionale agli errori di rilevazione, dipende anche dalle stime che si ottengono in sede di analisi e dal livello di fiducia con cui vengono determinate.

Un campionamento può essere probabilistico o non probabilistico.

Nel caso di un campionamento probabilistico,possiamo dire che ‘’un campionamento si dice probabilistico quando , per ciascun caso appartenente alla popolazione di riferimento oggetto di indagine, la probabilità di essere estratto é nota ed é diversa da zero37 ‘’. I campioni probabilistici sono entro certi limiti rappresentativi della popolazione. Tant’è che le informazioni rilevate su un campione sono estensibili a tutta la popolazione, per cui è possibile fare inferenza sulla popolazione a partire dai risultati osservati sul campione. Inoltre, per poter creare dei campioni probabilistici occorre disporre della lista della popolazione, cioé dell’elenco completo dei casi che rientrano nella popolazione di riferimento. La selezione dei casi avviene utilizzando una tavola dei numeri casuali o un software specifico per generare numeri casuali. Fanno parte del campionamento probabilistico: il campionamento casuale semplice, il campionamento sistematico, il campionamento stratificato random, il campionamento a grappoli , il campionamento a stadi e il campionamento per area.

a) Nel campionamento casuale semplice ciascun caso appartenente alla popolazione di riferimento oggetto di indagine ha la stessa probabilità di essere estratto e di essere incluso nel campione. La popolazione viene indicata con N, mentre il campione viene indicato con n, per cui la probabilità che ogni individuo della popolazione ha di essere scelto nella prima estrazione (rapporto di probabilità ) é di 1/N. In questa procedura i 37

60

casi vengono estratti a sorteggio. Ad ogni unità N viene associato un numero. Si estraggono tramite sorteggio (es.da un’urna o dalla tavola dei numeri) gli n numeri tra gli N totali. Esistono due tipi di campionamento semplice : quello con ripetizione e quello senza ripetizione. Nel caso della ripetizione ogni elemento che viene estratto viene reinserito nuovamente nell’urna o nella tavola dei numeri, per cui ciascun caso ha sempre probabilità 1/N di essere estratto. Nel caso senza ripetizione , una volta selezionato il caso, questo non viene più reinserito nell’urna o nell’elenco per cui hanno tutti la stessa probabilità di essere estratti;

b) il campionamento sistematico è una variante del casuale semplice. Le n unità che costituiranno il campione sono scelte dalla popolazione a intervalli regolari. Il campione viene formato selezionando da dalla lista un caso ogni k ( passo di campionamento) uguale al rapporto tra k=N/n ;

c) il campionamento stratificato random prevede che prima di effettuare l’estrazione del campione , la popolazione deve essere suddivisa in strati in base ad uno o più caratteristiche ritenute rilevanti per la ricerca. Dopodiché all’interno di ciascuno strato si sceglie un campione con il metodo della randomizzazione semplice o sistematica;

d) il campionamento a grappoli prevede che vengano scelti solo dei sottogruppi di una popolazione;

e) il campionamento a stadi viene utilizzato quando nel campione finale vengono incluse solo alcune unità dei grappoli estratti. Si suddivide la popolazione in gruppi gerarchicamente ordinati ( stadi) poi vengono estratti a imbuto;

f) il campionamento per aree è una forma particolare di campionamento a stadi in cui lo stadio è rappresentato da un’area geografica.

Il campione non probabilistico viene utilizzato quando non sempre bisogna a ricorrere a delle procedure di campionamento probabilistico perchè magari la lista della popolazione non é disponibile, le informazioni sulla popolazione sono limitate o quando l’indagine non ha come obiettivo quello di fare inferenza sulla popolazione ma solo di conoscere quel fenomeno. ‘’Un campionamento si dice non probabilistico quando per ciascun caso , appartenente alla popolazione di riferimento oggetto di indagine , la probabilità di essere incluso nel campione non é nota38’’. Fanno parte del campionamento non probabilistico :

38

61

a) il campionamento accidentale detto anche a caso o a casaccio o di convenienza ed è l’opposto del campionamento casuale semplice. Il ricercatore sceglie a caso le prime persone che incontra senza alcun criterio stabilito precedentemente. Oppure, nel caso dei campioni autoselezionati, i casi si offrono spontaneamente di partecipare all’indagine;

b) il campionamento a scelta ragionata prevede che i casi siano scelti dal ricercatore sulla base di criteri soggettivi in base a quelli che il ricercatore ritiene siano adeguati al fenomeno studiato;

c) il campionamento a valanga chiamato anche putativo o a catena o a palla di neve viene utilizzato quando la popolazione é rara ed é difficile da contattare. Si interroga un primo gruppo di soggetti poi si chiede loro di indicare altri soggetti con le stesse caratteristiche che formerà il secondo campione, e così via ;

d) nel campionamento per quote la popolazione viene divisa in un numero di strati sulla base di una proprietà (variabile) rilevante ai fini della ricerca. Sucecssivamente per per ciascuno strato vengono definite le quote , ossia il numero di casi da intervistare per ciascuna quota. I casi vengono scelti liberamente dall’intervistatore sulla base delle caratteristiche dello strato, il suo unico obbligo è quello di rispettare la numerosità delle quote.