• Non ci sono risultati.

3 METODO

3.3 Strategia di raccolta dati

3.3.1 Definizione della popolazione obiettivo

“La popolazione obiettivo è la popolazione a cui vogliamo generalizzare i risultati che emergono dal campione”. (Fabrizi, N. Salvati - Dispense di Indagini Campionarie, 2016)

Andando ad analizzare la definizione appena enunciata vediamo come

emergano gli elementi caratteristici: “popolazione e campione”. La popolazione è infatti la completa lista di individui che sono oggetto della nostra indagine, mentre il campione è un sottoinsieme di tale categoria che riesca ad essere, nella sua incompletezza, rappresentativo della realtà. La necessità di dover estrarre un sotto-insieme dalla popolazione data nasce dalla complessità nel riuscire a sottoporre ad interviste la totale dimensione della stessa, ovviando a tale problematica concentrandosi su poche decine o centinaia di elementi che consentono di ottenere dati molto più accurati.

Nel caso specifico della nostra indagine la popolazione obiettivo è quella degli agenti di commercio residenti nella regione Toscana e come accennato in precedenza non è stato possibile reperire una lista che contenesse i contatti di tali individui, per cui il primo step è stato quello di costruirne una che facesse al caso nostro. Dopo varie ricerche siamo riusciti a trovare online, sul sito internet

Virgilio sotto le categorie “Toscana” e “Agenti e Rappresentanti di Commercio”

i nominativi, indirizzi e numero di telefono dei soggetti protagonisti della nostra ricerca consentendo, dopo un accurato lavoro di data entry, di ottenere un frame della popolazione obiettivo composta dalle seguenti variabili:

33

• Nome, che poteva essere o il nome del soggetto detentore della rispettiva partita IVA, o quello della società che ha costituito;

• Comune di residenza, da cui è stato possibile estrapolare la provincia; • Numero di telefono.

Figura 3.1 - Screenshot della categoria Agenti di Commercio in Toscana su Virgilio.it (link

https://toscana.virgilio.it/cat/AGENTI_E_RAPPRESENTANTI_DI_COMMERCIO.html#)

Il numero dei nominativi raccolti e che vanno a comporre il frame è di 3590 individui che differisce dal numero mostrato dalla figura 3.1, ma purtroppo abbiamo dovuto fare i conti con la presenza di numerose ripetizioni di alcuni nominativi all’interno della lista. Analizzando il numero di individui che va a comporre la nostra lista possiamo dire che è vero, non rappresenterà la totalità degli agenti di commercio presenti in Toscana (il cui numero esatto non risulta essere reperibile), ma comunque ci permette di condurre una ricerca accurata, assumendo che una buona fetta degli agenti abbia interesse nel risultare rintracciabile online e quindi essere iscritto ad un motore di ricerca della propria categoria come Virgilio, che peraltro risulta essere l’unico ad offrire un database di questo tipo.

Una volta ottenuto il frame sul quale basare l’indagine, il secondo step è stato quello di stabilire una strategia di estrazione di un campione di elementi da

34

questa popolazione. Considerate le variabili di cui eravamo a conoscenza (Nome, Indirizzo, Numero di Telefono), ci è sembrato opportuno al fine di ottenere un campione che fosse il più rappresentativo possibile della popolazione, effettuare un campionamento casuale stratificato, allocando il campione in modo proporzionale alla dimensione degli strati. La stratificazione, come spiegato precedentemente è infatti una metodologia che permette di utilizzare informazioni a disposizione di tipo ausiliarie per migliorare il disegno di campionamento e sulla base di esse costruire la dimensione di ciascuno strato. Nel nostro caso le informazioni ausiliarie che potevamo utilizzare erano il comune o la provincia di residenza in quanto i numeri di telefono anche se rappresentavano una variabile di cui eravamo a disposizione non potevano essere considerate come base per costruire un singolo strato in quanto ognuna diversa dall’altra. Quindi dovendo scegliere tra comune o provincia abbiamo preferito selezionare ogni strato sulla base della variabile “Provincia” anziché su quella dei comuni per via del numero assai ingente di quest’ultimi, ma anche per via della grande discrepanza esistente nel numero di agenti residenti tra i vari comuni12. La composizione di ciascuno strato è stato composto invece con

allocazione di tipo proporzionale andando a ricomporre la stessa percentuale presente all’interno della popolazione di ogni provincia. Quindi, nello specifico, il frame comprendeva tutti gli agenti e rappresentanti di commercio registrati sul database Virgilio, ovvero tutti coloro appartenenti a tale categoria residenti nelle varie province di: Firenze, Arezzo, Grosseto, Livorno, Pisa, Pistoia, Lucca, Prato, Siena e Massa e di conseguenza il nostro campione avrebbe dovuto essere formato da 10 strati, dove all’interno di ciascuno di essi, avremmo ricostituito la stessa proporzione che esisteva all’interno della popolazione con una selezione casuale. Ad esempio, il numero di elementi residenti nella provincia di Firenze era di 1354 su un totale di 3590, ovvero il 37,7% circa della popolazione, per cui, lo strato “Provincia di Firenze” avrebbe dovuto rappresentare la stessa percentuale all’interno del campione, estendendo tale proprietà a tutte le

12 Ad esempio la differenza esistente tra il numero degli agenti di commercio residenti nel comune di Firenze e in qualunque altro comune di 4000 abitanti.

35

province. Per ottenere un risultato simile dovevamo però stabilire il numero esatto di individui che effettivamente avrebbero fatto parte del campione e ci è sembrato giusto scegliere una cifra pari a 200 unità13 pari al 5,57% della

popolazione. In sintesi quindi:

• Popolazione totale 3590 unità; • Campione 200 unità;

• Campionamento casuale stratificato con allocazione proporzionale;

• Strati costruiti sulla base della variabile ausiliaria “provincia di residenza”. Una volta elaborato a priori quello che avrebbe dovuto essere realizzato non restava che passare alla parte pratica mettendo in atto ciò che ci eravamo prefissati.

Per svolgere le operazioni fondamentali ci siamo serviti di un software specifico di nome R, adatto alla gestione e analisi dei dati e alla produzione di grafici basato sul linguaggio S. Il passaggio conseguente è stato quindi quello di importare il nostro dataframe in formato Excel all’interno di R per cominciare a svolgere le operazioni necessarie all’estrazione del campione come esposto nell’allegato 3. Una volta ottenuto il nostro campione ne abbiamo estratto un secondo che sarebbe servito a sostituire i nominativi in caso di mancata risposta, in modo da rispettare la casualità del campione arrivando comunque al numero preventivato di interviste.

Documenti correlati