• Non ci sono risultati.

177 Unicredit-Accenture (2011), Destinazione Cina

4.4 Periodo di svolgimento

L’indagine ha avuto due importanti momenti:

1) Febbraio 2013-Maggio 2013: elaborazione del piano di campionamento, stesura del questionario in lingua inglese, pre-testing e successiva distribuzione tra il campione selezionato. 2) Settembre 2013- Dicembre 2013: elaborazione dei risultati e stesura del report finale.

4.5 Il campionamento

Definiamo adesso la popolazione oggetto di studio (o popolazione obiettivo), vale a dire quella oggetto della rilevazione.

Tale popolazione coincide con la comunità studentesca della Nanjing Audit University; questa comprende 17.724 (N) studenti di età compresa tra i 18-24 anni.

A questo punto le strade da poter intraprendere erano due: optare per un’indagine censuaria o svolgere un’indagine campionaria; la prima se da una parte avrebbe coinvolto l'intera popolazione e perciò sarebbe risultata più affidabile riguardo al parametro oggetto d'indagine, dall’altra avrebbe richiesto maggiori costi e tempi più lunghi, che non erano conciliabili con quelli previsti per la compilazione di una tesi di laurea magistrale.

Quindi mentre l'indagine censuaria fornisce il valore vero dei parametri di interesse (proporzioni, percentuali, medie, totali,...) quella campionaria restituisce una sua stima al quale è associato un certo grado di fiducia (ovvero un'incertezza) quantificabile quando la formazione del campione risponde a determinati criteri di tipo probabilistico.

Il campionamento si usa quando si vuole conoscere uno o più parametri di una popolazione, senza doverne analizzare ogni elemento. Naturalmente in questo caso si avrà un contenimento in termini monetari, di tempo e di qualità.

L’indagine prescelta è stata dunque di tipo campionario e ha previsto l’estrazione di un sottoinsieme di n unità (n ≤ N) della popolazione.

Il campionamento scelto per l’indagine svolta è stato di tipo probabilistico, sono perciò ricorse le seguenti condizioni:

• è stato possibile definire l’insieme S, di tutti i campioni distinti estraibili dalla popolazione;

• a ciascun membro, s (campione), di tale insieme è assegnabile a priori una probabilità di selezione, indicata con p(s);

• a ciascuna unità della popolazione è associata una probabilità strettamente positiva di selezione;

• il campione è selezionato mediante un “meccanismo” casuale tramite il quale è possibile associare ad ogni campione s una probabilità esattamente pari a p(s);

• stabilito un procedimento di stima vi è una corrispondenza univoca tra campione estratto e valore della stima che da esso si ricava.

Il nostro campione probabilistico è stato formato ricorrendo ad un meccanismo di selezione casuale.

Definita la popolazione obiettivo, è stato necessario verificare la disponibilità di una base di campionamento (frame) che le corrisponda perfettamente. In altri termini occorreva ricercare e disporre di una lista completa delle sue unità. Per lista, si intende un insieme ordinato di contrassegni (labels) delle unità della popolazione, registrati su un supporto che ne consenta la consultazione. La lista avrebbe rappresentato la popolazione di selezione, quindi l’insieme dei nominativi dei soggetti residenti nel campus universitario di Pukou, distretto periferico della città di Nanjing e sede della Nanjing Audit University.

Oltre alla popolazione obiettivo e alla popolazione di selezione è stato necessario parlare anche di popolazione di indagine. Nella maggior parte dei casi, una volta selezionato il campione, accadrà normalmente di non poter osservare tutte le unità per impossibilità di contattarle o per un loro rifiuto di partecipazione all’indagine. Il fenomeno della mancata osservazione di un’unità che fa parte della popolazione di selezione prende il nome di non risposta o mancata risposta.

L’indagine che è stata svolta gode dell’assenza del fenomeno della non risposta; grazie all’ausilio di una studentessa cinese è stato infatti possibile intervistare l’intero campione di studenti, anche quelli che hanno presentato delle titubanze iniziali.

La selezione del campione e la stima dei parametri della popolazione hanno rappresentato senz’altro i due momenti di maggiore interesse teorico dell’indagine campionaria.

Questa a sua volta può essere vista come un insieme di fasi interrelate che nel loro complesso vengono identificate con il termine disegno di indagine (survey design) o piano d’indagine (survey plan). Le fasi relative alla selezione del campione e alla stima dei parametri della popolazione costituiscono, in un’accezione ampia, il così detto piano o disegno di campionamento.

4.5.1 Individuazione di aggregati di unità per un’eventuale selezione a più stadi

La ricerca del frame riconducibile al campus sede dell’indagine è stata una fase nella quale si sono incontrate non poche difficoltà.

Infatti non mi è stato possibile consultare il frame contenente tutte le unità statistiche di mio interesse, quindi gli studenti iscritti presso l’università sede della ricerca.

È stato pertanto necessario, come succede molto spesso anche nella realtà, raggruppare le unità di studio in sottopopolazioni di varia natura; questi raggruppamenti possono essere utilizzati come unità di selezione e in questo caso denominati grappoli. L’elenco dei grappoli ha rappresentato la lista dalla quale è stato estratto il campione. Nel nostro caso specifico, nel campione sono state incluse solo alcune unità, selezionate da ciascuno dei grappoli estratti, il metodo è definito campionamento a due stadi.

Nella nostra popolazione studentesca è stato possibile riscontrare delle aggregazioni naturali dovute alla presenza all’interno del campus, di dormitori adibiti ad ospitare l’intero ammontare degli studenti iscritti all’Università.

I dormitori presenti all’interno del campus sono 4 e hanno i seguenti nomi e dimensioni; • Cheng Yuan: 2.963

• Ze Yuan: 5.644 • Run Yuan:5664 • Qin Yuan: 3398

Solo alcuni di questi grappoli sono stati selezionati e questi hanno il compito di rappresentare anche quelli esclusi dalla selezione. L’ideale sarebbe che tutti i grappoli fossero più eterogenei possibile al loro interno e, conseguentemente, più simili possibile tra loro in modo da minimizzare la variabilità esterna tra i grappoli e massimizzare quella interna tra le unità elementari.

Abbiamo utilizzato ad ogni stadio un campionamento casuale semplice; il disegno è stato impostato in modo che fosse autoponderante , quindi la probabilità di inclusione nel campione di ogni individuo doveva essere uguale alla frazione complessiva di campionamento cioè pari a: f= n/N

f=450/17.724= 1/39,4

Al primo stadio la frazione di campionamento è 2/4=1/2.

In un disegno a due stadi la probabilità che l’unità b del grappolo a entri nel campione è data da: P(αβ)=P(α)P(β/α)

nella quale:

• P(αβ) è la frazione di campionamento complessiva

• P(α) è la probabilità di selezione del cluster a (frazione campionamento I stadio) • P(β|α) è la probabilità che l'unità β del grappolo α sia estratta al secondo stadio dopo

che al primo stadio è stato estratto il grappolo α (frazione campionamento II stadio). Per il nostro caso specifico ricaviamo che la frazione di campionamento al II stadio è data da:

P(β/α)= P(αβ)/ P(α) cioè P(β/α)=(1/39,4)/(1/2)=1/19,7. Ricordiamo che il campione deve soddisfare tre condizioni:

1. Deve essere autoponderante

2. Deve comportare l’estrazione di tre comuni 3. Deve avere una dimensione di 450 unità.

La prima e la terza condizione sono soddisfatte se la frazione di campionamento complessiva, e quindi P(αβ), è pari a 1/39,4.

La seconda e la terza, se vengono estratte 225 unità da ognuno dei due grappoli, qualunque sia la loro dimensione.

Cio implica che al secondo stadio la probabilità di entrare nel campione sia: P(β/α)=225/ Bα.

Sostituiamolo ora in: P(αβ)=P(α)P(β/α)

Questo risultato esprime la necessità di selezionare le UPS, cioè i dormitori, con probabilità proporzionale alla loro dimensione, ovviamente in termini di unità. Questo tipo di selezione è etichettato dalla sigla PPS dalle iniziali inglesi Probability Proportional to Size.

In generale, la probabilità di inclusione dell'unità β del grappolo α, quando a UPS sono selezionate con un campionamento PPS e b USS sono estratte con un campionamento casuale semplice da ciascuna UPS estratta, è data da:

La selezione di tipo PPS può essere realizzata attraverso i seguenti passi: • Si calcola la distribuzione cumulata delle dimensioni delle UPS:

• Si associano a ciascuna UPS tanti numeri quanti ne indica la sua dimensione. Quindi a Cheng Yuan vengono assegnati i numeri che vanno da 1 a 2.963, a Run Yuan i numeri che vanno da 2.964 a 8.627, a Ze Yuan i numeri che vanno da 8.628 a 14.326, a Qin Yuan da 14.327 a 17.724.

• Si seleziona un numero casuale compreso tra 1 e 17.724, e si estrae l'unità cui è stato associato il numero selezionato. Tramite un generatore casuale di numeri abbiamo estratto 2 numeri: 1.875 e 12.593. Ne è derivata l’estrazione di Cheng Yuan e Run Yuan. Con questo metodo, ogni UPS ha avuto una probabilità di selezione proporzionale alla propria dimensione.

Successivamente sono state estratte le Unità di secondo stadio (USS); i dati fornitici dall’università comprendevano oltre che il numero totale di studenti residenti in ciascun dormitorio anche la divisione per sesso degli stessi.

Questa suddivisione ha permesso di calcolare la percentuale di uomini e donne sull’intero ammontare della popolazione studentesca:

Dormitori Cheng Yuan Run Yuan Ze Yuan Qin Yuan

2.963 5.644+2963 5699+5.664+2963 3398+5699+5.664+2963

La percentuale di donne presenti all’interno del campus era notevolmente superiore alla percentuale di uomini, indi per cui è stato deciso di mantenere questa stessa percentuale anche nel campione estratto; dei 450 studenti da intervistare, 306 sarebbero state donne e 144 uomini. Di seguito è riportata la tabella con i valori di uomini e donne della popolazione per ciascuno dei due grappoli, e i conseguenti valori degli stessi nel campione:

POPOLAZIONE CAMPIONE

Tot. donne Cheng yuan Ze yuan Tot. donne Cheng yuan Ze yuan

6324 1.420 4.904 306 69 237

100% 22,45% 77,55% 100% 22,45% 77,55%

Totale uomini Cheng yuan Ze yuan Totale uomini Cheng yuan Ze yuan

2.338 1.543 795 144 95 49

100% 66% 34% 100% 66% 34%

L’estrazione dei soggetti è stata effettuata tramite un’estrazione casuale di numeri corrispondenti ai codici di identificazione degli studenti (numeri di matricola) effettuata tramite il supporto del software Excel.