Capitolo 3 Analisi dei risultati
3.1 Introduzione
Condurre il questionario online ha permesso di sfruttare i numerosi vantaggi che esso presenta, tra cui, un veloce rientro dei dati ed un inserimento automatico delle risposte in un data base, agevolando così il data entry. I dati sono infatti estrapolati dalla piattaforma SurveyMonkey e trasferiti direttamente al software SPSS per la loro elaborazione. Una volta scaricati i dati sul software SPSS, è necessario proseguire con una pulitura del database prima di procedere con l’analisi statistica dei dati.
Completate le operazioni di data cleaning, si procede con l’analisi delle variabili dipendenti prese in esame (qualità, sincerità, heritage, valutazione generale del prodotto, disponibilità all’acquisto e word of mouth), al fine di osservare come varia la percezione di autenticità dei consumatori nei confronti del Grana Padano DOP tenendo di conto del canale di vendita in cui il prodotto è inserito, il prezzo a cui questo è venduto e la località di produzione in cui il prodotto è realizzato.
3.1.1 Registrazione, revisione ed elaborazione dei dati
Il processo di data entry delle risposte ottenute dalla compilazione del web form avviene automaticamente tramite il supporto di un data base strutturato su righe e colonne, dove a ciascuna riga corrisponde un indirizzo IP. Il data base elaborato automaticamente dal software è un data base grezzo al quale è necessario eseguire un’operazione di data cleaning. La pulizia dei dati consiste in una ricognizione sui valori per identificare gli eventuali errori a partire da incongruenze logiche. Queste operazioni devono essere effettuate prima di iniziare qualsiasi elaborazione e permettono di ripulire i dati da una serie di errori compiuti nelle varie fasi precedenti.
ciascuna variabile, utile per la successiva elaborazione, indicare al software sia la natura di ciascuna variabile (stringa, numero, etc), sia il valore che viene assunto da ciascuna di esse (0 o 1 nel caso di variabili dicotomiche) e sia il metodo di misurazione delle variabili (su scala, ordinale, nominale).
Si procede poi con l’individuazione e l’eliminazione degli IP che non hanno completato l’intero questionario. L’indagine ha ottenuto 297 contatti. Tuttavia, questi, rappresentano dei contatti lordi, ai quali è stato necessario sottrarre le mancate risposte totali. Infatti, nonostante il numero di soggetti da raggiungere fosse inferiore, si è creduto opportuno raccogliere un maggior numero di risposte al fine di far fronte all’eventualità di collezionare un discreto numero di mancate risposte. Pertanto, sebbene il numero di rispondenti ottenuto sia abbastanza elevato, la percentuale di completamento al netto degli answering drop-outs, ossia, coloro che hanno abbondonato l’indagine prima di aver compilato l’intero questionario, è del 68%.
Questa operazione è stata compiuta per gradi, ovvero, prima si è fatto un check dei questionari che sono stati lasciati completamente vuoti, le colonne sono state messe poi in ordine crescente in modo tale da avere tra i primi posti le righe vuote.
Sono stati eliminati così 32 questionari (n = 32/297), mentre sono state mantenute le risposte di quei soggetti che hanno compilato solamente la prima parte del form in quanto si è ritenuto che queste potessero fornirci comunque delle utili informazioni aggiuntive per la nostra ricerca.
Infine, prima di procedere con l’analisi statistica, è necessario eseguire un’ultima operazione, ovvero, controllare tutte le domande del questionario per vedere se ce ne sono alcune espresse in maniera negativa perché in questo modo non sarebbe possibile svolgere confronti in fase di analisi dei dati. In tal caso, è necessario riconvertire il valore delle risposte. Nel nostro esperimento non è stato necessario compiere questa operazione in quanto, ricontrollando tutte le domande, si è notato che queste sono formulate in maniera affermativa.
Una volta compiute le operazioni suddette, si procede con la fase di analisi delle risposte sul data base ripulito.
Un punto di forza del software utilizzato, che si è rivelato utile in fase di analisi, è il fatto che SurveyMonkey ci dà la possibilità di svolgere in itinere le analisi sui dati. SurveyMonkey ci permette, infatti, di scaricare le risposte raccolte quando ancora l’indagine è attiva e questo si è rilevato molto importante al fine di capire piano piano come si sarebbero
1
delineate le principali relazioni tra le variabili sottoposte all’indagine. In questo modo, le attività di analisi si sono svolte, in parte, in contemporanea alla fase di raccolta dei dati. Per le operazioni di data mining, oltre al software SPSS di IBM utilizzato per le analisi statistiche più avanzate come test su campioni indipendenti, analisi di correlazione tra variabili, modello lineare generalizzato ANOVA e ANCOVA, si è fatto ricorso anche al software Excel di Microsoft per le analisi descrittive sul campione in quanto più flessibile nella creazione di grafici e figure di sintesi dei dati.
Il metodo seguito per la progettazione ed esecuzione dell’indagine è sintetizzato nella figura seguente (Figura 3.1).
OBIETTIVO DI INDAGINE:
analisi dei fattori che influenzano la percezione di
autenticità dei consumatori
METODO DI DATA COLLECTION:
metodo quantitativo, indagine online
DISEGNO DI ESPERIMENTO:
disegno between subjects variables
CAMPIONE:
180 soggetti autosomministrato via web QUESTIONARIO:
DATA CLEANING:
265 contatti netti
DATA MINING:
analisi dei dati ottenuti (SPSS / Excel)
2
3
DATA ENTRY:
DB grezzo di 297 contatti lordi