• Non ci sono risultati.

Metodo di elaborazione dei dati

4. I prodotti agroalimentari di qualità: il caso studio Valle dell‟Alcantara

4.4 Metodologia applicata

4.4.2 Metodo di elaborazione dei dati

Attraverso l'analisi fattoriale si intende in questo lavoro, studiare le correlazioni tra il numero elevato di variabili, raggruppandole intorno ai fattori (variabili “latenti” poiché inosservabili). Così facendo le variabili che gravitano su un fattore abbiano un buon livello di correlazione.

Attraverso il modello fattoriale:

j m jm j j j

k

F

k

F

k

F

U

z

1 1

2 2

...

con:

zj = j-esima variabile standardizzata (j=1,2,3,..,n)

133 Chinnici G., Pecorino B., L‟applicazione dell‟analisi statistica multivariata al consumo dei prodotti da

F1, F2, ...., Fm = fattori comuni indipendenti tra loro (con m<n) kjh = coefficienti

Uj = fattore unico per la variabile j

l'obiettivo è quello di schematizzare l'informazione contenuta in una matrice di correlazione o di varianza/covarianza, facendo in modo di determinare statisticamente le dimensioni latenti e non direttamente osservabili (Stevens, 1986).

In tal modo è possibile avere una rappresentazione in forma semplice, della complessa rete di interpolazioni che esiste in ordine alle variabili associate. Procedendo in questa direzione si è potuto delineare, all'interno della matrice di correlazione, un delimitato numero di componenti indipendenti l'una dall'altra. Mediante queste componenti è stato possibile spiegare la varianza massima raggiungibile delle variabili comprese nella matrice d'informazione originaria.

Avendo concluso questa parte, si è proceduto all‟analisi per componenti principali: z1=k11F1+k12F2+....+k1hFh+...+k1mFm z2=k21F1+k22F2+....+k2hFh+...+k2mFm ... zJ=kJ1F1+kJ2F2+....+kJhFh+...+kJmFm ... zn=kn1F1+kn2F2+....+knhFh+...+knmFm.

Questo è un metodo di trasformazione matematica che tiene conto dell‟insieme di variabili trasponendole in un nuovo insieme di variabili composite (componenti principali) ortogonali (cioè indipendenti) tra di loro attraverso cui è possibile spiegare134 la maggior parte della variabilità dei dati con:

134 La varianza spiegata dai fattori permette di analizzare attraverso processi di valutazione il livello di comunanza delle variabili aggiunte in modo che questo risulti proporzionalmente inferiore a quella delle variabili introdotte precedentemente, e inoltre che il numero dei fattori richiesti per raggiungere la stessa frazione di varianza spiegata sia relativamente più elevato. Inserendo per prime le variabili considerate più ottimali per verificare il modello che si ha in mente, e quindi non casualmente, è possibile verificare che la comunanza delle variabili aggiunte sia proporzionalmente inferiore a quella delle variabili introdotte in

Fh = fattori comuni standardizzati e ortogonali tra loro (

r

FhFk

 0

)

kjh=

r

z jFh poiché zJ e Fh sono standardizzati

Non esiste un numero minimo o massimo di componenti da estrarre rispetto alle variabili originarie, ma il metodo diviene più rappresentativo quanto minore è il numero di componenti prese in considerazione.

Il nostro obiettivo in questo lavoro è quello di ottenere fattori che spieghino le correlazioni tra variabili attraverso l‟utilizzo dell‟analisi delle Componenti Principali. Naturalmente in fase di analisi sono state preferite le variabili che in qualche modo siano collegate tra loro, in mancanza di questo presupposto le relazioni tra le variabili divengono deboli tanto da trovare con difficoltà fattori comuni.

La presenza di correlazione significativa tra le variabili può essere verificata con alcuni test (es. test di Bartlett, misura Kaiser-Meyer-Olkin, etc. ).

Il test di sfericità di Bartlett viene applicato alla matrice di correlazione. L'ipotesi nulla è che tale matrice sia pari ad una “matrice identità”, cioè ad una matrice del tipo:

                 1 0 ... 0 0 0 1 0 .... 0 ... ... ... ... ... 0 ... 0 1 0 0 ... 0 0 1 I

In tal caso le correlazioni tra le variabili risultano nulle. Se non si rifiuta tale ipotesi, tale risultato suggerisce di non avviare la ricerca di fattori comuni.

Test di Kaiser-Meyer-Olkin (KMO) è un indice che permette di confrontare la grandezza delle correlazioni osservate rispetto alle correlazioni parziali. I valori devono essere > 0.70. Possono comunque essere accettati valori compresi tra 0.70 e 0.50.

precedenza e che il numero dei fattori richiesti per raggiungere la stessa frazione di varianza spiegata sia relativamente più elevato.

L‟analisi mediante la rotazione dei fattori con il metodo VArimax135 ha permesso di sintetizzare le informazioni rilevate con il questionario rivolto al campione di turisti consumatori presenti nell‟area della Valle dell‟Alcantara.

L‟analisi fattoriale è stata condotta separatamente in base ai gruppi omogenei di variabili che sono state individuate con il questionario d‟indagine (ad esempio: variabili socioeconomiche, di consumo, di conoscenza, di apprezzamento dei prodotti tipici della Valle dell‟Alcantara), al fine di evitare la perdita di informazioni per il maggior peso, in termini di varianza spiegata, di alcuni caratteri rispetto ad altri (Morrison, 1976).

All‟analisi fattoriale è stata fatta seguire la cluster analysis consentendo di individuare specifici gruppi tipologici omogenei di consumatori. Si è quindi lavorato ai cluster individuando gruppi omogenei di consumatori.

L‟analisi “cluster” (CA) è una procedura di tipo euristico atta a produrre informazioni sulla interdipendenza o somiglianza fra osservazioni costituite da persone, oggetti o variabili, senza assumere a “priori” alcuna ipotesi o teoria che implichi relazioni causali o gerarchiche. Essa risponde agli obiettivi della ricerca poiché consente di identificare con sufficiente accuratezza profili di turisti - consumatori aggregati136 per preferenze manifestate nel corso dell‟indagine sui consumi di prodotti di qualità della Valle dell‟Alcantara, in grado di identificare una nicchia stabile di mercato. Un insieme di algoritmi raggruppa le singole osservazioni (oggetti) in gruppi omogenei (cluster). Il metodo adottato per la procedura di classificazione è quello non gerarchico delle k-medie (k-means cluster analysis), che ha consentito di individuare, mediante un procedimento iterativo, i gruppi, minimizzando le distanze euclidee assunte dai centri dei cluster finali. La procedura adottata, verrà implementata nel package statistico SPSS 9.0.

135 Per l‟estrazione dei fattori, è stato adottato, il metodo delle componenti principali ruotando i fattori stessi con il metodo Varimax che minimizza il numero di variabili esplicative di un fattore e, quindi, ne migliora l‟interpretabilità (Kaiser, 1958).

136In base alle procedure di aggregazione si possono distinguere fra metodi agglomerativi e scissori: con l‟approccio gerarchico top-down (scissorio) si ipotizza che tutti gli oggetti siano all‟inizio in un unico cluster e con successive divisioni tutti gli oggetti rilevati sono assegnati al loro cluster di appartenenza. Con l‟approccio bottom up (procedura gerarchica agglomerativa) si produce all‟opposto una serie di partizioni degli oggetti Pn, Pn-1, P1 che formano all‟inizio cluster singoli, per cui il primo Pn è costituita da un solo oggetto in un unico gruppo (pertanto si hanno n gruppi formati da un solo oggetto); alla fine l‟ultima partizione P1 è rappresentata da un unico gruppo contenente tutti gli oggetti (Mauracher, 2006). L‟aggregazione pertanto procede per stadi e progressivamente da cluster a un solo oggetto a cluster via via più numerosi secondo il principio gerarchico che ad ogni stadio della iterazione si ottiene un cluster derivato dalla fusione di due gruppi precedenti.

4.5 Analisi dei risultati sui consumi di prodotti agroalimentari di qualità