3.4 Analisi dei dati
3.4.2 Analisi Fattoriale Esplorativa
Dopo l’analisi descrittiva effettuata considerando le 711 risposte effettivamente valide che hanno permesso l’identificazione della percezione globale degli intervistati riguardo i VGA, si vuole focalizzare l’attenzione sull’analisi fattoriale esplorativa circoscritta ai rispondenti italiani in modo da individuare i fattori latenti che ne influenzano l’accettazione.
Le risposte considerate in questa successiva analisi passano quindi da 711 a 647 come mostrato in Figura 28.
L’analisi fattoriale rappresenta una tecnica di interdipendenza che si propone di estrarre una struttura a partire da un set di variabili osservate al fine di interpretare al meglio una serie di relazioni esistenti tra le variabili stesse.
Essa si distingue in analisi fattoriale confermativa quando si definiscono a priori i fattori da analizzare e si verifica che il modello ipotizzato sia coerente con i dati analizzati, ed analisi fattoriale esplorativa che, non partendo da ipotesi definite a propri, estrapola le variabili latenti a partire da quelle osservate.
55
Questo metodo ha quindi come obiettivo primario l’individuazione di fattori non direttamente osservabili e misurabili a partire da una serie di variabili osservate (e quindi misurate).
Si distingue dall’analisi per componenti principali (ACP), il cui scopo principale è la riduzione di un numero più o meno elevato di variabili in alcune componenti basandosi sulla correlazione tra esse. In sintesi, l’EFA dà soluzioni più accurate rispetto alla ACP.
L’analisi fattoriale si compone, in generale, di sette step descritti da Hair et al. nel 2009 e riportati brevemente di seguito.
STEP 1: obiettivi dell’analisi fattoriale
Il primo passo consiste nel capire il tipo di analisi da effettuare in base allo scopo del problema, identificando la struttura dei dati ed il numero di variabili da usare.
Per l’analisi in questione, coerentemente con gli scopi prefissati, si decide di utilizzare il modello esplorativo.
STEP 2: progettazione dell’analisi fattoriale
Consiste in tre passaggi preliminari ossia la definizione della matrice di correlazione, l’individuazione delle variabili e la definizione della dimensione del campione.
Nell’indagine è stata presa in considerazione una matrice di correlazione tra le variabili (R factor analysis) e sono state escluse dall’analisi le variabili categoriche in quanto soggette a criteri di correlazione diversi. Si userà quindi la correlazione di Pearson tra due variabili statistiche.
L’indice di correlazione di Pearson, espresso nell’equazione ( 16 ), è un numero compreso tra zero ed uno che esprime un’eventuale relazione lineare tra le variabili. La correlazione si dice debole se minore di 0.3, moderata se compresa tra 0.3 e 0.7 e forte se maggiore di 0.7.
𝜌𝑥𝑦= 𝜎𝑥𝑦
𝜎𝑥𝜎𝑦 ( 16 )
dove:
Numero diosservazioni complete: 843
Numero diosservazioni analizzate: 711
Numero diosservazioni analisi EFA: 647
Figura 28: Numero di osservazioni per l'analisi esplorativa
56 𝜎𝑥𝑦= covarianza tra le due variabili;
𝜎𝑥=varianza della variabile x;
𝜎𝑦= varianza della variabile y.
Riguardo al numero di osservazioni, in generale non se ne considerano meno di 50, preferibilmente 100.
Come regola generale, si deve avere un numero di osservazioni pari a cinque volte il numero di variabili anche se sarebbe preferibile un rapporto 1:10. Alcuni ricercatori hanno proposto anche un minimo di 20 casi per variabile.
STEP 3: ipotesi dell’analisi fattoriale
Il ricercatore deve assicurare un’appropriata selezione delle variabili ed inoltre il campione deve risultare omogeneo rispetto la struttura fattoriale.
Da un punto di vista statistico affinché l’analisi fattoriale risulti appropriata, il grado di correlazione tra variabili deve risultare maggiore di .30 e la correlazione parziale, ovvero quando è condizionata da altre variabili, maggiore di .70.
Un altro metodo che studia le correlazioni tra variabili è il test di sfericità di Bartlett mostrato nell’equazione ( 17 ), in cui se la significatività risulta inferiore al limite considerato (di solito 0.05), allora si può enunciare che una certa correlazione tra le variabili esiste. Alcuni studiosi hanno comunque notato come il metodo sia sensibile alla dimensione del campione.
𝜒2= − [𝑛 − 1 −1
6(2𝑝 + 5)] 𝑙𝑛(|𝑅|)
( 17 )
Dove:
𝑛= numero di osservazioni;
𝑝= numero di variabili;
|𝑅|= determinante della matrice di correlazione.
Una terza modalità per misurare il grado di correlazione tra le variabili è la misura dell’adeguatezza del campionamento (Measure of Sampling Adequancy, MSA) introdotta da Kaiser che è stata successivamente modificata da Kaiser e Rice nella statistica di Kaiser-Meyer-Olkin espressa nell’equazione ( 18 ). È un valore compreso tra zero ed uno, dove l’unità indica la perfetta correlazione tra le variabili.
La misura è inaccettabile se risulta minore di .50, mediocre se compresa tra .50 e .70 ed infine meritevole se maggiore di .80. Le variabili con una MSA minore di .50 devono essere omesse dall’analisi.
𝐾𝑀𝑂 = ∑ ∑ 𝑟𝑖 𝑗 𝑖𝑗2
∑ ∑ 𝑟𝑖 𝑗 𝑖𝑗2+ ∑ ∑ 𝑝𝑖 𝑗 𝑖𝑗2
( 18 )
Dove:
𝑟 = correlazioni tra le variabili;
𝑝 = correlazioni parziali tra le variabili.
57 STEP 4: selezione dei fattori
Consiste nella scelta del metodo di estrazione dei fattori e nella loro successiva selezione.
Per capire quale metodo usare si considera la varianza che è divisa in varianza comune, ovvero quella condivisa tra le variabili (chiamata anche comunalità) e la varianza specifica associata ad ogni singola variabile.
Nell’indagine che segue si considera il metodo della fattorizzazione all’asse principale che considera unicamente le comunalità al contrario dell’analisi per componenti principali che non trascura la varianza specifica.
I due metodi, comunque, danno risultati simili quando il numero di variabili è superiore a 30 e la comunanza maggiore di .60 per la maggior parte delle variabili.
Si analizzano ora di seguito i metodi per l’identificazione del numero di fattori da estrarre:
• criterio dell’autovalore: solo i fattori con autovalori maggiori dell’unità sono presi in considerazione;
• percentuale di varianza considerata: il numero dei fattori da estrarre dipende dalla varianza cumulata, che deve risultare maggiore (o almeno circa uguale) al 60%;
• scree test: consiste in una rappresentazione grafica degli autovalori in forma canonica. Secondo Cattell, gli autovalori connessi con i fattori reali e non casuali hanno un andamento caratteristico a caduta e quindi si estraggono solo quei fattori che sono sulla linea di caduta trascurando quelli che degradano lentamente (Figura 29). Nel modello di Cattell, al contrario di quello di Harman, il punto di flesso è incluso;
• analisi parallela: partendo da una matrice di dati casuali, si calcolano gli autovalori e, ripetendo la simulazione più volte, si mantengono nell’analisi gli autovalori attuali maggiori di quelli casuali.
I fattori sono estratti in sequenza secondo la loro capacità di spiegare la varianza.
Figura 29: Scree test
58 STEP 5: interpretazione dei fattori
L’interpretazione dei fattori consiste in tre procedure. In primo luogo, il software calcola la matrice delle componenti non ruotata che contiene i pesi dei fattori per ogni variabile. Essi rappresentano le correlazioni esistenti tra fattore e variabile.
Per avere una migliore comprensione dei dati e non solo una loro sintetizzazione, la matrice delle componenti viene ruotata in modo da semplificare la struttura fattoriale.
La rotazione è di tipo ortogonale se gli assi fattoriali restano tra loro a novanta gradi presupponendo quindi un’indipendenza tra i fattori stessi, o obliqua se l’angolo risulta diverso da novanta gradi ed i fattori sono correlati. Quest’ultimo è quindi più realistico.
Nel caso della rotazione ortogonale i modelli più usati sono QUARTIMAX e VARIMAX che massimizza la varianza delle saturazioni dei fattori mentre per quella obliqua sono OBLIMIN (presente in SPSS) e PROMAX.
La soluzione obliqua produce due matrici: la matrice di struttura che indica le correlazioni parziali fattore e la matrice dei modelli, considerata effettivamente nell’analisi, che riguarda le correlazioni variabile-fattore.
In ultimo, la matrice viene analizzata eliminando le variabili che non hanno peso nella formulazione dei fattori. Infatti, affinché i dati siano significativi ed interpretabili, i pesi dei fattori devono risultare almeno pari a .30 per una dimensione del campione di almeno 350 osservazioni (un peso maggiore o uguale di .70 permetterebbe l’identificazione di una ben definita struttura fattoriale).
Il processo di valutazione è inoltre iterativo infatti in questa fase, se i risultati non sono raggiunti, si deciderà di cambiare il metodo di rotazione o direttamente il modello dell’analisi fattoriale.
STEP 6: validazione dell’analisi fattoriale
Rappresenta il grado di generalizzazione dei risultati che si ottiene attraverso un’analisi confermativa per valutare il livello di replicabilità dei risultati, la stabilità della struttura (che dipende dalla dimensione del campione e dal numero di casi per ogni variabile) e la presenza di valori anomali nei risultati.
Un metodo utilizzato, quando sono presenti variabili ordinate su scala, è l’alpha di Cronbach, che rappresenta un indicatore statistico usato per valutare l’affidabilità di un test. Esso prende il nome da Lee Cronbach che lo propose nel 1951 per identificare in modo oggettivo la validità dei test pedagogici e psicologici.
Questo indice, compreso tra 0 ed 1, assume un valore buono se maggiore di 0,7 ed ottimo se maggiore di 0,8.
Esiste un’altra metodologia, utilizzata nella seguente analisi, che presuppone la divisione del campione in due parti uguali e la ridefinizione dell’analisi esplorativa su entrambi i sotto campioni. Se i risultati sono pressoché simili, allora i risultati sono stati generalizzati rendendoli applicabili per future indagini.
STEP 7: usi addizionali dei risultati dell’analisi fattoriale
I fattori identificati nell’analisi fattoriale esplorativa possono essere usati come input per successive indagini, come l’analisi a gruppi o l’analisi SEM (Structural Equation Modelling) in cui i fattori, attraverso un modello di regressione lineare, sono usati come variabili indipendenti per capire i nessi casuali con le altre variabili.
59