• Non ci sono risultati.

2.1 “Lisrel” e i modelli di equazioni struttural

2.6 Ricerca di specificazione

Finora, si è trattato delle varie misure di adattamento complessivo del modello ai dati osservati. L'interesse ora si sposta verso la fase di miglioramento del modello, anche sulla base della diagnostica prodotta dal software Lisrel. Si tratta di una procedura iterativa: dal primo modello, attraverso successivi passi, si perviene via via a un modello migliore del precedente fino a che non si può più migliorare l'adattamento. Le alternative di riformulazione del modello che il software Lisrel offre sono molteplici e la loro scelta deve essere giustificata dalla sensatezza teorica di queste alternative più che dalla loro efficacia statistico-matematica.

Nella costruzione di un modello è utile procedere secondo due fasi sequenziali: la prima dedicata alla definizione della parte di misurazione del modello e la seconda che mette a punto la parte strutturale. Nella prima fase si giunge al modello di misura globale (tramite analisi fattoriale confermativa), in cui fra le variabili latenti sono ipotizzati solo legami di correlazione (adirezionali); in questa fase, tutti i residui sono dovuti ad errori nella

51

specificazione della parte di misurazione. Questa parte si migliora fin che si può, poi nella seconda fase si passa alla formulazione dei nessi causali fra le variabili latenti e il miglioramento del modello avviene lasciando intatta la parte di misurazione (come era stata definita nella prima parte). Tale processo di miglioramento del modello può avvenire secondo 3 modi, di seguito riportati (Corbetta, 2002).

a) Esclusione di parametri dal modello: dopo aver stimato il modello e valutato il suo adattamento globale ai dati, il primo passaggio da affrontare è quello di controllare la significatività di ciascun parametro in modo da eliminare quelli non significativamente diversi da 0. Sotto l'ipotesi di distribuzione campionaria normale, rifiutiamo l'ipotesi nulla che un certo parametro sia zero nella popolazione se il relativo valore- t39 è in valore assoluto maggiore di 1.9640. Secondo tale criterio, si eliminano dal modello quei parametri con t-value in valore assoluto minore di 1.96: per questo, nell'output del programma Lisrel vengono riportati i valori-t dei parametri stimati. Tale eliminazione deve essere fatta un parametro alla volta, con successiva nuova stima del modello poiché l'azzeramento di un solo parametro modifica tutti i restanti.

b) Inclusione di nuovi parametri: gli indici di modifica permettono di includere dei parametri significativi che all'inizio non erano stati previsti nel modello. Il significato di tali indici è il seguente: per ciascun parametro non incluso nel modello (quindi fisso) viene calcolato di quanto diminuirebbe la statistica T (test di adattamento del modello) se quel parametro venisse liberato (cioè non vincolato ad essere costante, ma stimabile). La distribuzione approssimata di un indice di modifica è un chi-quadro con un grado di libertà: esso dunque è significativo se supera il valore 4 (tipicamente, il suo valore dovrà essere molto superiore a tale soglia perché valga la pena inserire il parametro corrispondente nel modello). La procedura di utilizzo di

39 Il “valore-t” di un parametro P è il rapporto |p|/SE, dove p è la stima di P e SE è lo standard error della stima.

40

52

questi indici consisterà nel trovare i parametri con gli indici di modifica più elevati e stimare di nuovo il modello avendo liberato tali parametri. Tale liberazione va eseguita un parametro alla volta, in quanto l'inserimento di un parametro nel modello implica la variazione degli altri indici di modifica. Tale operazione però non deve essere eseguita in maniera meccanica, infatti la scelta dei parametri da liberare deve avvenire su basi più teoriche che matematiche. L'entità dell'indice di modifica, quindi, funge da “spia” sulla base della quale (ma non esclusivamente su quella) prendere le decisioni sui parametri da liberare.

c) Riformulazione del modello: l'analisi dei residui, in particolare dei singoli scarti ij ij, sta alla base delle procedure di miglioramento del

modello. In generale, per conseguire tale scopo, si devono ricercare i residui elevati. Una volta individuati questi residui, ci sono 3 modi a disposizione per eliminarli:

1) introdurre fra le variabili già presenti dei legami aggiuntivi che coinvolgano le variabili con residuo elevato (in genere, sono gli indici di modifica a suggerire quali legami inserire nel modello); 2) introdurre delle nuove variabili latenti che agiscano su quelle

colpite da residui elevati. In genere, l'esistenza di elevati residui fra due o più variabili può essere sintomo di una variabile latente retrostante agente su tali variabili41. In questo caso, l'introduzione di una nuova variabile latente implica una vera e propria riformulazione del modello;

3) introdurre dei legami fra gli errori delle variabili aventi residui elevati; tale strada elimina completamente i residui fra le variabili implicate, ma è un’operazione artificiosa che non spiega la presenza di tali residui (in pratica la covarianza non spiegata viene attribuita a fattori esterni al modello, non altrimenti

41

Il modo di procedere sarà il seguente: individuazione, nella matrice dei residui (non standardizzati), di un residuo elevato. Ricerca se la coppia di variabili implicate in questo residuo hanno entrambe residuo elevato con una terza variabile, in modo da individuare una tripletta di variabili altamente correlate fra loro (questo induce a ipotizzare un fattore retrostante le 3 variabili).

53

identificati). E' chiaro che tale soluzione non aumenta la capacità esplicativa del modello. Vi sono delle situazioni nelle quali ha senso introdurre dei legami tra gli errori. Ad esempio, quando due variabili sono misurate con lo stesso strumento: allora ha senso pensare che gli errori di misura siano correlati. Altro caso in cui è sensato introdurre legami tra errori è nell'ambito dei dati panel: infatti, variabili misurate nello stesso istante temporale possono avere gli errori correlati in quanto su di esse può agire una qualche variabile sconosciuta legata all'istante della misurazione; o, viceversa, per errori associati allo stesso individuo nel tempo.