• Non ci sono risultati.

3 Modelli di simulazione di comportamenti di scelta

3.3 Modelli ibridi a variabili latenti

3.3.1 Struttura del processo di scelta

Arricchire i tradizionali modelli di scelta con aspetti psicologici ha l’obiettivo di ottenere una rappresentazione del processo di scelta più attinente alla realtà. La rappresentazione del processo di scelta può intendersi come la soluzione del problema decisionale.

Come nei tradizionali modelli di utilità casuale, le preferenze di un individuo, ovvero i giudizi comparativi tra entità cui il decisore fa ricorso per ordinare le alternative ed effettuare una scelta, sono misurate mediante una variabile latente detta utilità. A differenza dei modelli classici però, nei modelli a variabili latenti, si fa l’ipotesi che le preferenze siano influenzate, oltre che degli attributi dell’alternativa e da fattori socio-economici del decisore, anche da fattori psicologici quali percezioni e attitudini che, a loro volta, sono fattori non direttamente misurabili e pertanto rappresentano dei costrutti latenti.

Le percezioni rappresentano la stima o una misura del valore che gli individui associano ai livelli degli attributi delle alternative, mentre le attitudini riflettono l’atteggiamento, i valori, i gusti e le capacità dei singoli individui.

Con l’introduzione esplicita delle percezioni e delle attitudini, attraverso variabili latenti, è possibile spiegare parte della componente stocastica della funzione di utilità percepita.

Per poter stimare in un modello matematico gli effetti latenti, è indispensabile poter misurare le variabili che li determinano.

Nel caso dell’utilità, ipotizzando un paradigma interpretativo che giustifica le scelte dei decisori come frutto di un processo cognitivo volto alla massimizzazione dell’utilità stessa, essa si manifesta nelle scelte, dichiarate o effettuate, dai decisori. In maniera analoga, nei modelli a variabili latenti, per identificare i fattori psicologici latenti, è necessario disporre di dati che consentano di stimare il loro effetto o la loro

175

manifestazione. Quindi mentre per la variabile utilità il set di dati attraverso i quali essa si manifesta è rappresentato dalle preferenze dei decisori, per i costrutti latenti vengono usati degli indicatori psicometrici che misurano il livello di accordo o disaccordo di ogni intervistato rispetto a determinate affermazioni (che consentono di individuare un atteggiamento, una preferenza etc.)

La variabile latente è generalmente funzione delle caratteristiche socio-economiche della persona, pertanto gli indicatori psicometrici consento di catturare l’eterogeneità delle preferenze degli utenti.

3.3.1.1 Modello integrato

Il modello integrato consiste dunque di due componenti, un modello di scelta e un modello di variabile latente.

Come ogni modello di utilità aleatoria, l’utilità individuale U per ogni alternativa è considerata una variabile latente e le scelte osservate sono manifestazioni che sottendono a quest’utilità. Le variabili osservabili che sono manifestazione di costrutti latenti vengono detti indicatori.

176

Fig. 15 Modello integrato

Come possiamo notare dallo schema il modello è costituito da due parti fondamentali:

 le note relazioni sull’utilità percepita con variabili esplicative (osservate e latenti), relative al decisore e alle alternative, ed indicatori di scelta che rivelano le preferenze dei decisori;

 le equazioni strutturali che esprimono il ruolo delle caratteristiche dei decisori (variabili socio-economiche) nelle dinamiche interiori che formano le variabili latenti. Inoltre, sono presenti relazioni tra i fattori latenti e gli indicatori di percezione che ne forniscono una manifestazione, in quanto derivano da risposte a quesiti volti a far emergere conoscenze, valori, percezioni degli utenti intervistati.

È possibile identificare un modello di scelta con un numero finito di variabili latenti utilizzando solamente le scelte osservate e nessun altro indicatore addizionale (Elrod 1997). Tuttavia è molto probabile che il contenuto informativo degli indicatori di

177

scelta non sarà sufficiente per identificare empiricamente gli effetti delle variabili latenti. Pertanto gli indicatori vengono esplicitamente introdotti all’interno del modello integrato. Gli indicatori potrebbero essere le risposte alle domande dell'indagine in merito, ad esempio, al livello di soddisfazione o di importanza legato ad alcuni attributi. Mentre i costrutti latenti non sono osservabili, i loro effetti sugli indicatori sono osservabili, pertanto gli indicatori permettono l'identificazione di tali costrutti latenti.

Si noti che gli indicatori non hanno una relazione causale che influenza il comportamento. Cioè, la freccia va dalla variabile latente all'indicatore, e gli indicatori sono utilizzati solo a supporto per la misurazione dei rapporti causali (le frecce continue).

Per il modello di variabile latente si necessita della distribuzione di probabilità 𝑓1(𝑋∗|𝑋; 𝛾, 𝛴𝜂) delle variabili latenti individuate:

𝑋∗= ℎ(𝑋; 𝛾) + 𝜂 𝑐𝑜𝑛 𝜂~𝐷(0, 𝛴

𝜂) (14

Dove con:

 𝑋∗ si è indicato la generica variabile latente;

 X la variabile osservabile;  𝛾 il parametro incognito;

 𝛴𝜂 matrice di variaza-covarianza del termine aleatorio 𝜂;

 D la generica distribuzione di probabilità.

Nel modello avremo una di queste equazioni strutturali per ogni variabile latente. Per il modello di scelta è necessario conoscere la distribuzione di probabilità dell’utilità 𝑓2(𝑈|𝑋, 𝑋∗; 𝛽, 𝛴𝜀):

𝑈 = 𝑉(𝑋, 𝑋∗; 𝛽) + 𝜀 𝑐𝑜𝑛 𝜀~𝐷(0, 𝛴𝜀) (15

Per il modello di variabile latente è necessario definire anche la distribuzione 𝑓3(𝐼|𝑋, 𝑋∗; 𝛼, 𝛴𝜐) degli indicatori:

178 𝐼 = 𝑔(𝑋, 𝑋∗; 𝛼) + 𝜐 𝑐𝑜𝑛 𝜐~𝐷(0, 𝛴

𝜐) (16

Quest’equazione di misura in generale contiene solo variabili latenti al lato destro. In ogni caso potrebbe contenere anche caratteristiche socio-economiche del decisore o altri indicatori.

Per il modello di scelta l’indicatore è rappresentato dal vettore delle scelte effettuate dal decisore i. Si ha dunque:

𝑦 = {1, 𝑠𝑒 𝑈𝑖 = 𝑚𝑎𝑥{𝑈𝑗}

0, 𝑎𝑙𝑡𝑟𝑖𝑚𝑒𝑛𝑡𝑖 } (17

È bene notare che le funzioni h(.), V(.) e g(.) non sono definite, anche se tipicamente sono di tipo lineare, ma non necessariamente. Rimane inoltre da definire la distribuzione di probabilità dei residui aleatori nonché le matrici di varianza- covarianza.

Dalle equazioni (2) e (4), facendo un ‘assunzione circa la distribuzione di ε, possiamo derivare la probabilità di scelta condizionata sia dalle variabili latenti che da quelle osservabili 𝑃(𝑦|𝑋, 𝑋∗; 𝛽, 𝛴𝜀).

Utilizzando la tecnica di massimizzazione della verosimiglianza possiamo stimare i parametri incogniti. Il modo più intuitivo per creare una funzione di verosimiglianza per il modello integrato è quello di partire con la verosimiglianza del modello di scelta senza variabili latenti:

𝑃(𝑦|𝑋; 𝛽, 𝛴𝜀) (18

La forma del modello può essere qualsiasi (logit N-logit, probit, etc.)

Adesso vengono aggiunte le variabili latenti. Una volta ipotizzato un costrutto latente incognito 𝑋∗, la sua funzione di verosimiglianza è pari all’integrale del modello di

scelta sopra la distribuzione del costrutto latente: 𝑃(𝑦|𝑋; 𝛽, 𝛾, 𝛴𝜀, 𝛴𝜂) = ∫ 𝑃(𝑦|𝑋, 𝑋∗; 𝛽, 𝛴𝜀)

𝑋∗ 𝑓1(𝑋

|𝑋; 𝛾, 𝛴

179

Introducendo gli indicatori per implementare l’accuratezza della stima e assumendo che le componenti di errore (ε, η, ν) siano indipendenti, la funzione di densità congiunta delle variabili osservabili yi e I, condizionata dalle variabili endogene X è pari a: 𝑓4(𝑦, 𝐼|𝑋; 𝛼, 𝛽, 𝛾, 𝛴𝜀,𝛴𝜐, 𝛴𝜂) = ∫ 𝑃(𝑦|𝑋, 𝑋∗; 𝛽, 𝛴𝜀) 𝑋∗ 𝑓3 (𝐼|𝑋, 𝑋∗; 𝛼, 𝛴 𝜐)𝑓1(𝑋∗|𝑋; 𝛾, 𝛴𝜂) 𝑑𝑋∗ (20

La forma delle variabili (discrete o continue) e le assunzioni circa i termini di errore dell’equazioni strutturali e di misura determinano la forma della funzione di verosimiglianza. Frequentemente si assumono forme funzionali lineari nei parametri e termini di disturbo con una distribuzione normale o GEV.

La stima del Modello con Variabili Latenti può essere effettuata mediante l’utilizzo di due differenti metodologie:

 stima sequenziale: le variabili latenti sono stimate separatamente ed incluse nel modello di scelta discreta come variabili esogene.

 stima simultanea: le variabili latenti sono stimate congiuntamente al modello di scelta.

La stima dei parametri mediante massimizzazione della funzione di verosimiglianza, consiste nel ricercare quei valori di 𝛼, 𝛽, 𝛾, Σ tali che:

𝛼, 𝛽, 𝛾, Σ = argmax (∑ ln (𝑓4(𝑦, 𝐼|𝑋; 𝛼, 𝛽, 𝛾, 𝛴𝜀,𝛴𝜐, 𝛴𝜂) 𝑁

𝑛=1

) (21