Estensioni del modello parametrico - Obiettivo dell'analisi

1.4 Obiettivo dell'analisi

2.1.4 I modelli

2.1.4.2 Estensioni del modello parametrico

Si è già detto che il modello Chopit può essere considerato come una generalizzazione del modello Probit ordinato, in quanto ciascuna risposta viene modellata secondo tale approccio: con lo scopo di confrontare i due tipi di approcci, una scelta comune tra gli autori consiste nel ssare l'insieme delle caratteristiche osservate Vipari a quello di Xi, oltre a ssare i parametri

σ2

ε = 1e µε = 0(pagina42). Tuttavia il modello Chopit può essere visto anche

come una generalizzazione di un modello gerarchico con intercetta casuale, in cui la varianza di secondo livello viene ssata a 1; in questa visione quindi la domanda rappresenta il primo livello, mentre gli individui il secondo livello. L'obiettivo dunque è quello di confrontare gli intervistati non solo in base alle descrizioni ipotetiche, ma anche secondo le autovalutazioni. Nello specico, supponendo che di avere s = 1 autovalutazioni, il modello assumerebbe la seguente forma:

Y_ij∗ = Xijβ + εi+ uij

εi ∼ N (0, 1)

uij ∼ N (0, ω2)

Diversi ricercatori hanno esteso l'approccio parametrico delle vignettes con lo scopo di adattarlo anche ad altri aspetti. Particolare attenzione è sta- ta dedicata alla specicazione delle soglie più che alla varianza condizionata: infatti ci si può aspettare che una caratteristica persistente microeconomica dei dati a livello individuale sia l'eteroschedasticità della varianza (Greene e

Hensher,2010b). Tuttavia ancora non vi sono studi riguardo ad un possibile

modello con l'uso delle anchoring vignettes che intraprenda questa strada, così come la possibilità di considerare la non-normalità degli errori εi e uij

o una specicazione semi-parametrica: si tratterrebbe dunque di adattare al contesto di riferimento e dunque generalizzare modelli probit ordinati che già comprendono queste possibili strade come il modello probit ordinato etero-

shedastico di Chen e Khan3_{, la proposta di inserire l'eterogeneità secondo}

l'idea di Heckman e Singer4 _{o l'approccio semi-non parametrico di Gallant e}

Nychka5 _{(l'idea e la formulazione dei tre modelli viene riporta rispettivamen-}

te da Greene e Hensher (2010b, Cap. 7.4), da Hadri e Mikhail (2014, Cap.

6.5) e da Greene e Hensher (2010b, Cap. 12)). Di seguito vengono riportate

le estensioni presenti in letteratura nel caso; si precisa che la formulazione è riferita al caso in cui vi sia una sola autovalutazione (s = 1).

Van Soest et al. (2011) inseriscono un termine d'errore ξinella prima equa-

zione delle soglie (e quindi è incluso anche nelle altre soglie), soluzione che permette l'introduzione di una qualche caratteristica inosservata dell'intervistato i. Ciò signica che oltre alle covariate osservate Vi, anche l'eterogeneità

individuale (casuale) nelle soglie ξi può inuenzare le soglie. Con questa com-

ponente aggiuntiva, le soglie del modello Chopit si modicano nel seguente modo:

3_{La specicazione della variabile latente è: y}∗

i = Xiβ + σi2εi dove εi∼ N (0, 1).

4_{Assumono che la distribuzione di ε}_i _{sia discreta ovvero P r(ε}_i _{= ζ}_m_{) = π}_m _{con m =}

1, 2, .., M, ζ = (ζ1, .., ζM)è un vettore di M punti di massa.

5_{La specicazione della distribuzione del termine d'errore ε}_i _{proposta dai due autori è}

fk(ε) = 1_θ Ks X k=0 γkεk !2 Φ(ε)

τ1 i = γ1Vi+ ξi τk i = τ K−1 i + eγ k_V i_, _{k = 2, ..., K} ξi ∼ N (0, σ2ξ) ξi⊥ (εi, uij, Xi, Vi)

Van Soest e Vonkova (2012) dimostrano che questa componente aggiuntiva

è utile per ridurre sostanzialmente problemi di errata specicazione, grazie all'inclusione di un solo parametro al modello originario di King et al. (2004).

I due modelli sono comunque annidati dal momento che imponendo σ2

ξ = 0

si ottiene il modello standard.

In alcune analisi preliminari, Kapteyn et al. (2007) trovano evidenzia del fatto che gli individui potrebbero rispondere dierentemente a seconda del genere dei soggetti ipotetici descritti; se ciò si verica, il livello percepito associato alla vignette sarebbe distorto determinando l'uso di soglie dierenti nella valutazione di uno scenario con soggetto femminile piuttosto che maschile. Conseguentemente, ciò violerebbe l'assunzione di vignette equivalence perchè gli individui percepirebbero in modo diverso gli scenari ipotetici. Date queste

possibili evidenzie, Kapteyn et al. (2007) includono nella componente delle

vignettes una dummy sul genere della persona ipotetica: Z_ij∗ = θj + νFij + uij

dove Fij =

 



1 individuo ipotetico : donna

0 altrimenti .

Tuttavia tale estensione può essere usata solo quando le descrizioni ipotetiche sono somministrate casualmente agli intervistati. Analizzando il comporta- mento nell'uso di sostanze alcoliche di alcuni studenti, Van Soest et al. (2011) includono in questa formulazione un'ulteriore termine, specico per le pro- prie analisi, ovvero una variabile dummy indicante se all'individuo i è stato mostrato il totale di grammi di alcool che ha una bevanda e se sono stati forniti degli esempi relativi.

Paccagnella (2011) estende il modello standard per tener conto della distor- sione di selezione. La sua specicazione è utile quando il questionario è som- ministrato ad un campione, ma solo alcuni rispondenti sono selezionati (non casualmente) per rispondere alle vignettes. Nei confronti di misure di auto-

valutazione tra Paesi questo problema potrebbe portare a risultati inconsi- stenti (specialmente se il numero di risposte alle vignettes è basso) a causa, per esempio, di mancanza di procedure sul campo di lavoro standardizzate

(Paccagnella, 2013). Il modello prevede dunque una terza componente alle

due già introdotte nel Chopit, detta equazione di selezione: S_i∗ = Wiδ + ηi Si =    1 se S_i∗ > 0 0 altrimenti

dove Wi è un insieme di variabili esplicative (Wi può coincidere anche con

Xi, ma è consigliabile che almeno una variabile sia esclusiva di Wi stesso), δ

è un vettore di parametri che deve essere stimato e ηi è il termine d'errore.

Pertanto, i livelli riportati Yi e Zij sono osservati solo se la condizione Si∗ > 0

è soddisfatta. Al ne di introdurre una correlazione tra i termini di errore si sfrutta l'approccio di un eetto shared random wi:

εi = φwi+ ψi

uij = λjwi+ ςij

ηij = wi+ νi

dove wi, ψi e νi sono distribuiti indipendentemente come una normale stan-

dard e ςij indipendentemente secondo una normale di media zero e varianza

σ2 ν.

Angelini et al. (2011) introducono il modello Chopit logitudinale, al ne di analizzare no a quale punto le soglie siano stabili nel tempo. Infatti uno dei problemi che possono insorgere nell'analizzare le scale di risposta è che queste possano dierire non solo tra gli individui, ma anche nel tempo, determinando appunto l'incomparabilità delle autovalutazioni. In presenza di dati panel, l'eterogeneità invariante nel tempo può essere considerata attraverso l'uso di modelli ad eetti ssi o causali (Angelini et al., 2011). L'idea alla base di tale modello è dunque quello di combinare le tecniche dei modelli panel con quelle delle anchoring vignettes.

Formalmente, dati i periodi temporali t = 1, 2, ..., T e Y∗

it il livello perce-

pito dell'individuo i al tempo t ad una domanda, con i = 1, 2, ..., n viene modellato come segue:

Y_it∗ = Xitβt+ εit

εit= ηi+ ωit

ove Xit sono variabili esogene varianti nel tempo, βt è il vettore di parametri

che deve essere stimato (senza costante per l'identicazione) e εit è il termine

d'errore che è costituito da una componente specica individuale ηi e da un

errore idiosincratico ωit. Nello specico, il temine d'errore nell'equazione per

l'autovalutazione è denito come:

ηi ∼ N (0, σ2)

ωit ∼ N (0, 1)

ηi⊥ ωit

ωit⊥ ωiu, t 6= u

da cui deriva che V (εit) = σ2+ 1 e COV (εit, εiu) = σ2 per t 6= u.

Come nel modello Chopit standard di King et al. (2004) e con la stessa

logica, il rispondente i al tempo t esprime il livello percepito Y∗

it (inosservato

e continuo) nella valutazione discreta Yit scegliendo tra k categorie ordinate

(k = 1, 2, ..., K) secondo il seguente meccanismo: Yit = k se τitk−1 ≤ Yit∗ < τitk

dove −∞ = τ0

it< τit1 < ... < τ k−1

it < τitk= +∞

Le soglie sono sempre individuali e modellate come una funzione di variabili esogene Vit e un vettore di parametri γt, ma in più sono tempo-dipendenti:

τ_it1 = γ_t1Vit

τ_itk = τ_tk−1+ eγtkVit

con k = 2, 3, ..., K − 1.

Per quanto riguarda la componente delle anchoring vignettes, il livello inosservato dell'oggetto d'interesse che è descritto nello scenario j come percepito dall'individuo i al tempo t è modellato come:

Z_ijt∗ = θjt+ uijt

Quindi ogni intervistato i non percepisce la vignette j nello stesso modo in istanti temporali dierenti (θjt costante per i) dove i = 1, 2, ..., n, t =

1, 2, ..., T e j = 1, 2, ..., J. Così come è stato fatto per la precedente com-

ponente, il termine d'errore uijt è diviso in due termini, una componente

specica individuale e della vignette (ςij), e da un errore idiosincratico (νijt).

Nello specico: ςij ∼ N (0, ρ2) νijt∼ N (0, τt2) ςij ⊥ (νijt, ηi, ωit) νijt⊥ νiju, t 6= u νijt⊥ (νijt, ωit)

da cui deriva che V (uijt) = ρ2 + τt2 e COV (uijt, uiju) = ρ2 per t 6= u.

La valutazione discreta Zit del rispondente i al tempo t è dovuto alla tra-

sformazione del livello percepito Z∗

it (inosservato e continuo) scegliendo tra k

categorie ordinate (k = 1, 2, ..., K) nel seguente modo: Zijt = k se τitk−1 ≤ Z ∗ ijt < τitk dove −∞ = τ0 it < τit1 < ... < τ k−1 it < τitk = +∞ e in cui le soglie τk

itsono le stesse dell'equazione dell'autovalutazione, in modo

da rispettare l'assunzione di response consistency. Per quanto riguarda la vignette equivalence, la disponibilità di dati longitudinali permette di rilassare questa assunzione (secondo la formulazione standard essa implicherebbe che uijt= νijt). Ovviamente il Chopit longitudinale può essere combinato con una

delle precedenti estensioni (tenendo conto di vari aspetti allo stesso tempo): ad es Angelini et al. (2011) includono nella loro specicazione della vignette una variabile dummy indicante il genere dell'individuo ipotetico secondo la formulazione di Kapteyn et al. (2007), dipendente da t oltre che da i e j.

Nel documento Soddisfazione della vita e del reddito: evidenze empiriche tra alcuni Paesi europei (pagine 44-49)