• Non ci sono risultati.

Econometria Eteroschedasticità Tiziano Razzolini

N/A
N/A
Protected

Academic year: 2021

Condividi "Econometria Eteroschedasticità Tiziano Razzolini"

Copied!
81
0
0

Testo completo

(1)

Tiziano Razzolini

Università di Siena

Siena, 2020

(2)

In questa parte del corso toccheremo i seguenti argomenti

1 La natura dell’eteroschedasticità

2 Individuare l’eteroschedasticità

3 Standard error robusti

4 Minimi quadrati generalizzati: varianza nota

5 Minimi quadrati generalizzati: varianza ignota

6 Eteroschedasticità nel modello di probabilità lineare

(3)

Consideriamo la funzione lineare:

E [y ] = β1+ β2x

Per tener conto del fatto che non tutte le famiglie con uno stessoreddito x avranno la stessa spesa alimentare y , e coerentemente con la specificazione generale del modello di regressione, indichiamo con ei la differenza fra la spesa della famiglia i-esima, yi, e la spesa media per tutte le famiglie con reddito xi

ei =yi− E[yi] =yi− β1− β2xi. In altre parole il nostro modello è:

y = β + β x +e.

(4)

La probabilità di ottenere grandi valori di e, positivi o negativi, è maggiore in corrispondenza di redditi elevati rispetto a redditi bassi.

1 Una variabile casuale, in questo caso e, ha probabilità più elevata di assumere valori lontani dalla propria media se la sua varianza è alta.

2 Possiamo dunque catturare l’effetto che abbiamo descritto assumendo che Var [e] dipenda direttamente dal reddito x .

3 Var [e] cresce al crescere di x .

(5)

In una situazione come questa, in cui la varianza delle osservazioni non sono tutte le stesse, diremo che esiste eteroschedasticità.

1 In alternativa, che la variabile casuale y e l’errore casuale e sono eteroschedastici.

2 Al contrario, se tutte le osservazioni provengono da funzioni di densità con la stessa varianza, diremo che esiste omoschedasticità e che y ed e sono

omoschedastici.

(6)
(7)

L’esistenza di eteroschedasticità rappresenta una violazione di una delle ipotesi dei minimi quadrati.

1 Finora abbiamo assunto che gli errori causali fossero incorrelati, di media nulla e varianza costante:

E [ei] =0, Var [ei] = σ2, Cov [ei,xi] =0.

2 La nostra discussione suggerisce che l’ipotesi MR3, debba essere sostituita con un’ipotesi del tipo:

Var [yi] =Var [ei] =h(xi) = σi2 dove h(xi)è una funzione crescente di xi.

(8)

Example (Spesa alimentare)

La stima dei minimi quadrati dell’equazione della spesa alimentare è:

by = 83.42 + 10.21x

da cui, possiamo esprimere i residui dei minimi quadrati come:

bei =yi− 83.42 − 10.21xi.

(9)

Example (Spesa alimentare)

(10)

L’eteroschedasticità è una caratteristica frequente nei dati in cross-section.

1 Il termine cross-section è usato per indicare un insieme di dati riguardante un certo numero di unità economiche (individui, famiglie, imprese), in un determinato istante temporale.

2 I dati in cross-section contengono sempre osservazioni relative a unità economiche di dimensione diversa.

3 Le implicazioni di questo fatto sul modello di regressione lineare sono che al crescere della dimensione dell’unità economica cresce l’incertezza associata agli esiti y .

4 Questa maggiore incertezza viene descritta specificando una varianza dell’errore tanto maggiore quanto più grande la dimensione dell’unità economica.

(11)

L’eteroschedasticità non è una proprietà necessariamente confinata ai dati in cross-section.

1 La varianza dell’errore può cambiare anche con dati in serie storica, che si riferiscono a una unità economica osservata per un certo periodo di tempo, come un’impresa, una famiglia, un settore produttivo o perfino un’intera economia.

(12)

Le implicazioni dell’eteroschedasticità per lo stimatore dei minimi quadrati sono varie:

1 Lo stimatore dei minimi quadrati è ancora lineare e corretto, ma non è più il migliore.

2 Esiste un altro stimatore con varianza inferiore.

3 Gli standard error dello stimatore dei minimi quadrati calcolati usando le formule viste in precedenza sono errati.

4 Gli intervalli di confidenza e i test delle ipotesi basati su questi standard error potrebbero essere fuorvianti.

(13)

Cosa succede agli standard error? Consideriamo il modello di regressione semplice senza eteroschedasticità:

yi = β1+ β2xi+ei, Var [ei] = σ2.

La varianza dello stimatore dei minimi quadrati bβ2è data da:

Var [ bβ2] = σ2 Pn

i=1(xi− ¯x )2.

(14)

Supponiamo ora che le varianze degli errori non siano costanti.

Il nostro modello diventa allora:

yi = β1+ β2xi+ei, Var [ei] = σ2i.

La varianza dello stimatore dei minimi quadrati bβ2è data da :

Var [ bβ2] =

n

X

i=1

wi2σi2= Pn

i=1(xi− ¯x )2σi2 Pn

i=1(xi− ¯x )22.

(15)

Problem Dimostrare che

Var [ bβ2] = Pn

i=1(xi− ¯x )2σi2 Pn

i=1(xi− ¯x )22.

(16)

Esistono due modi per rilevare la presenza di eteroschedasticità.

1 Il primo è rappresentato dall’uso di grafici dei residui.

2 L’altro consiste di due classi più formali di test statistici.

(17)

Se gli errori sono omoschedastici, non dovrebbe essere possibile individuare nei residui nessun tipo di struttura.

1 Se gli errori sono eteroschedastici, invece, i residui

tenderanno a presentare una maggiore variabilità secondo uno schema sistematico.

2 Questa tecnica di individuazione si può applicare in ogni regressione lineare semplice.

3 In un modello di regressione multipla, potremmo tracciare il grafico dei residui rispetto ad ogni esplicativa, oppure rispetto a yi, per vedere se c’è un andamento sistematico.

(18)

Figure: Residui della spesa alimentare rispetto al reddito

(19)

Consideriamo un test di eteroschedasticità basato su una funzione di varianza.

Consideriamo il modello generale di regressione multipla:

yi = β1+ β2xi2+ · · · + βKxiK +ei.

Una forma generale della funzione di varianza è data da:

Var [yi] = σ2i =E [e2i] =h(α1+ α2zi2+ · · · + αSziS).

Questa espressione è generale perché non abbiamo specificato nulla circa la funzione h(·).

(20)

Esistono molte possibili funzioni per h(·). Due esempi sono:

Funzione esponenziale:

h(α1+ α2zi2+ · · · + αSziS) = exp(α1+ α2zi2+ · · · + αSziS) Funzione lineare:

h(α1+ α2zi2+ · · · + αSziS) = α1+ α2zi2+ · · · + αSziS. In quest’ultimo caso è necessario fare attenzione al fatto che sia verificata la condizione h(·) > 0.

(21)

Si noti che quando

α2= α3= · · · = αS =0 allora

h(α1+ α2zi2+ · · · + αSziS) =h(α1) dove h(α1)è una costante. Nel primo caso abbiamo

h(α1) = exp(α1) mentre nel secondo

h(α1) = α1.

(22)

In altre parole, se:

α2= α3= · · · = αS =0

l’eteroschedasticità non è presente e la varianza è costante. Di conseguenza, come ipotesi nulla e alternativa di un test di eteroschedasticità possiamo considerare:

H0: α2= α3= · · · = αS =0

H1:almeno un αj, j = 2, . . . , S, è diverso da zero.

Dopo l’ipotesi nulla e l’alternativa, dobbiamo costruire una statistica test.

(23)

Per ottenere una statistica test usiamo

Var [yi] = σi2=E [ei2] = α1+ α2zi2+ · · · + αSziS. Chiamiamo νi =ei2− E[ei2]la differenza tra il quadrato di un errore e la sua media. Possiamo allora scrivere

e2i =E [e2i] + νi = α1+ α2zi2+ · · · + αSziS+ νi.

(24)

Si noti che l’aggiunta di νi alla funzione di varianza ha lo stesso scopo dell’aggiunta di eialla funzione della media nel modello di regressione generale:

yi =E [yi] +ei = β1+ β2xi2+ · · · + βKxiK +ei. Sostituendo il quadrato dei residui dei minimi quadratibei2al posto di ei2, otteniamo:

be2i = α1+ α2zi2+ · · · + αSziS+ νi che possiamo definire come una regressione ausiliaria.

(25)

Dato che la statistica di adattamento R2, calcolata nella regressione ausiliaria, misura la frazione di varianza dieb2i spiegata dalle z, sembra naturale considerarla come possibile statistica test

È possibile dimostrare che, sotto H0, il prodotto di R2per la numerosità campionaria ha distribuzione χ2con S − 1 gradi di libertà:

n × R2∼ χ2S−1.

(26)

Questo test ha diverse importanti caratteristiche.

È un test asintotico, valido in campioni di numerosità elevata.

Spesso questo test è chiamato test di eteroschedasticità dei moltiplicatori di Lagrange o Breusch-Pagan.

Una delle caratteristiche più sorprendenti del test è che il valore della statistica calcolata a partire dalla funzione lineare è valido anche quando si considera un’alternativa in cui la funzione di varianza ha una qualsiasi delle forme viste precedentemente.

(27)

Il test precedente presuppone chesi conoscano le variabili che compaiono nella funzione di varianza se l’ipotesi alternativa è vera.

In altre parole, per usare il test bisogna saper specificare z2,z3, . . . ,zS.

Vorremmo poter verificare la presenza di

eteroschedasticità senza avere una conoscenza precisa delle variabili coinvolte in essa.

Partendo da questa idea, White suggerisce di scegliere come z le variabili x , i loro quadrati e possibilmente i loro prodotti incrociati.

(28)

esplicative:

E [y ] = β1+ β2x2+ β3x3

Il test di White senza termini di prodotto incrociato (interazioni) specifica:

z2=x2, z3=x3, z4=x22, z5=x32

L’inclusione dei termini di interazione aggiunge una variabile in più

z6=x2x3.

Il test di White viene effettuato come test F oppure usando un test χ2

n × R2∼ χ2S−1

(29)

Example (Spesa alimentare)

Consideriamo H0: α2=0 contro l’alternativa H1: α26= 0 nella funzione di varianza σ2i =h(α1+ α2xi).

Iniziamo stimando con i minimi quadrati la funzione bei2= α1+ α2xi+ νi.

Salviamo l’R2che è:

R2=1 − SQR

SQT =0.1846.

E calcoliamo

n × R2=40 × 0.1846 = 7.38.

(30)

Example (Spesa alimentare)

Dato che nell’ipotesi nulla compare un solo parametro, il test chi quadrato ha un solo grado di libertà.

Il valore critico al 5% è 3.84.

Dato che 7.38 è maggiore di 3.84, rifiutiamo l’ipotesi nulla H0e concludiamo che la varianza dipende dal reddito.

(31)

Example (Spesa alimentare)

Per calcolare la versione di White del test, iniziamo stimando con i minimi quadrati la funzione:

be2i = α1+ α2xi+ α3xi2+ νi.

Verifichiamo H0: α2= α3=0 contro H1: α26= 0 o α36= 0.

Considerando sia la statistica test sia il p-value:

n × R2=40 × 0.18888 = 7.555, p − value = 0.023.

Il valore critico al 5% è χ2(0.95,2)=5.99.

Ancora una volta concludiamo che l’eteroschedasticità è

(32)

Example (L’equazione del salario)

Esiste un secondo test è pensato per due gruppi di osservazioni con varianza potenzialmente diversa.

Consideriamo un’equazione del salario nella quale la retribuzione oraria (WAGE ) dipende dagli anni di istruzione (EDUC), da quelli di esperienza (EXPER) e da una

dummy che indica se il lavoratore vive in un’area metropolitana (METRO).

(33)

Example (L’equazione del salario)

La stima dei minimi quadrati del modello è data da:

WAGE = −9.914\

(1.08) +1.234

(0.070)EDUC + 0.133

(0.015)EXPER +1.524

(0.431)METRO.

Il test di Goldfeld-Quandt è costruito proprio per verificare questa forma di eteroschedasticità, in cuiil campione può essere diviso in due gruppi che si sospetta abbiano varianze diverse.

(34)

Example (L’equazione del salario)

Possiamo scrivere due equazioni di regressione distinte per i due gruppi come:

WAGEMi = βM1+ βM2EDUCMi+ βM3EXPERMi+eMi,i = 1, 2, . . . nM WAGERi = βR1+ βR2EDUCRi+ βR3EXPERRi+eRi,i = 1, 2, . . . nR. Vogliamo verificare l’ipotesi nulla

H0: σ2M = σ2R.

(35)

La statistica test è data da:

F = bσM2M2

σb2RR2 ∼ FnM−KM,nR−KR

Supponiamo di voler verificare:

H0: σ2M = σR2 contro H1: σ2M 6= σR2. Se H0è vera, la statistica test si reduce a:

F = σb2M σbR2.

(36)

Example (L’equazione del salario)

Data la specificazione dell’ipotesi alternativa, il test di Goldfeld-Quandt è un test a due code con KM =KR=3 e nM =808, nR=192

I valori critici a un livello di significatività del 5% sono FLc =F (0.025, 805, 189) = 0.81 e

FUc=F (0.975, 805, 189) = 1.26.

Rifiutiamo H0se F < FLc o F > FUc.

(37)

Example (L’equazione del salario)

Usando i minimi quadrati per stimare separatamente il modello M e il modello R otteniamo le stime delle seguenti varianze

σb2M =31.824,bσR2 =15.243

Per decidere se questa differenza si possa attribuire alla variabilità campionaria o sia abbastanza ampia per concludere che σ2M 6= σ2R, calcoliamo:

F = bσM2

R2 = 31.824

15.243 =2.09.

Dato che 2.09 > FUc =1.26, rifiutiamo H0e concludiamo che la varianza del salario non è la stessa nelle regioni rurali e

(38)

Example (Spesa alimentare)

Nell’esempio della spesa alimentare, ordinando le osservazioni rispetto al reddito xi, e dividendo il campione in due gruppi di 20 osservazioni ciascuno, in modo che la prima metà del campione corrisponderà ad osservazioni convarianza più bassa e la seconda metà ad osservazioni con varianza più alta, otteniamo:

σb21=3574.8,bσ22=12921.9.

Da cui deriviamo:

F = σb2M

R2 = 3574.8

12921.9 =3.61.

(39)

Example (Spesa alimentare)

Essendo convinti che le varianze possano crescere, ma non diminuire, con il reddito usiamo un test a una coda con valore critico al 5% F(0.95,18,18)=2.22.

Dato che 3.61 > 2.22, l’ipotesi nulla di omoschedasticità è rifiutata a favore della alternativa secondo la quale la varianza cresce con il reddito.

(40)

Si ricordi che l’uso dello stimatore dei minimi quadrati in

presenza di eteroschedasticità introduce due ordini di problemi:

1 Lo stimatore dei minimi quadrati, pur essendo corretto, non è più il migliore.

2 Gli standard error classici dei minimi quadrati sono

sbagliati e questo invalida le proprietà di stime intervallari e statistiche test.

E’ possibile correggere gli standard error in modo da costruire stime intervallari e statistiche test valide anche in presenza di eteroschedasticità.

(41)

Nel caso del modello di regressione semplice con errori

eteroschedastici, la varianza dello stimatore dei minimi quadrati è data da:

Var [ bβ2] = Pn

i=1(xi− ¯x )2σi2 Pn

i=1(xi− ¯x )22.

(42)

White ha suggerito uno stimatore consistente di questa varianza. Gli standard error costruiti in questo modo sono noti come:

1 standard error consistenti in presenza di eteroschedasticità, o

2 standard error robusti rispetto alla eteroschedasticità, o

3 standard error robusti

Il termine robusti sta ad indicare il fatto che questi standard error sono validi nei grandi campioni sia quando gli errori sono eteroschedastici sia quando sono omoschedastici.

(43)

Nel caso del modello di regressione semplice con errori

eteroschedastici, la varianza dello stimatore dei minimi quadrati è data da:

V ar [ bb β2] = n n − 2

Pn

i=1(xi− ¯x )2eb2i Pn

i=1(xi− ¯x )22.

(44)

Example (Spesa alimentare)

yb

se classici

se di White

=83.42

43.41

27.46

+10.21

2.09

1.81

x .

In questo caso, se ignoriamo l’eteroschedasticità, sottostimiamo la precisione delle stime e gli intervalli di confidenza tendono ad essere più ampi di quello che dovrebbero essere.

(45)

Example (Spesa alimentare)

Gli intervalli di confidenza per β2al 95%, associati ai due tipi di standard error sono:

1 White: bβ2± tcse( bβ2) =10.21 ± 2.024 × 1.81 = [6.55, 13.87]

2 Classico:

βb2± tcse( bβ2) =10.21 ± 2.024 × 2.09 = [5.97, 14.45]

(46)

error di White ci aiuta a evitare di calcolare stime intervallari errate o valori sbagliati di statistiche test.

1 Lo stimatore di White non affronta però l’altra implicazione dell’eteroschedasticità: cioè che lo stimatore dei minimi quadrati non è più ottimale.

2 Non risolvere questo problema, tuttavia, può non essere un peccato molto grave.

3 Se la numerosità campionaria è elevata, la varianza dello stimatore dei minimi quadrati può comunque essere abbastanza piccola da garantire stime precise.

4 Per calcolare uno stimatore alternativo con una varianza minore bisogna specificare un’opportuna funzione di varianza.

5 L’uso dei minimi quadrati in combinazione con standard

(47)

Consideriamo nuovamente il modello con eteroschedasticità:

yi = β1+ β2xi+ei

E [ei] =0, Var [ei] = σi2,Cov [ei,ej] =0, i 6= j Per sviluppare uno stimatore migliore di quello dei minimi quadrati è necessario formulare un’ulteriore ipotesi sul modo in cui le varianze σ2i cambiano tra osservazioni.

(48)

Questa ipotesi in più è necessaria perché lo stimatore BLUE in presenza di eteroschedasticità (minimi quadrati generalizzati o GLS) dipende dalle σi2ignote

1 Avendo solo n osservazioni, non è consigliabile stimare le n varianze ignote σ2i, i = 1, 2, . . . , n

2 Per poter applicare in pratica lo stimatore dei minimi quadrati generalizzati, dunque, è necessario specificare la struttura delle σi2.

3 Una possibile ipotesi è data da:

Var [ei] = σi2= σ2xi.

(49)

Affronteremo questo problema cambiando o trasformando il modello originario in un altro con errori omoschedastici.

Per mettere in pratica questa idea, iniziamo dividendo entrambi i lati del modello per√

xi yi

√xi = β1 1

√xi + β2 xi

√xi + ei

√xi riscriviamo il nostro modello come:

yi = β1xi1 + β2xi2 +ei dove

yi= yi

√x , xi1 = 1

√x , xi2 = xi

√x , ei = ei

√x .

(50)

Problem

Dimostrare che ei è omoschedastico.

(51)

Il vantaggio di questo modello trasformato sta nel fatto che il nuovo termine d’errore è omoschedastico

Var [ei] =Var

 ei

√xi



= 1

xiVar [ei] = 1

xiσ2xi = σ2. Il termine d’errore trasformato, inoltre, conserverà le proprietà di media nulla e correlazione nulla fra osservazioni diverse.

Una differenza importante è che il modello trasformato non contiene più un termine costante.

(52)

Riassumendo, per calcolare il miglior stimatore lineare e corretto in un modello con eteroschedasticità del tipo specificato precedentemente, dobbiamo:

calcolare le variabili trasformate

usare i minimi quadrati per stimare il modello trasformato Lo stimatore così ottenuto è chiamato stimatore dei minimi quadrati generalizzati (GLS).

(53)

Un modo per interpretare lo stimatore dei minimi quadrati generalizzati consiste nel considerarlo uno stimatore dei minimi quadrati ponderati.

In questo caso stiamo minimizzando la somma dei quadrati degli errori trasformati:

n

X

i=1

e∗2i =

n

X

i=1

 ei

√xi

2

.

Gli errori sono ponderati per xi−1/2. Quando il peso√

xi è piccolo, i dati contengono più informazione sulla funzione di regressione e alle

osservazioni viene attribuito un peso maggiore e viceversa.

(54)

Example

Applicando la procedura dei minimi quadrati generalizzati (ponderati) ai dati della spesa alimentare, otteniamo la stima seguente:

byi =78.68

(23.79)+10.45

(1.39)xi

Gli standard error tra parentesi sono entrambi minori dei corrispondenti standard error consistenti di White.

L’intervallo di confidenza al 95% di β2è dato da:

βb2± tcse( bβ2) =10.45 ± 2.024 × 1.386 = [7.65, 13.26].

(55)

Example (L’equazione del salario)

Torniamo all’equazione del salario in cui la varianza dell’errore per le osservazioni dei lavoratori metropolitani era diversa da quella dei lavoratori rurali:

WAGEMi= βM1+ βM2EDUCMi+ βM3EDUCMi+eMi,i = 1, 2, . . . nM

WAGERi= βR1+ βR2EDUCRi+ βR3EDUCRi+eRi,i = 1, 2, . . . nR.

E le stime delle varianze in ciascun gruppo erano:

M2 =31.824, bσR2 =15.243.

(56)

Example (L’equazione del salario)

Per tener conto del fatto che le varianze dell’errore sono diverse tra i due gruppi, possiamo stimare separatamente le due equazioni con i minimi quadrati, ottenendo:

βbM1= −9.052, bβM2=1.282, bβM3=0.1346 βbR1= −6.166, bβR2 =0.956, bβR3=0.1260

Il problema con questo modo di procedere, tuttavia, è quello di ottenere due stime di β2e due stime di β3, quando invece stiamo assumendo che l’effetto sul salario di istruzione ed esperienza sia lo stesso nelle due aree.Se questa congettura è vera possiamo ottenere stime più precise combinando i due sottocampioni

(57)

Example (L’equazione del salario)

La strategia da seguire è la stessa del paragrafo precedente.

Le variabili vengono trasformate dividendo ogni osservazione per lo scarto quadratico medio del termine d’errore

corrispondente, σM e σR: WAGEMi

σM = βM1

1

σM + βM2

EDUCMi

σM + βM3

EXPERMi σM +eMi

σM e

WAGERi

σR = βR1

1

σR + βR2

EDUCRi σR + βR3

EXPERRi σR +eRi

σR.

(58)

Example (L’equazione del salario)

Applicando i minimi quadrati all’insieme di tutte le osservazioni trasformate otteniamo i migliori stimatori lineari e corretti.

Questa procedura presenta tuttavia due complicazioni La prima è che σM e σRsono ignoti.

Per risolvere questo problema trasformiamo le osservazioni usando le stimebσM eσbR.

Questa soluzione fornisce lo stimatore calcolabile dei minimi quadrati generalizzati (FGLS), con buone proprietà nei grandi campioni.

(59)

Example (L’equazione del salario)

La seconda complicazione è che le intercette nelle due aree sono diverse.

La differenza delle intercette può essere incorporata nel modello includendo la dummy METRO che deve essere trasformata come le altre variabili esplicative.

(60)

Example (L’equazione del salario)

Possiamo sintetizzare il metodo per ottenere le stime calcolabili dei minimi quadrati generalizzati come segue:

Ottenere le stimeσbM ebσRapplicando separatamente i minimi quadrati alle osservazioni metropolitane e rurali.

Sia

σbi=



σbM METROi =1 σbR METROi =0

(61)

Example (L’equazione del salario)

Applicchiamo i minimi quadrati al modello trasformato WAGEi

i = βR1

1 bσi + β2

EDUCii + β3

EXPERi

i + δMETROii +ei

i.

Seguendo questi passaggi otteniamo l’equazione stimata seguente:

WAGE = −9.398\

(1.02) +1.196

(0.069)EDUC + 0.132

(0.015)EXPER + 1.539

(0.346)METRO.

Dove

(62)

Finora abbiamo assunto nota la forma della varianza.

Consideriamo ora un modello più generale che contiene dei parametri incogniti aggiuntivi da stimare.

Ad esempio, un’espressione che ha come casi particolari tutti quelli precedenti, è data da:

Var [ei] = σi2= σ2xiγ dove γ è un parametro incognito.

La nostra discussione suggerisce di trasformare il modello dividendo la i-esima osservazione di ogni variabile per x

γ 2

i .

(63)

Dato che γ è incognito, prima di procedere alla trasformazione bisogna stimarlo.

Ad esempio, un’espressione che ha come casi particolari tutti quelli precedenti, è data da:

log(σi2) = log(σ2) + γ log(xi).

Calcolando l’esponenziale di entrambi i lati otteniamo:

σi2= exp(log(σ2) + γ log(xi)) = exp(α1+ α2zi) dove α1= log(σ2), α2= γ e zi = log(xi).

(64)

Questa formulazione della funzione di varianza è

conveniente perché mostra che la varianza può dipendere da qualsiasi esplicativa zi , sia essa tra i regressori della relazione econometrica oppure no.

Se pensiamo che la varianza possa dipendere da più di una variabile esplicativa, possiamo esprimerla come

σi2= exp(α1+ α2zi2+ · · · + αSziS).

(65)

Torniamo al modello semplice e riscriviamolo log(σ2i) = α1+ α2zi.

Chiediamoci ora come stimare α1e α2.

Usiamo i quadrati dei residui dei minimi quadratibe2i come osservazioni:

log(bei2) = log(σ2i) + νi = α1+ α2zi+ νi. La regressione fornisce le stime dei minimi quadrati dei parametri α1e α2.

(66)

Example (Spesa alimentare)

Nell’esempio della spesa alimentare con zi = log(xi), la spesa dei minimi quadrati è data da

log(bσi2) =0.9378 + 2.329zi.

Si noti che la stima diαb2=bγ =2.329 è più del doppio del valore γ = 1 assunto implicitamente nella specificazione della varianza nota.

(67)

Il passo successivo consiste nel trasformare le

osservazioni in modo che il nuovo modello abbia varianza omoschedastica.

Come abbiamo visto, dobbiamo dividere entrambi i lati dell’equazione per xibγ/2

(68)

Alternativamente, seguendo la specificazione più generale, possiamo calcolare le stime della varianza usando:

i2= exp(αb1+αb2zi)

e quindi dividere entrambi i lati dell’equazione perbσi.

(69)

Entrambe le strategie conducono alle stesse stime dei minimi quadrati generalizzati. Dividendo il modello per σi, otteniamo:

yi

σi = β11

σi + β2xi σi + ei

σi. La varianza dell’errore trasformato è costante:

Var ei σi



= 1

σi2Var [ei] = 1

σi2σi2=1

(70)

Di conseguenza, per calcolare lo stimatore dei minimi quadrati generalizzati di β1and β2, definiamo le variabili trasformate:

yi = yi

σbi, xi1 = 1

σbi, xi2 = xii. Applichiamo quindi i minimi quadrati all’equazione:

yi = β1xi1 + β2xi2 +ei.

(71)

Per riassumere questi passaggi nel caso generale, supponiamo di voler stimare il modello:

yi = β1+ β2xi2+ · · · + βKxiK+ei dove

Var [ei] = σi2= exp(α1+ α2zi2+ · · · + αSziS).

(72)

I passaggi necessari per calcolare lo stimatore dei minimi quadrati generalizzati sono:

Stimare il modello con i minimi quadrati e calcolare i quadrati dei residui,eb2i.

Stimare α1, α2, . . . , αS applicando i minimi quadrati all’equazione

be2i = α1+ α2zi2+ · · · + αSziS+ νi. Calcolare le stime della varianza

i2= exp(αb1+αb2zi2+ · · · +αbSziS).

Calcolare le variabili trasformate yi,xi1,xi2, . . . ,xK 1 . Stimare il modello trasformato con OLS.

(73)

Example (Spesa alimentare)

Seguendo questa procedura, nel caso della spesa alimentare:

ybi =76.05

(9.71) +10.63

(0.97)xi.

Rispetto al caso di varianza nota, le stime di β1e β2non sono cambiate molto.

Si è verificata, invece, una significativa riduzione degli standard error che nella specificazione precedente erano

se( bβ1) =23.79, se( bβ2) =1.39.

(74)

Gli stimatori dei minimi quadrati generalizzati con varianza nota e ignota richiedono entrambi un’ipotesi sulla forma dell’eteroschedasticità.

Se questa ipotesi è corretta essi hanno varianza minima, se l’ipotesi è falsa lo stimatore non ha varianza minima e i suoi standard error non sono validi.

Questo problema può essere evitato usando i minimi quadrati con gli standard error di White.

Questo approccio non richiede un assunto sulla forma dell’eteroschedasticità ma non consente di realizzare la riduzione della varianza ottenuta con i minimi quadrati generalizzati.

(75)

Dato che è impossibile sapere quale sia la forma esatta della funzione di varianza come possiamo risolvere questo dilemma?

Gli standard error robusti possono essere usati non solo come salvaguardia contro gli effetti dell’eteroschedasticità quando stimiamo con i minimi quadrati, ma sono utili anche per proteggersi da eventuali errori di specificazione della funzione di varianza alla base dei minimi quadrati generalizzati.

Conclusione: usare sempre gli standard error robusti!

(76)

In un modello di probabilità lineare la relazione fra p e le variabili esplicative è descritta dalla funzione lineare:

E [y ] = p = β1+ β2x2+ · · · + βKxK. Se includiamo l’errore stocastico otteniamo il modello:

yi =E [yi] +ei = β1+ β2x2+ · · · + βKxK +ei.

(77)

Questa relazione può essere stimata con i minimi quadrati, ma le stime risentono della presenza di eteroschedasticità:

Var [yi] =Var [ei] =pi(1 − pi)

= (β1+ β2xi2+ · · · + βKxiK)(1 − β1− β2xi2− · · · − βKxiK) La varianza dell’errore dipende dai valori delle variabili

esplicative. Possiamo:

usare gli standard error robusti rispetto all’eteroschedasticità;

possiamo applicare la procedura dei minimi quadrati generalizzati.

(78)

Se applichiamo i minimi quadrati generalizzati, dobbiamo stimare la varianza.

Possiamo ottenere una stima di pi a partire dai valori previsti dai minimi quadrati:

bpi = bβ1+ bβ2xi2+ · · · + bβKxiK otteniamo

V ar [eb i] =bpi(1 −bpi).

(79)

A questo punto è necessario assicurarsi che le stima della probabilità siano comprese tra 0 e 1, siano cioè positive.

Dopo aver calcolato stime positive della varianza, possiamo ottenere le stime dei minimi quadrati

generalizzati applicando i minimi quadrati all’equazione trasformata:

yi p

bpi(1 −bpi) = β1 1 p

bpi(1 −bpi)+ β2 xi2 p

bpi(1 −bpi) + · · · + βK

xiK p

pbi(1 −pbi) + ei p

bpi(1 −bpi).

(80)

Example (Coke or Pepsi)

(81)

Example (Coke or Pepsi)

Il test di eteroschedasticità più adatto in questo caso è quello di White. Applicando questo approccio ai residui dei minimi quadrati, otteniamo

nR2=25.17, p − value = 0.0005.

Questo risultato ci suggerisce di rifiutare l’ipotesi nulla di omoschedasticità ad un livello di significatività dell’1%.

Riferimenti

Documenti correlati

Il problema della collinearità sta nel fatto che i dati non contengono sufficiente informazione sugli effetti individuali delle variabili esplicative per permetterci di stimare

Il modello di regressione multipla.

quasi sempre va risolto con metodi numerici iterativi, al computer in alcuni casi particolari, esiste la soluzione analitica (es.: fit lineare)... altrimenti lo accetto, e i valori

, M nel senso dei minimi quadrati, viene usualmente detto regressione lineare.. Vediamone un esempio

Ricordiamo che in generale, non ha senso cercare un grado troppo alto del polinomio di miglior approssimazione p N in quanto si otterrebbe a partire da un certo valore il

Ricordiamo che in generale, non ha senso cercare un grado troppo alto del poli- nomio di miglior approssimazione p N in quanto si otterrebbe a partire da un certo valore il

Si può dimostrare usando la procedura di Gram-Schmidt che una tal famiglia tri- angolare di polinomi esiste e con la stessa procedura costruirla direttamente; inoltre è

[r]