• Non ci sono risultati.

Econometria Altri risultati per il modello di regressione multipla Tiziano Razzolini

N/A
N/A
Protected

Academic year: 2021

Condividi "Econometria Altri risultati per il modello di regressione multipla Tiziano Razzolini"

Copied!
84
0
0

Testo completo

(1)

Tiziano Razzolini

Università di Siena

Siena, 2020

(2)

In questa parte del corso toccheremo i seguenti argomenti

1 Verifica di ipotesi congiunte

2 Uso di informazione non campionaria

3 Specificazione del modello

4 Dati poco informativi, collinearità e scarsa significatività

5 Previsione

(3)

Gli economisti costruiscono e valutano teorie sul comportamento economico

1 Per verificare queste teorie vengono usate procedure di test delle ipotesi.

2 Talvolta le teorie sviluppate dagli economisti forniscono informazione non campionaria che può essere usata assieme all’informazione nel campione osservato per stimare i parametri di un modello di regressione.

3 I minimi quadrati vincolati sono una procedura che combina questi due tipi di informazioni.

(4)

Un’ipotesi nulla composta da più congetture sui parametri, espresse con più di un segno di uguaglianza, è chiamata ipotesi congiunta.

Il caso più generale consiste nel verificare se includere in un particolare modello un gruppo di variabili esplicative.

1 Esempio: per spiegare il salario di un individuo, oltre a istruzione ed esperienza, è necessario considerare anche variabili relative alle sue caratteristiche

socio-demografiche?

2 Esempio: la quantità domandata di un bene dipende dai prezzi dei beni sostituti/ complementi oltre che dal proprio?

(5)

Entrambe le ipotesi sono del tipo:

H0: β4=0, β5=0, β6=0

1 L’ipotesi nulla congiunta contiene tre congetture (tre segni di uguaglianza): β4=0, β5=0 e β6=0.

2 Un test di H0è un test congiunto che verifica se le tre ipotesi sono simultaneamente vere.

(6)

Example (Un modello economico di vendita) Consideriamo il modello dei ricavi:

SALES = β1+ β2PRICE + β3ADVERT + β4ADVERT2+e

1 Supponiamo di voler verificare se SALES dipende o meno dalla spesa pubblicitaria.

2 Osserviamo che quest’ultima compare nel modello sia sotto forma lineare (ADVERT ) sia sotto forma quadratica (ADVERT2).

(7)

Example (Un modello economico di vendita)

1 L’effetto della spesa pubblicitaria sui ricavi è nullo se β3=0 e β4=0.

2 La spesa pubblicitaria avrà un effetto sui ricavi se β36= 0 o β46= 0 oppure se β36= 0 e β46= 0.

3 Per questo test, dunque, l’ipotesi nulla e l’ipotesi alternativa sono date da:

H0: β3=0, β4=0

H1: β36= 0 o β46= 0o entrambi sono non nulli.

(8)

Example (Un modello economico di vendita)

Rispetto all’ipotesi nulla H0: β3=0, β4=0, il modello che include tutte le variabili è detto modello non vincolato.

I vincoli o restrizioni contenuti nell’ipotesi nulla non sono stati imposti in quel modello.

Il caso opposto è quello del modello vincolato, ottenuto assumendo che i vincoli sui parametri descritti in H0siano veri.

(9)

Example (Un modello economico di vendita)

Se H0è vera, β3=0 e β4=0, e ADVERT e ADVERT2 vengono eliminate dal modello

SALES = β1+ β2PRICE + e.

Il test F dell’ipotesi H0: β3=0, β4=0 si basa sul

confronto della somma dei quadrati degli errori (la somma dei quadrati dei residui dei minimi quadrati) del modello non vincolato in e di quello vincolato.

Per indicare queste due quantità useremo rispettivamente gli acronimi SQRNV e SQRV.

(10)

La statistica F determina che cosa costituisca una riduzione grande o una riduzione piccola della somma dei quadrati dei residui

F = (SQRV − SQRNV)/J SQRNV/(n − K )

dove J è il numero di vincoli, n è il numero di osservazioni e K il numero di coefficienti nel modello non vincolato.

(11)

Se l’ipotesi nulla è vera, la statistica F ha una distribuzione chiamata F con J gdl al numeratore e n − K gdl al

denominatore.

Se l’ipotesi nulla non è vera, la differenza fra SQRNV e SQRV è grande.

Il che implica che i vincoli imposti dall’ipotesi nulla sul modello riducono in maniera significativa la sua capacità di adattarsi ai dati.

Un valore elevato di (SQRNV− SQRV)significa che il valore della statistica test tende ad essere grande.

Di conseguenza rifiutiamo la nulla se la statistica F è troppo elevata.

(12)

Example (Un modello economico di vendita) La procedura del test F nel nostro caso è:

Specificare le ipotesi nulla e alternativa: la nulla congiunta è H0: β3=0, β4=0. L’alternativa è

H1: β36= 0 o β46= 0 o entrambi non nulli.

Specificare la statistica test e la sua distribuzione se l’ipotesi nulla è vera: avere due vincoli in H0, significa J = 2, inoltre n = 75

F = (SQRV − SQRNV)/2

SQRNV/(75 − 4) ∼ F2,71

(13)

Example (Un modello economico di vendita)

Fissare il livello di significatività e individuare la regione di rifiuto

Calcolare il valore campionario della statistica test e, volendo, il p-value

F = (SQRV − SQRNV)/2

SQRNV/(75 − 4) = (1896.391 − 1532.084)/2 1532.084/(75 − 4)

=8.44 e il p-value

p = P(F2,71 >8.44) = 0.0005.

(14)

Example (Un modello economico di vendita) Formulare la conclusione: Dato che

F = 8.44 > Fc =3.126, rifiutiamo l’ipotesi nulla che sia β3=0 sia β4=0, e concludiamo che almeno uno dei due o entrambi siano diversi da zero. La spesa pubblicitaria ha quindi un effetto significativo sui ricavi.

(15)

Consideriamo nuovamente la regressione multipla generale con K − 1 variabili esplicative e K parametri ignoti

y = β1+ β2x2+ β3x3+ · · · + βKxK +e.

Per esaminare se la spiegazione fornita da questo modello è significativa consideriamo le ipotesi nulla e alternativa seguenti:

H0: β2=0, β3=0, . . . , βK =0

H1:almeno uno dei parametri è βk 6= 0, k = 2, 3, . . . , K .

(16)

Dato che stiamo verificando se la spiegazione fornita da questo modello è significativa, il test F è talvolta chiamato test di significatività complessiva del modello di regressione.

Dato che la distribuzione t può essere usata solo per verificare una singola ipotesi nulla, per testare l’ipotesi nulla congiunta usiamo il test F .

(17)

Il modello non vincolato è

y = β1+ β2x2+ β3x3+ · · · + βKxK +e.

Il modello vincolato, che assume validità sotto l’ipotesi nulla, diventa:

y = β1+e.

(18)

In questo modello vincolato lo stimatore dei minimi quadrati di β1è dato da:

βe1= 1 n

n

X

i=1

yi = ¯y .

La somma vincolata dei quadrati dei residui è:

SQRV =

n

X

i=1

(yi − eβ1)2=

n

X

i=1

(yi− ¯y )2=SQT .

(19)

Dunque, per verificare la significatività globale di un modello, ma non in generale, la statistica test F può essere modificata e riscritta come:

F = (SQRV − SQRNV)/J

SQRNV/(n − K ) = (SQT − SQRNV)/(K − 1) SQRNV/(n − K ) Dividendo numeratore e denominatore per SQT:

F = (SQRV − SQRNV)/J

SQRNV/(n − K ) = (1 − (1 − RNV2 ))/(K − 1) (1 − RNV2 )/(n − K )

= RNV2 /(K − 1) (1 − R2NV)/(n − K )

(20)

Example (Un modello economico di vendita) Nel caso della regressione dei ricavi:

testiamo H0: β2=0, β3=0, β4=0 contro H1:almeno uno tra β2, β3e β4è diverso da zero.

se H0è vera

F = (SQT − SQRNV)/(4 − 1)

SQRNV/(75 − 4) ∼ F3,71.

Per un livello di significatività del 5%, il valore critico della statistica F con (3, 71) gdl è Fc =2.734. Dunque,

rifiutiamo H0se F ≥ 2.734.

(21)

Example (Un modello economico di vendita) Nel caso della regressione dei ricavi:

Le somme dei quadrati rilevanti sono SQT = 3115.482 e SQR = 1532.084, alle quali corrisponde un F e un p-value rispettivamente di

F = 24.459 e p = P(F ≥ 24.459) = 0.0000.

Dato che 24.459 > 2.734, rifiutiamo H0e concludiamo che la relazione stimata è significativa.

Si noti che questa conclusione è coerente con i risultati che si otterrebbero usando test t separati per verificare la

significatività di ciascuno dei coefficienti.

(22)

Example (Un modello economico di vendita)

Abbiamo usato un test F per verificare l’ipotesi nulla β3=0 e β4=0 nel modello:

SALES = β1+ β2PRICE + β3ADVERT + β4ADVERT2+e Supponiamo ora di voler verificare se PRICE abbia un qualche effetto su SALES

H0: β2=0, H0: β26= 0.

In questo caso il modello vincolato è

SALES = β1+ β3ADVERT + β4ADVERT2+e

(23)

Example (Un modello economico di vendita) La statistica test F vale:

F = (SQRV − SQRNV)/J

SQRNV/(n − K ) = (2683.411 − 1532.084)/1 1532.084/(75 − 4)

=53.355.

Il valore critico al 5% è Fc =F (0.95; 1.71) = 3.976.

Di conseguenza, rifiutiamo H0: β2=0

(24)

Example (Un modello economico di vendita) Consideriamo nuovamente il nostro modello:

SALES = 109.72

(6.80) − 7.640

(1.046)PRICE + 12.151

(3.556) ADVERT

− 2.768

(0.941)ADVERT2.

Il valore del test t per verificare H0 : β2=0 contro H1: β26= 0 è t = 7.640/1.045939 = 7.30444.

Il suo quadrato è t2= (7.30444)2=53.355, identico al valore del test F calcolato in precedenza.

(25)

Possiamo riepilogare gli elementi di un test F .

L’ipotesi nulla consiste di uno o più vincoli di uguaglianza sui parametri βk del modello.

L’ipotesi alternativa afferma che una o più delle uguaglianze nell’ipotesi nulla non è vera.

Se l’ipotesi nulla è vera, F ha distribuzione F con J gdl al numeratore e n − K gdl al denominatore.

Quando verifichiamo un’ipotesi nulla semplice, cioè con un unico vincolo (J = 1), si può usare indifferentemente la procedura del test t o quella del test F , esse sono

equivalenti. In pratica, il test F è normalmente riservato a ipotesi congiunte.

(26)

Fino a questo punto le congetture specificate nell’ipotesi nulla affermavano che il valore di alcuni parametri fosse uguale a zero.

Il test F può essere usato anche per ipotesi molto più generali.

È possibile verificare un numero qualsiasi di congetture (≤ K ) consistenti in ipotesi lineari con il segno di uguaglianza.

(27)

Example (Un modello economico di vendita)

Per un esempio, torniamo al caso della spesa pubblicitaria ottimale:

β3+2β4ADVERT0=1

Supponiamo che ADVERT0= $1900. Si tratta di un livello di spesa ottimale? La nulla e l’alternativa per questo test sono

 H0: β3+2β4× 1.9 = 1 H1: β3+2β4× 1.9 6= 1 =⇒

 H0: β3+3.8β4=1 H1: β3+3.8β46= 1

(28)

Example (Un modello economico di vendita)

Si noti che sotto H0, β3=1 − 3.8β4. Sostituendo questo vincolo nel modello, otteniamo:

SALES = β1+ β2PRICE + (1 − 3.8β4)ADVERT + β4ADVERT2 +e

e, riformulando l’equazione in una forma più adatta per la stima dei parametri,

(SALES − ADVERT ) = β1+ β2PRICE

+ β4(ADVERT2− 3.8ADVERT ) + e

(29)

Example (Un modello economico di vendita) Il valore campionario della statistica F è:

F = (1552.286 − 1532.084)/1

1532.084/71 =0.9362 Per α = 0.05, il valore critico è Fc =3.976. Dato che F = 0.9362 < Fc =3.976, non rifiutiamo H0.

Concludiamo dunque che la congettura che una spesa pubblicitaria di $1900 al mese sia ottimale è coerente con i dati.

(30)

Example (Un modello economico di vendita)

Dato che H0è costituita da un’ipotesi semplice (una sola congettura), possiamo usare il test t.

Il valore empirico della statistica è t = 0.9676 F = 0.9362 è uguale a t2= (0.9676)2. Troverete che anche i p-value sono identici:

p = P(F1,71>0.9362) = P(t71>0.9362) +P(t71 < −0.9362) = 0.3365.

(31)

Example (Un modello economico di vendita) Consideriamo le ipotesi:

H0: β3+3.8β4≤ 1, H1: β3+3.8β4>1 In questo caso non possiamo più usare il test F

Dato che F = t2, il test F non può distinguere fra coda sinistra e coda destra, come richiesto dal test ad una coda.

Se consideriamo ipotesi alternative con segni di < o >, dunque, dobbiamo necessariamente ricorrere alla distribuzione t.

(32)

La maggior parte dei programmi offrono i comandi che, una volta specificata l’ipotesi nulla, calcolano

automaticamente i test t e F e i p-value corrispondenti.

Questi test appartengono a una classe di procedure chiamate test di Wald.

(33)

Supponiamo che, dato il nostro modello e in base alle stime dei parametri, la nostra congettura sia che:

E [SALES] = β1+ β2PRICE + β3ADVERT + β4ADVERT2

= β1+ β2× 6 + β3× 1.9 + β4× 1.92=80

Per verificarlo, formuliamo l’ipotesi nulla congiunta:

H0: β3+3.8β4=1 e β1+6β2+1.9β3+3.61β4=80.

Dato che vi sono J = 2 vincoli da verificare congiuntamente, usiamo un test F .

Un test t non sarebbe adatto.

(34)

In molte situazioni esistono informazioni aggiuntive oltre a quelle contenute nelle osservazioni campionarie .

Questa informazione extracampionaria può essere di varia natura e avere origini diverse, come la teoria economica o l’esperienza.

Quando disponibile, e se corretta, sembra ragionevole pensare che dovremmo trovare un modo di usarla.

(35)

Example (Stima della domanda di birra)

Consideriamo la forma funzionale log-log per stimare la domanda di birra:

log(Q) = β1+ β2log(PB) + β3log(PL) + β4log(PR) + β5log(I) Questo modello è conveniente perché non consente di lavorare con valori negativi delle variabili prezzi, quantità e reddito e perché i coefficienti β2, β3, β4e β5sono interpretabili come elasticità.

(36)

Example (Stima della domanda di birra)

Un’importante informazione non campionaria consiste nel fatto che se tutti i prezzi e il reddito crescono della stessa

proporzione, ci aspettiamo che la quantità domandata non vari.

Per esempio, se tutti i prezzi e il reddito raddoppiano la quantità di birra consumata dovrebbe rimanere costante.

Questa ipotesi equivale ad assumere che gli agenti economici, i consumatori in questo caso, non soffrono di illusione monetaria.

Ovvero, che la funzione di domanda sia omogenea di grado zero nei prezzi e nel reddito.

(37)

Example (Stima della domanda di birra)

Avere tutti i prezzi e il reddito che cambiano dello stesso fattore equivale a moltiplicare tutti i prezzi e il reddito per la stessa costante, diciamo λ:

log(Q) = β1+ β2log(λPB) + β3log(λPL) + β4log(λPR) + β5log(λI)

= β1+ β2log(PB) + β3log(PL) + β4log(PR) + β5log(I) + (β2+ β3+ β4+ β5)log(λ)

(38)

Example (Stima della domanda di birra)

Affinché log(Q) resti invariata a fronte dello stesso aumento proporzionale λ nei prezzi e nel reddito, deve necessariamente essere vero che:

β2+ β3+ β4+ β5=0

Questa restrizione è chiamata informazione non campionaria.

(39)

Example (Stima della domanda di birra)

Per vedere come ottenere stime che rispettino questa restrizione, iniziamo dal modello di regressione multipla:

log(Q) = β1+ β2log(PB) + β3log(PL) + β4log(PR) + β5log(I) +e

Per introdurre l’informazione extracampionaria, risolviamo il vincolo rispetto ad uno dei parametri, ad esempio β4:

β4= −β2− β3− β5.

(40)

Example (Stima della domanda di birra)

Sostituendo l’espressione nel modello otteniamo:

log(Q) = β1+ β2log(PB) + β3log(PL) + β4log(PR) + β5log(I) +e

= β1+ β2(log(PB) − log(PR)) + β3(log(PL) − log(PR)) + β5(log(I) − log(PR)) + e

= β1+ β2log PB

PR + β3log PL

PR + β5log I PR +e.

(41)

Example (Stima della domanda di birra)

Per ottenere stime dei minimi quadrati che soddisfino la restrizione sui parametri, dette stime dei minimi quadrati vincolati, applichiamo la procedura di stima dei minimi quadrati direttamente al modello vincolato:

log( bQ) = −4.798 − 1.2994

(0.166) logPB

PR +0.1868

(0.284) log PL PR +0.9458

(0.427) log I PR.

(42)

Example (Stima della domanda di birra)

Indichiamo con eβ1, eβ2, eβ3e eβ5le stime dei minimi quadrati vincolati.

Per ottenere una stima di β4 βe4= −( eβ2+ eβ3+ eβ5)

= −(−1.2994 + 0.1868 + 0.9458) = 0.1668.

Usando il vincolo all’interno del modello, abbiamo imposto che le stime soddisfino la restrizione:

βe4+ eβ2+ eβ3+ eβ5=0.

(43)

Quali sono le proprietà dello stimatore dei minimi quadrati vincolati?

Lo stimatore dei minimi quadrati vincolati è distorto E [ eβk] 6= βk

a meno che le restrizioni imposte non siano vere.

La varianza dello stimatore dei minimi quadrati vincolati è inferiore a quella dello stimatore dei minimi quadrati, indipendentemente dal fatto che i vincoli siano veri o meno.

(44)

Finora, abbiamo considerato come dati la forma funzionale e le variabili che entrano nell’equazione di stima.

In realtà, in qualsiasi analisi econometrica, la scelta del modello, o specificazione, rappresenta uno dei primi passi.

Tre componenti cruciali della scelta del modello sono:

scelta della forma funzionale

scelta delle variabili esplicative da includere

verifica della validità delle ipotesi del modello di regressione multipla

Quali sono le conseguenze dell’aver scelto un modello sbagliato?

Esistono strumenti in grado di valutare se un modello è adeguato?

(45)

Può accadere che il modello scelto ometta variabili esplicative importanti.

Il modello economico di riferimento potrebbe aver trascurato un fattore esplicativo rilevante, oppure la

mancanza di dati potrebbe indurci a scartare una variabile nonostante la teoria economica ne sottolinei l’importanza.

(46)

Example (Reddito familiare e educazione)

Consideriamo un modello di reddito (FAMINC) in relazione al livello di educazione di marito (HEDU) e moglie (WEDU)

FAMINC = − 5534\

(11230)+ 3132

(803)∗∗∗

HEDU + 4523

(1066)∗∗∗

WEDU.

Se omettiamo la variabile WEDU otteniamo FAMINC = − 26191\

(8541)∗∗∗+ 5155

(658)∗∗∗HEDU.

(47)

Example (Reddito familiare e educazione)

Rispetto primo modello, l’omissione di WEDU fa sì che venga sovrastimato di circa $2000 l’effetto di un anno di istruzione in più del marito (HEDU).

Questo cambiamento è una conseguenza tipica dell’omissione di una variabile esplicativa rilevante.

L’omissione di una variabile esplicativa rilevante (per rilevante intendiamo il cui coefficiente sia diverso da zero) genera uno stimatore distorto.

Questa distorsione, di conseguenza, è dettadistorsione da variabile omessa.

(48)

Per derivare un’espressione generale di questa distorsione, riscriviamo il modello generale come:

y = β1+ β2x2+ β3x3+e.

L’omissione di x3dall’equazione equivale a imporre la restrizione (non vera) β3=0.

Quindi il problema delle variabili omesse può essere visto come un analogo dell’imposizione di un vincolo errato sui parametri.

(49)

Abbiamo già visto che le conseguenze di un vincolo errato sono

Stime distorte dei coefficienti Varianza inferiore dei coefficienti

Se indichiamo con eβ2lo stimatore di β2quando x3è omesso, si può dimostrare che la distorsione è:

Bias[ eβ2] =E [ eβ2] − β2= β3Cov[xˆ 2,x3] Var[xˆ 2] .

Se conosciamo il segno di β3e della covarianza fra x2e x3, possiamo dedurre la direzione della distorsione.

(50)

Example (Reddito familiare e educazione)

(51)

Example (Reddito familiare e educazione) Dalla matrice di correlazione notiamo che

β3dato che l’istruzione della moglie ha un effetto positivo sul reddito familiare.

Cov[xd 2,x3] >0, perché i livelli di istruzione di moglie e marito sono correlati positivamente.

La distorsione è dunque positiva.

(52)

Esistono altre variabili che potremmo includere come fattori esplicativi del reddito familiare. Consideriamo il modello:

FAMINC = − 7755\

(11163)+ 3212

(797)∗∗∗HEDU + 4777

(1061)∗∗∗WEDU

− 14311

(5004)∗∗∗KL6.

Si noti che il reddito familiare tende a diminuire al crescere del numero di bambini in famiglia (KL6), probabilmente perché sono minori le ore lavorate.

Si noti anche che i coefficienti stimati di HEDU e WEDU non sono cambiati molto.

Questo perché KL6 non è molto correlata con le variabili di

(53)

Le conseguenze dell’omissione di variabili rilevanti potrebbero indurvi a pensare che includere nel modello quante più variabili esplicative possibile sia una buona strategia.

In realtà questo approccio non solo complica inutilmente il modello, ma può aumentare le varianze delle stime a causa della presenza divariabili irrilevanti.

(54)

Example (Reddito familiare e educazione) Consideriamo

FAMINC = − 7759\

(11195)+ 3340

(1250)∗∗∗

HEDU + 5869

(2278)∗∗

WEDU

− 14200

(5044)∗∗∗KL6 + 889

(2242)X5− 1067

(1982)X6.

L’inclusione di variabili irrilevanti (p − value > 0.05), altamente correlate con HEDU e WEDU e tra di loro, ha ridotto la

precisione delle stime dei coefficienti di tutti gli altri regressori nell’equazione.

(55)

Alcuni dei punti da tenere a mente per decidere sulla specificazione di un modello sono:

scegliere le variabili sulla base della comprensione teorica e complessiva della relazione,

se i coefficienti stimati hanno segno inatteso o dimensione irrealistica, il motivo potrebbe essere un errore di

specificazione, come l’omissione di una variabile importante,

un metodo per valutare se una variabile o un gruppo di variabili debba essere incluso in un’equazione consiste nell’effettuare test di significatività (t per ipotesi semplici, F per ipotesi congiunte),

(56)

Alcuni dei punti da tenere a mente per decidere sulla specificazione di un modello sono:

criteri di selezione del modello, come l’R2corretto, il criterio di informazione di Akaike (AIC) e il criterio di Schwarz (SC), detto anche criterio di informazione bayesiano (BIC),

l’adeguatezza di un modello può comunque essere sottoposta a verifica usando un test generale di specificazione chiamato RESET.

(57)

In questo paragrafo consideriamo i tre principali criteri di selezione del modello:

1 R2

2 AIC

3 BIC

Un aspetto comune a questi criteri è di essere adatti a confrontare esclusivamente modelli con la stessa variabile dipendente e non modelli con variabili dipendenti diverse come y and log(y )

(58)

Dato che avere un modello che interpoli bene i dati è un obiettivo importante, potremmo immaginare di scegliere il modello con l’R2più elevato.

Il problema sta nel fatto che l’R2può essere reso artificialmente elevato aggiungendo sempre più variabili, anche se queste non hanno alcune giustificazione.

1 Da un punto di vista algebrico, al crescere del numero delle variabili esplicative la somma dei quadrati dei residui SQR diminuisce e di conseguenza l’R2aumenta

2 Se il modello contiene n − 1 variabili esplicative, allora R2=1.

(59)

Per aggirare questo problema è stata suggerita una misura alternativa della bontà di adattamento, chiamata R2corretto, e indicata con ¯R2.

La sua espressione è:

2=1 − SQR/(n − K )

SQT /(n − 1) =1 − SQR SQT

(n − 1) (n − K )

=1 − (1 − R2)(n − 1) (n − K ).

(60)

Massimizzare l’ ¯R2equivale a minimizzare l’SQR, con

l’aggiuntà di una penalità che cresce al crescere del numero di variabili esplicative.

La logica dei criteri di informazione è simile. Il criterio di informazione di Akaike (AIC) è definite da

AIC = log SQR n

 +2K

n .

(61)

Il criterio di Schwarz (SC), chiamato anche criterio di informazione bayesiano (BIC) è definito da:

SC = log SQR n



+K log(n)

n .

In entrambi i casi, quando si aggiunge un regressore il primo termine diminuisce (SQR ↓), ma il secondo aumenta (K ↑).

Dato che log(n) > 2 per n > 7, in campioni numerosi SC > AIC.

Usando questi criteri, preferiamo il modello con SC o AIC minimo.

(62)

Example (Reddito familiare e educazione)

R2aumenta (non diminuisce) con K .

2aumenta se si aggiungono esplicative rilevanti, ma diminuisce se si includono regressori irrilevanti.

In questo esempio, AIC e SC sono minimi quando ¯R2è massimo.

(63)

Un modello potrebbe essere mal specificato per le seguenti cause.

Omissione di variabili esplicative importanti.

Inclusione di variabili esplicative irrilevanti.

Scelta di una forma funzionale sbagliata.

Violazione delle ipotesi della regressione multipla.

(64)

Il test RESET (da REgression Specification Error Test) è stato sviluppato per individuare la presenza di variabili omesse e di una forma funzionale errata.

Supponiamo di avere il seguente modello di regressione:

y = β1+ β2x2+ β3x3+e Definiamo i valori previsti di y come:

y = bb β1+ bβ2x2+ bβ3x3.

(65)

Consideriamo ora i due modelli

y = β1+ β2x2+ β3x3+ γ1by2+e e

y = β1+ β2x2+ β3x3+ γ1yb2+ γ2yb3+e.

(66)

Nel primo modello possiamo verificare la presenza di errori di specificazione tramite un test in cui la nulla è del tipo

H0: γ1=0 rispetto all’alternativa H1: γ16= 0.

Nel secondo, possiamo considerare H0: γ1= γ2=0 rispetto all’alternativa H1: γ16= 0 e/o γ26= 0.

Nel primo caso useremo un test t o F . Nel secondo caso è necessario usare un test F .

Se rifiutiamo H0, il modello è inadeguato e può essere migliorato.

Se non rifiutiamo H0il test non è stato in grado di rilevare errori di specificazione.

(67)

Example (Reddito familiare e educazione)

Applicando le due forme del test RESET all’equazione del reddito familiare, otteniamo:

H0: γ1=0, F = 5.984, p − value = 0.015 H0: γ1= γ2=0, F = 3123, p − value = 0.045 In entrambi i casi l’ipotesi nulla di corretta specificazione è rifiutata ad un livello di significatività del 5%.

(68)

1 La maggior parte dei dati economici sono di tipo non sperimentale.

1 La maggior parte dei dati economici sono di tipo non sperimentale.

2 Quando i dati sono il risultato di un esperimento non controllato, può accadere che molte variabili economiche tendano a muoversi tutte nella stessa direzione in maniera sistematica.

1 Queste variabili sono dette collineari e il problema è chiamato collinearità.

2 In questo caso non vi è garanzia che i dati siano ricchi di informazione né che sia possibile individuare la relazione economica o i parametri d’interesse.

(69)

Consideriamo il modello:

y = β1+ β2x2+ β3x3+e.

Sappiamo che la varianza dello stimatore dei minimi quadrati di β2è:

Var[ bβ2] = σ2 (1 − r232)Pn

i=1(xi2− ¯x2)2.

(70)

Esiste collinearità esatta quando x2e x3sono

perfettamente correlate (r23 = ±1), in questo caso Var[ bβ2] diventa infinita.

Analogamente, se x2non presenta nessuna variazione, Pn

i=1(xi2− ¯x2)2=0 e Var[ bβ2]è nuovamente infinita.

In questo caso, x2è perfettamente collineare col termine costante della regressione.

(71)

In generale, se esiste una o più di una relazione lineare esatta fra le variabili esplicative, siamo di fronte a un caso di collinearità esatta.

In questa situazione lo stimatore dei minimi quadrati non è definito.

Non possiamo ottenere stime di βk usando il principio dei minimi quadrati.

(72)

Gli effetti di questa informazione poco precisa possono essere riassunti come segue.

Quando gli standard error dello stimatore sono elevati, è probabile che i classici t test conducano alla conclusione che le stime dei parametri non sono significativamente diverse da zero. Ciò nonostante i valori dell’R2o dell’F test potrebbero essere alti.

Gli stimatori potrebbero essere molto sensibili all’aggiunta o all’esclusione di poche osservazioni, oppure

all’eliminazione di una variabile apparentemente poco significativa.

Sono comunque possibili previsioni accurate se per le osservazioni al di fuori del campione di stima la relazione collineare resta stabile.

(73)

Example (Consumo di carburante) Consideriamo le seguenti variabili

MPG: miglia per gallone di carburante CYL: numero di cilindri

ENG: cilindrata

WGT : peso del veicolo

(74)

Example (Consumo di carburante) La regressione di MPG su CYL produce:

MPG = 42.9[

(0.83)∗∗∗− 3.558

(0.15)∗∗∗CYL

Osserviamo cosa accade se aggiungiamo ENG e WGT MPG = 44.4[

(1.50)∗∗∗− 0.413

(0.413)CYL − 0.127

(0.083)ENG − 0.0057

(0.0007)∗∗∗WGT .

(75)

Un modo semplice di individuare la presenza di relazioni collineari consiste nell’usare i coefficienti di correlazione fra coppie di variabili esplicative.

Queste correlazioni campionarie sono misure descrittive di associazione lineare.

Nei casi in cui le relazioni lineari coinvolgono più di due esplicative, tuttavia, la presenza di collinearità può non essere rilevata adeguatamente dall’esame delle correlazioni a coppie.

(76)

In queste situazioni, una procedura alternativa è quella di stimare una regressione ausiliare.

Cioè un regressione in cui una delle esplicative è spiegata da tutte le altre indipendenti del modello originario.

Per esempio, una regressione ausiliare per x2è:

x2=a1x 1 + a3x3+ · · · +aKxK +error . Un R2elevato in questo modello artificiale, diciamo superiore a 0.80, segnala che una grossa porzione della variazione in x2è spiegata dalla variazione nelle altre variabili esplicative.

(77)

Il problema della collinearità sta nel fatto che i dati non contengono sufficiente informazione sugli effetti individuali delle variabili esplicative per permetterci di stimare con precisione tutti i parametri del modello statistico.

Di conseguenza, una soluzione consiste nell’ottenere più informazione e includerla nell’analisi.

Un primo modo è rappresentato da dati di qualità migliore (più facile a dirsi che a farsi).

Un secondo modo consiste nell’introdurre informazione non campionaria sotto forma di vincoli sui parametri (con dei rischi se le restrizioni non sono esattamente vere).

Un terzo modo consiste nell’usare dati panel (se sono disponibili).

(78)

Consideriamo il modello:

y = β1+ β2x2+ β3x3+e.

Il problema consiste nel prevedere il valore della variabile dipendente y0, dato da:

y0= β1+ β2x02+ β3x03+e0. Il miglior predittore lineare e corretto di y0è:

by0= bβ1+ bβ2x02+ bβ3x03.

(79)

La varianza dell’errore di previsione ha due componenti:

1 La prima dipende dalla varianza di bβ1, bβ2e bβ3.

2 La seconda dall’errore casuale ignoto e0.

(80)

La varianza di f = y0−by0, è data da:

Var[f ] = Var h

1+ β2x02+ β3x03+e0) − ( bβ1+ bβ2x02+ bβ3x03) i

= Varh

e0− ( bβ1+ bβ2x02+ bβ3x03)i

= Var[e0] + Var[ bβ1] +x022 Var[ bβ2] +x032 Var[ bβ3]

+2x02Cov[ bβ1, bβ2] +2x03Cov[ bβ1, bβ3] +2x02x03Cov[ bβ2, bβ3].

(81)

Example (Un modello economico di vendita)

Come esempio, consideriamo l’intervallo di previsione di SALES con PRICE0=6, ADVERT0=1.9 e ADVERT02=3.61:

SALES\ 0=109.72 − 7.64PRICE0+12.15ADVERT0

− 2.77ADVERT02

=109.72 − 7.64 × 6 + 12.15 × 1.9 − 2.77 × 3.61

=76.974.

I ricavi previsti ammontano a $76974.

(82)

Example (Un modello economico di vendita)

Quindi la stima della varianza dell’errore di previsione è dVar[f ] = 22.42

con standard error se(f ) =

q

dVar[f ] =

22.42 = 4.7351.

(83)

Example (Un modello economico di vendita) L’intervallo di previsione al 95% è dato da:

[76.974 ± 1.9939 × 4.7351] = [67.533, 86.415]

Secondo questa previsione, lo scenario di prezzo e di spesa pubblicitaria considerate produrrà, con un livello di confidenza del 95%, un valore di SALES compreso fra $67533 e $86415.

(84)

Previsione puntuale e stima puntuale coincidono SALES\ 0=E [ \SALES0] =76.974 Tuttavia

se([ \SALES0]) <se(f ) = se(SALES0− \SALES0).

Inoltre

se([ \SALES0]) = q

dVar[f ] − σ2=√

22.42 − 21.58 = 0.92 Di conseguenza, una stima intervallare al 95% di E [ \SALES0]è:

[76.974 ± 1.9939 × 0.92] = [75.14, 78.80].

Riferimenti

Documenti correlati

Gli standard error robusti possono essere usati non solo come salvaguardia contro gli effetti dell’eteroschedasticità quando stimiamo con i minimi quadrati, ma sono utili anche

Il modello di regressione multipla.

WLS versus errori standard robusti a eteroschedasticit` a Se la forma funzionale della varianza di u i condizionata a X i fosse nota i WLS sono piu’ efficienti del OLS con

1) La assenza o la presenza degli effetti specifici temporali , che permettono la dicotomizzazione tra modelli di regressione one-way error component (i primi) e two-way

[r]

indipendente dalle X i , signi…ca che il modello è buono, nel senso che abbiamo sfruttato nel modo migliore le informazioni contenute nelle X i , senza ritrovarci parte di

•Modello di regressione lineare multipla avente come variabile risposta il rating e come variabili esplicative le variabili nutrizionali. Problema di interpolazione dei

• Un puntatore contiene l’indirizzo della locazione di memoria assegnata ad una variabile (che conterrà i valori di tale variabile).. • Si dice che il puntatore ‘punta’