Si vuole prevedere il valore di Yn+1

(1)

1

PROBLEMI DI PREVISIONE

Si vuole prevedere il valore di Y_n+1 per un insieme di valori X osservati.

Supponiamo però per X i valori

E’ possibile fare una previsione puntuale o stimare un intervallo di previsioni.

Utilizzando le proprietà BLUE di avremo il

PREVISORE PUNTUALE sarà BLUFF

Best Linear Unbiased Forecasting Function



¹ ₂_, _₁ ₃_, _₁ ^... _, _₁



 X _n X _n X_k _n C

 

^ ^^



 





















 



C Y

E

u C

u X

X Y

n

k n k

n n

k k n

n

1

1 1 1 1 1

1 1

, 1

, 2 2 1

1 ...



  ˆ

ˆ 1 C Y_n

ˆ

(2)

2

Per ottenere un intervallo di previsione è necessario individuare la distribuzione di

Quindi una stima intervallare con un livello fiduciario del 100(1-)% :

 

    

  

^C ^C

^

^X ^X

^

^C

C E

C C

E C

Var

C C

E

1 2

ˆ ˆ

 

 



 









 





 





















 



ⁿ ^k



^tⁿ ^k

e e

C X

X C

C C

C X

X C C

N C



 



 









 



2

1

2 1

ˆ ˆ ,

 





















 











2 2

1 2

ˆ ˆ

ˆ

t C

C t

C

C X

X C t

C

(3)

3

APPLICAZIONE

Voglio prevedere Y da X₀. Per calcolare l’intervallo devo determinare

Infatti .

u X

Y  ₁ ₂ 

 

 

 

²

 

²

2 0 0

2 1

0

2

2 1



 



 





 















 





X X

u

X u X

X C X

X X C

X C

X X

X X n

X

 

 

   

   

 

^





 

 



 



 

 



 



 







 









  



  



 



2 2

0 2

0 0

2

0 0

0 2

2 2

0 2

2 2 0

, 1 1

1 1 1

X X

n

X X

n X X

X X

X X n

X X X

n

X n

X

X X

X n

(4)

4

Lo standard error di Y⁰ sarà

A parità di dati osservati l’intervallo sarà tanto più largo quanto più X₀ è distante da

 _  ^ _ ^

  

_ _ ^





  ₂

2 0

2 2

2 0 0

2 2 1

X X X

X n X

n

nX X

X X

X



^^



 ⁰ ² ₂

0 ( )

) (

1 1 ˆ )

.(

. X X

X X

s n Y

e s

i

(5)

5

CENNI SULLE VARIABILI DUMMY (Variabili di comodo)

Fino ad ora abbiamo assunto che nella equazione generale Y = X + u

Le variabili X siano variabili cardinali date dalla teoria economica.

E’ possibile introdurre variabili cosiddette “di comodo” che riescano a rappresentare diversi

fattori :

– EFFETTI TEMPORALI – EFFETTI SPAZIALI

– VARIABILI QUALITATIVE

(6)

6

È possibile che un modello economico possa subire mutamenti strutturali :

FUNZIONE DI CONSUMO

Tempo di guerra Tempo di pace

Si ipotizza comunque che la propensione

marginale al consumo rimanga invariata in entrambi i periodi

u Y

C

u Y

C





















2 1



 

 Y C

(7)

7

Invece di considerare i due modelli separatamente (stime meno precise) vengono uniti in una sola

relazione

Dove X₁e X₂ sono variabili dummy :

La matrice  dei coefficienti sarà e la matrice dei dati

u Y

X X

C  ₁ ₁  ₂ ₂  



 



 

pace di

anni

guerra di

X anni

pace di

anni

guerra di

X anni

1 0 0

1

2 1

















 ₂¹

 



















Yn

Y Y Y

Y X

X X

1

0. 1. ..

0 0 .

1. 0. ..

1 0 .

1 1 .

0 . .

1 0

3 2 1

2 1

(8)

8

La trappola delle variabili di comodo

Quando utilizziamo le variabili dummy è necessariob fare attenzione a come viene costruito il modello, per non rendere la matrice

(X’X) singolare .

Infatti se nel modello precedente lasciavamo una

intercetta :

Abbiamo che le 4 colonne di X sono linearmente

dipendenti (X’X) non è invertibile

0 0

1 1

1

1 0

1. 0. 1. ..

1 1 0 .

1. 1. 0. ..

1 1 0 .

1 0 1 .

1. . . . 1

0 1

1 0 1

2 1

0

2 1

2 2 1

1 0

















































Y X

X X

Y Y Y

X

u Y

X X

C

n

 

^X ^rank



^X ^X



^k

rank   3

(9)

9

Volendo utilizzare una regressione con intercetta si utilizzerà così solo una dummy :

 = PMC in entrambi i periodi ₁ = ₁ = intercetta anni di guerra ₂ = ₁ + ₂ = intercetta anni di pace

₁ – ₂ = ₂ = differenza tra l’intercetta del

periodo guerra e pace

• Cambiamento di coefficiente angolare

₂ – ₁ = differenza propensione marginale al

consumo nei due periodi



 















pace di

anni

guerra di

X anni

u Y

X C

1 0

2

2 2 1

 



  





















u Y

C pace

di anni

u Y

C guerra

di X anni

u Y

X Y

C

2 2 1

2 1

1 0

(10)

10

APPLICAZIONE (p.255 Maddala)

Y = ₁ + ₂ SVA + u Y = km / litro

SVA = Stima Vita Auto in anni

W = peso in Kg

   

         

82 . 0

415 .

0 28

. 3 760

. 2 002

. 0 008 .

ˆ 22

1 0 1

0

74 . 0

693 .

0 952 .

ˆ 7

2

097 . 413 0

. 1 708

. 001 0

. 349 0

. 5

5 4

3 2

1

2

061 . 0 753

. 1













 





 



























R

D SVA A G

W S Y

diesel gas G D

automatico cambio

ndard sta

cambio S A

u D SVA

A G W S

Y

R

SVA Y

(11)

11

MULTICOLLINEARITA’

Quando tra due o più variabili esplicative vi è perfetta collinearità o multicollinearità, la matrice (X’X) non è più a rango pieno e le stime OLS non

possono essere calcolate.

Si può però facilmente fare una sostituzione di variabile

Es :

2 1

2

2 1

1 2 1

1 2

2 1

1

1 2

2 2 1

1















































































u X

X Y

X X

u X

X Y

(12)

12

Il problema della multicollinearità esiste quindi quando due o più regressori sono quasi-collineari

ovvero quando il coefficiente di correlazione tra i regressori è alto .

•MODELLO A 3 VARIABILI

 

  ^ ^

 

^^_











 

 







 















 































  



2 2 3

2

3 2 2

3 2

3 2 2

3 2

2

2 2 1

1

3 2

3 3 2

2

3 3 2

2 1

ˆ ˆ ˆ ˆ

X X

X

X X X

X

X X V

y X X

X

u u X

X Y

u X

X Y

(13)

13

È facile vedere che valori molto alti di rendono le stime OLS molto imprecise.

Inoltre piccole variazioni nella matrice dei dati provocano o possono provocare grandi variazioni

nella stima dei parametri.

  _ _

 

  _ _



      



   



 





 



 

 

 



2 23 2

3 2 3

2 23 2

2 2

2 3 2

2

2 3 2 2

3 2

2 2 3 2

2

2 3 2

2 3 2 2

3 2

2

2 3 2

2

ˆ 1

1 ˆ

r V X

r X

X X

X X X

X

X X X

X V X

2

r23

(14)

14

ESEMPIO-APPLICAZIONE:

instabilità delle stime

Dati :

u u

X X

Y  ₂ ₂ ₃ ₃  

  

 



263 350 113

150 200

3 2 2

3

3 2 2

2

i i

i i i

Y X

Y X X

X X X

 

100 1 100 22500

22600

52500 52600

ˆ

100 1 100 22500

22600

39450 39550

150 113

200

263 150

350 113

ˆ

3

2

2 3 2 2

3 2

2

3 3

2 2

2 3 2



 

 





 

 









 

 



      

X X X

X

Y X X

X Y

X X

 

995 . 113 0

200 150²

2 3 2

2

2 3 2 2

3

2 

 



  

X X

X r_X _X X

(15)

15

Togliendo solo una osservazione:

Si modificano molto le stime 87 3 261 149

112 199

5 . 347 149

5 . 261 ˆ 199

2 1 87

5 . 43 149

112 199

5 . 261 149

5 . 347 ˆ 112

5 . 261

5 . 327 112

149 199

3 2 2 2

3 2 2

3

3 2 2

2



 





 





 





 







 

Y X

Y X X

X X X

(16)

16

ETEROSCHEDASTICITA’

Avevamo ipotizzato che

tale assunzione è in molte situazioni non valida

dobbiamo quindi riformulare il problema nella forma

 

^uu ^I

E '   ²

 

^ ^

 ' 2

0

 uu

E u E

(17)

17

Sono ancora corretti ma non efficienti (ovvero non sono necessariamente a varianza minima)

 

 

^^ ^^^^^

^

^

^

^

^{ }

^ ^



 





u E X X

X E

u X

y

y X X

X

1 1

ˆ ˆ

  ^ ^ ^{  } ^

 

¹

 

¹ ²

1

1 '

ˆ







 



 



 

X X X

X X

X

X X X uu E X X

X V

(18)

18

GOLDFELD – QUANDT TEST

- Si ordinano le osservazioni secondo la variabile X_j che si ipotizza sia la causa dell’eteroschedasticità

- Si divide il campione in tre parti di numerosità n₁ n₂ n₃ .

- Dopo la stima OLS nei tre sottocampioni si calcola e

Sotto H₀ : omoschedasticità : (il valore di F è piccolo)

k n k

Fn

e e

e F e

e e e

e



 

 



3

1 ,

3 3

1 1

3 3 1

1

H0

Rifiuto F

F_empirico  _teorico 

(19)

19

RIMEDI

1. _i i = 1 , … , n siano valori noti.

si applicano i MINIMI QUADRATI PESATI (WLS)

ovvero si applica OLS al modello trasformato

Ovvero

Dove

2. relazione tra la componente stocastica e uno dei regressori

Es.

i i i

i ij ij

i i i

x x y y



 

 

 

 ^* ^*

* ; ;

*

* 2 2

* 1 1

* _i _i ... _k _ik _i

i x x x

y       

 

^* ¹₂

^{ }

₂² ^ ¹



 

 

 



 







 



i i i

i i

i Var i Var

Var



2 2 2

2

1 ...

i i

i ik

k i

i

x C Var

x x

y



















(20)

20

Trasformiamo il modello

Dove

Applico OLS

2 2

1 2

2

* 2

*

1 ...

;

i i i

k ik i

i i

i i i

i ij ij

i i i

x x

x y

x x

x x x

y y

 















 





 

^Var

^{ }

^C

x Var x

Var _i

i i

i

i    



 



  

 ₂

2 2

* 1

(21)

21

ESERCIZIO

La stima di un modello lineare sulla base dei valori del Reddito e del Consumo di 30 famiglie

americane fornisce i seguenti valori :

La stima dello stesso modello sulle prime 12 e sulle ultime 12 osservazioni fornisce i seguenti

valori:

Verificare l’ipotesi di presenza di

eteroschedasticità ed in caso affermativo indicare la procedura di correzione.

C’è presenza di eteroschedasticità

  0.788 0.97

ˆ 1480 ²

37 . 29 29

.

3  

 y R

C

   

3344000 71

. 0 747

. 0 7

. ˆ 2306

1069000 91

. 0 837

. 0 7

. ˆ 846

2 00

. 79 5

. 0

2 91

. 74 9

. 0











RSS R y

C

RSS R y

C

83 . 1 12

. 1069000 3

3344000

10 ,

10 



 F

F

(22)

22

AUTOCORRELAZIONE DEI RESIDUI Molto spesso la assunzione

cade perché gli errori sono autocorrelati, effetto molto usuale nelle serie storiche.

Per illustrare il problema consideriamo una semplice relazione a due variabili

t t

t

t t

t

u u

u X

y



















1

 











 













 0 0

0 0

1

2

s E s

E

s t t t



_t _t



_t

t t

t

u u u























1 2

1

 

uu I E '   ²

(23)

23

0 0

0



^ ^



























0 :

2 2

1 ...

r

r t r

t t

t

 

^



^ ^

 

^ ^ ^

0 :

0

r

r t r

t E

u E

       

   

 

 

2 2

2

4 2

2

2 1

2 2

1

2 2 4

2 1 2

2 2

1

...

1

...

2

...

2 2

...

u

t t

t t t

t

t t

E

E E

E u

E



 



 























































(24)

24

     ^ ^ 

 

2 2

2

4 2

2

2 5 2

3 2

2 1

2 2

1 1

1

...

1

...

u

t t

t u E

u E





 



 









































































   

 

2 2 2

2 2

2 6 2

4 2

2

4 2 3

2

3 3 2

2 1

2

1

...

u

t t

t

t t

t

t u E

u E





 



 























 

















































 







^u_t ^u_t _s



^s _u²

E _   

 























 



1 .

. .

.

. 1

2 1

2

2 1 2

2

n n

V u

u u E

(25)

25

CONSEGUENZE 1. Stime OLS di  corrette

2. Varianze di molto grandi ovvero 3. Sottostima di tali varianze

inefficienti

4. Conseguente non validità dei test t ed F Infatti si può dimostrare che

Solo se ² = 0

Con N=20 ;  = 0.5 :

sottostima 4%

Con N=20 ;  = 0.8

sottostima 19%

ˆ

 

_



 











 



  ² ₂²

1 u 1 e

e

E _u

 

^ˆ ² ²

1 E ^u

n e

E e    









2

19 3 . 18

1 ^u

n e

E e  









2

19 4 . 15

1 ^u

n e

E e  









(26)

26

TEST DI DURBIN - WATSON

residui nella stima OLS per n grande

0 d_L d_H 2 4-d_H 4-d_L 4

autocorr.(+) ? No autocorr. ? Autocorr.(-)

Il limite tra la zona di accettazione e quella di rifiuto è funzione della matrice X .

D – W hanno costruito delle bande valide sempre.

 



^r



e e e e

e d e

e

e e e

e d

X y

e e

d

t t t t

t t

n

t t

n

t

t t n

t

n

t t t

n

t t n

t

t t



 









 







 



 



 













 



 









 







1 2 1

2 2

2

ˆ ˆ

2 1 2

1 1

2

1

2 2

2 1 2

1 2 2

2 1

4 0  d 

(27)

27

METODI RISOLUTIVI 1. GLS : se ho una stima di 

Riesco a trovare la matrice e trasformo il modello in

stima OLS

2. Procedura iterativa per stimare  Avendo:

E (1)

t (2) Procedura:

- Da (1) stimo  e  con OLS

(partendo da un valore iniziale per  ) - Sostituisco e in (2)

















  



















1 .

. .

ˆ 1

. ˆ 1 ˆ

ˆ

1

2 1

n

t t t

e e e

: TT  ^1

T

 

^Tu ^ ^ ^I ^ ^ ^ ^

Var

Tu TX

Ty

2

   



_t _t

 

_t ₁ _t ₁



_t

1 t t

1 t 1

t 1

t

t 1

t t

t

X y

u u

X X

1 y

y

u X

y

u u

, u

X y



























































































^X^^X



^X^ ^y

 



 





 ˆˆ ^1

ˆ _ˆ  ˆ

Si vuole prevedere il valore di Yn+1





 

 

    

  





 

 

 





 

 

 

 

 



 





 

 

 

   

   

 



  



  





 

 



     

  



 

 





 

 

   

 









  

   

 

 

 

   





      



   

  

 

 

      

 

  







 

ETEROSCHEDASTICITA’

Avevamo ipotizzato che

tale assunzione è in molte situazioni non valida

dobbiamo quindi riformulare il problema nella forma

 

 

^

^

 _  ^ _ ^

  ^ ^

  _ _

  _ _

^

^

^{ }

  ^ ^ ^{  } ^

^{ }

^{ }

     ^ ^ 