• Non ci sono risultati.

Si vuole prevedere il valore di Yn+1

N/A
N/A
Protected

Academic year: 2021

Condividi "Si vuole prevedere il valore di Yn+1"

Copied!
27
0
0

Testo completo

(1)

1

PROBLEMI DI PREVISIONE

Si vuole prevedere il valore di Yn+1 per un insieme di valori X osservati.

Supponiamo però per X i valori

E’ possibile fare una previsione puntuale o stimare un intervallo di previsioni.

Utilizzando le proprietà BLUE di avremo il

PREVISORE PUNTUALE sarà BLUFF

Best Linear Unbiased Forecasting Function

1 2, 1 3, 1 ... , 1

X n X n Xk n C

 

 

C Y

E

u C

u X

X Y

n

k n k

n n

k k n

n

1

1 1 1 1 1

1 1

, 1

, 2 2 1

1 ...

ˆ

ˆ 1 C Yn

ˆ

(2)

2

Per ottenere un intervallo di previsione è necessario individuare la distribuzione di

Quindi una stima intervallare con un livello fiduciario del 100(1-)% :

 

    

  

C C

X X

C

C E

C C

C C

E C

Var

C C

E

1 2

ˆ ˆ

ˆ ˆ

ˆ ˆ

 

 



 

 



 















 

 

 

n k

tn k

e e

C X

X C

C C

C X

X C C

N C

2

1

2 1

ˆ ˆ ,

 





 



2 2

1 2

ˆ ˆ

ˆ

t C

C t

C

C X

X C t

C

(3)

3

APPLICAZIONE

Voglio prevedere Y da X0. Per calcolare l’intervallo devo determinare

Infatti .

u X

Y  1 2

 

 

 

2

 

2

2 0 0

2 1

0

2

2 1

 

 

X X

u

X u X

X C X

X X C

X C

X X

X X n

X

 

 

   

   

 









  

  

 

 

2 2

0 2

0 0

2

0 0

0 2

2 2

0 2

2 2 0

, 1 1

1 1 1

X X

n

X X

n X X

X X

X X n

X X X

X X X

n

X n

X

X X

X X

X n

(4)

4

Lo standard error di Y0 sarà

A parità di dati osservati l’intervallo sarà tanto più largo quanto più X0 è distante da

  

2

2 0

2 2

2 0 0

2 2 1

X X X

X n X

n

nX X

X X

X

0 2 2

0 ( )

) (

1 1 ˆ )

.(

. X X

X X

s n Y

e s

i

(5)

5

CENNI SULLE VARIABILI DUMMY (Variabili di comodo)

Fino ad ora abbiamo assunto che nella equazione generale Y = X + u

Le variabili X siano variabili cardinali date dalla teoria economica.

E’ possibile introdurre variabili cosiddette “di comodo” che riescano a rappresentare diversi

fattori :

– EFFETTI TEMPORALI – EFFETTI SPAZIALI

– VARIABILI QUALITATIVE

(6)

6

È possibile che un modello economico possa subire mutamenti strutturali :

FUNZIONE DI CONSUMO

Tempo di guerra Tempo di pace

Si ipotizza comunque che la propensione

marginale al consumo rimanga invariata in entrambi i periodi

u Y

C

u Y

C

2 1

Y C

(7)

7

Invece di considerare i due modelli separatamente (stime meno precise) vengono uniti in una sola

relazione

Dove X1 e X2 sono variabili dummy :

La matrice  dei coefficienti sarà e la matrice dei dati

u Y

X X

C 1 1 2 2

pace di

anni

guerra di

X anni

pace di

anni

guerra di

X anni

1 0 0

1

2 1

21

 

Yn

Y Y Y

Y X

X X

1

0. 1. ..

0 0 .

1. 0. ..

1 0 .

1 1 .

0 . .

1 0

1 0

3 2 1

2 1

(8)

8

La trappola delle variabili di comodo

Quando utilizziamo le variabili dummy è necessariob fare attenzione a come viene costruito il modello, per non rendere la matrice

(X’X) singolare .

Infatti se nel modello precedente lasciavamo una

intercetta :

Abbiamo che le 4 colonne di X sono linearmente

dipendenti (X’X) non è invertibile

0 0

1 1

1

1 0

1. 0. 1. ..

1 1 0 .

1. 1. 0. ..

1 1 0 .

1 0 1 .

1. . . . 1

0 1

1 0 1

2 1

0

2 1

2 2 1

1 0

Y X

X X

Y Y Y

X

u Y

X X

C

n

 

X rank

X X

k

rank   3

(9)

9

Volendo utilizzare una regressione con intercetta si utilizzerà così solo una dummy :

 = PMC in entrambi i periodi 1 = 1 = intercetta anni di guerra 2 = 1 + 2 = intercetta anni di pace

1 – 2 = 2 = differenza tra l’intercetta del

periodo guerra e pace

• Cambiamento di coefficiente angolare

2 – 1 = differenza propensione marginale al

consumo nei due periodi



 

pace di

anni

guerra di

X anni

u Y

X C

1 0

2

2 2 1

 



  

u Y

C pace

di anni

u Y

C guerra

di X anni

u Y

X Y

C

2 2 1

2 1

2 1

1 0

(10)

10

APPLICAZIONE (p.255 Maddala)

Y = 1 + 2 SVA + u Y = km / litro

SVA = Stima Vita Auto in anni

W = peso in Kg

82 . 0

415 .

0 28

. 3 760

. 2 002

. 0 008 .

ˆ 22

1 0 1

0

74 . 0

693 .

0 952 .

ˆ 7

2

097 . 413 0

. 1 708

. 001 0

. 349 0

. 5

5 4

3 2

1

2

061 . 0 753

. 1





R

D SVA A G

W S Y

diesel gas G D

automatico cambio

ndard sta

cambio S A

u D SVA

A G W S

Y

R

SVA Y

(11)

11

MULTICOLLINEARITA’

Quando tra due o più variabili esplicative vi è perfetta collinearità o multicollinearità, la matrice (X’X) non è più a rango pieno e le stime OLS non

possono essere calcolate.

Si può però facilmente fare una sostituzione di variabile

Es :

2 1

2

2 1

1 2 1

1 2

2 1

1

1 2

2 2 1

1

u X

u X

X Y

X X

u X

X Y

(12)

12

Il problema della multicollinearità esiste quindi quando due o più regressori sono quasi-collineari

ovvero quando il coefficiente di correlazione tra i regressori è alto .

•MODELLO A 3 VARIABILI

 

 

 

  

2 2 3

2

3 2 2

3 2

3 2 2

3 2

2

2 2 1

1

3 2

3 3 2

2

3 3 2

2 1

ˆ ˆ ˆ ˆ

X X

X

X X X

X X X

X

X X V

y X X

X

u u X

X Y

u X

X Y

(13)

13

È facile vedere che valori molto alti di rendono le stime OLS molto imprecise.

Inoltre piccole variazioni nella matrice dei dati provocano o possono provocare grandi variazioni

nella stima dei parametri.

 

 

 

 

 

      

   

2 23 2

3 2 3

2 23 2

2 2

2 3 2

2

2 3 2 2

3 2

2 2 3 2

2

2 3 2

2 3 2 2

3 2

2

2 3 2

2

ˆ 1

1 ˆ

r V X

r X

X X

X X X

X X X

X

X X X

X V X

2

r23

(14)

14

ESEMPIO-APPLICAZIONE:

instabilità delle stime

Dati :

u u

X X

Y  2 2 3 3  

  

 

263 350 113

150 200

3 2 2

3

3 2 2

2

i i

i i i

i i i

Y X

Y X X

X X X

 

100 1 100 22500

22600

52500 52600

ˆ

100 1 100 22500

22600

39450 39550

150 113

200

263 150

350 113

ˆ

3

2

2 3 2 2

3 2

2

3 3

2 2

2 3 2

      

X X X

X

Y X X

X Y

X X

 

995 . 113 0

200 1502

2 3 2

2

2 3 2 2

3

2

  

X X

X rX X X

(15)

15

Togliendo solo una osservazione:

Si modificano molto le stime 87 3 261 149

112 199

5 . 347 149

5 . 261 ˆ 199

2 1 87

5 . 43 149

112 199

5 . 261 149

5 . 347 ˆ 112

5 . 261

5 . 327 112

149 199

3 2 2 2

3 2 2

3

3 2 2

2

 

Y X

Y X X

X X X

(16)

16

ETEROSCHEDASTICITA’

Avevamo ipotizzato che

tale assunzione è in molte situazioni non valida

dobbiamo quindi riformulare il problema nella forma

 

uu I

E ' 2

 

 

' 2

0

uu

E u E

(17)

17

Sono ancora corretti ma non efficienti (ovvero non sono necessariamente a varianza minima)

 

 

 

u E X X

X E

u X

y

y X X

X

1 1

ˆ ˆ

    

 

1

 

1 2

1

1 '

ˆ

X X X

X X

X

X X X uu E X X

X V

(18)

18

GOLDFELD – QUANDT TEST

- Si ordinano le osservazioni secondo la variabile Xj che si ipotizza sia la causa dell’eteroschedasticità

- Si divide il campione in tre parti di numerosità n1 n2 n3 .

- Dopo la stima OLS nei tre sottocampioni si calcola e

Sotto H0 : omoschedasticità : (il valore di F è piccolo)

k n k

Fn

e e

e F e

e e e

e

3

1 ,

3 3

1 1

3 3 1

1

H0

Rifiuto F

Fempirico teorico

(19)

19

RIMEDI

1. i i = 1 , … , n siano valori noti.

si applicano i MINIMI QUADRATI PESATI (WLS)

ovvero si applica OLS al modello trasformato

Ovvero

Dove

2. relazione tra la componente stocastica e uno dei regressori

Es.

i i i

i ij ij

i i i

x x y y

 

 

 

* *

* ; ;

*

*

* 2 2

* 1 1

* i i ... k ik i

i x x x

y       

 

* 12

 

22 1

 

 

 

 

 

i i i

i i

i Var i Var

Var

2 2 2

2

1 ...

i i

i ik

k i

i

x C Var

x x

y

(20)

20

Trasformiamo il modello

Dove

Applico OLS

2 2

2 2

1 2

2

* 2

* 2

*

1 ...

;

;

i i i

k ik i

i i

i i i

i ij ij

i i i

x x

x x

x y

x x

x x x

y y

 

Var

 

C

x Var x

Var i

i i

i

i 



 

2

2 2

* 1

(21)

21

ESERCIZIO

La stima di un modello lineare sulla base dei valori del Reddito e del Consumo di 30 famiglie

americane fornisce i seguenti valori :

La stima dello stesso modello sulle prime 12 e sulle ultime 12 osservazioni fornisce i seguenti

valori:

Verificare l’ipotesi di presenza di

eteroschedasticità ed in caso affermativo indicare la procedura di correzione.

C’è presenza di eteroschedasticità

0.788 0.97

ˆ 1480 2

37 . 29 29

.

3

y R

C

3344000 71

. 0 747

. 0 7

. ˆ 2306

1069000 91

. 0 837

. 0 7

. ˆ 846

2 00

. 79 5

. 0

2 91

. 74 9

. 0

RSS R y

C

RSS R y

C

83 . 1 12

. 1069000 3

3344000

10 ,

10

F

F

(22)

22

AUTOCORRELAZIONE DEI RESIDUI Molto spesso la assunzione

cade perché gli errori sono autocorrelati, effetto molto usuale nelle serie storiche.

Per illustrare il problema consideriamo una semplice relazione a due variabili

t t

t

t t

t

u u

u X

y

1

 

 





 

0 0

0 0

1

2

s E s

E

s t t t

t t

t

t t

t

u u u

1 2

1

 

uu I E ' 2

(23)

23

0 0

0

0 :

2 2

1 ...

r

r t r

t t

t

 

 

0 :

0

r

r t r

t E

u E

       

   

 

 

2 2

2

4 2

2

2 1

2 2

1

2 2 4

2 1 2

2 2

1

...

1

...

2

...

2 2

...

u

t t

t t t

t

t t

t t

E

E E

E E

E u

E

(24)

24

    

 

2 2

2

4 2

2

2 5 2

3 2

2 1

2 2

1 1

1

...

1

...

...

...

u

t t

t t

t t

t u E

u E

   

 

2 2 2

2 2

2 6 2

4 2

2

4 2 3

2

3 3 2

2 1

2

1

...

...

u

t t

t

t t

t t

t

t u E

u E

 

 

 



 

ut ut s

s u2

E   

 









 

1 .

. .

. .

. .

.

. 1

. 1

2 1

2

2 1 2

2

n n

n n

V u

u u E

(25)

25

CONSEGUENZE 1. Stime OLS di  corrette

2. Varianze di molto grandi ovvero 3. Sottostima di tali varianze

inefficienti

4. Conseguente non validità dei test t ed F Infatti si può dimostrare che

Solo se 2 = 0

Con N=20 ;  = 0.5 :

sottostima 4%

Con N=20 ;  = 0.8

sottostima 19%

ˆ

 

2 22

1 u 1 e

e

E u

 

ˆ 2 2

1 E u

n e

E e





2

19 3 . 18

1 u

n e

E e





2

19 4 . 15

1 u

n e

E e





(26)

26

TEST DI DURBIN - WATSON

residui nella stima OLS per n grande

0 dL dH 2 4-dH 4-dL 4

autocorr.(+) ? No autocorr. ? Autocorr.(-)

Il limite tra la zona di accettazione e quella di rifiuto è funzione della matrice X .

D – W hanno costruito delle bande valide sempre.

 

r

e e e e

e d e

e

e e e

e d

X y

e e

e e

d

t t t t

t t

n

t t

n

t

t t n

t

n

t t t

n

t t n

t

t t

 

 

 

1 2 1

2 2

2

2

ˆ ˆ

2 1 2

1 1

2

2

1

2 2

2 1 2

1 2 2

2 1

4 0  d

(27)

27

METODI RISOLUTIVI 1. GLS : se ho una stima di 

Riesco a trovare la matrice e trasformo il modello in

stima OLS

2. Procedura iterativa per stimare  Avendo:

E (1)

t (2) Procedura:

- Da (1) stimo  e  con OLS

(partendo da un valore iniziale per  ) - Sostituisco e in (2)





  

1 .

. .

. .

. .

. .

ˆ 1

. ˆ 1 ˆ

ˆ

1

2 1

n

t t t

e e e

: TT  1

T

 

Tu I

Var

Tu TX

Ty

2

   

t t

 

t 1 t 1

t

1 t t

1 t t

1 t t

1 t 1

t 1

t

t 1

t t

t t

t

X y

X y

u u

X X

1 y

y

u X

y

u u

, u

X y





XX

X y

ˆˆ 1

ˆ ˆ  ˆ

Riferimenti

Documenti correlati

Poich´e {x k } k∈N ha una sottosuccessione convergente ad un punto di E, questo non pu` o che essere x, che quindi appartiene ad E come si voleva.. Sia ora E chiuso

[r]

[r]

Un massimo o minimo vincolato per una funzione di due variabili è un massimo o minimo da ricercarsi non su tutto il dominio ma all'interno del sottoinsieme del dominio che

(c) Si mostri che nel limite n → ∞ la distribuzione congiunta delle variabili X e Y converge verso il prodotto delle

 la taglia del campione `e molto grande (≥ 1000) ma la distribuzione della variabile in esame non ` e normale.  la varianza della variabile in esame `e

Per quali valori del parametro t il sistema ha una ed una sola soluzione?. Per tali valori, si determini

Questa lezione fa riferimento sostanzialmente al paragrafo 10.4 ”Rango di una matrice”, in particolare alla proprieta’ 10.2 (teorema di Rouche’-Capelli) che da’ una