1
PROBLEMI DI PREVISIONE
Si vuole prevedere il valore di Yn+1 per un insieme di valori X osservati.
Supponiamo però per X i valori
E’ possibile fare una previsione puntuale o stimare un intervallo di previsioni.
Utilizzando le proprietà BLUE di avremo il
PREVISORE PUNTUALE sarà BLUFF
Best Linear Unbiased Forecasting Function
1 2, 1 3, 1 ... , 1
X n X n Xk n C
C Y
E
u C
u X
X Y
n
k n k
n n
k k n
n
1
1 1 1 1 1
1 1
, 1
, 2 2 1
1 ...
ˆ
ˆ 1 C Yn
ˆ
2
Per ottenere un intervallo di previsione è necessario individuare la distribuzione di
Quindi una stima intervallare con un livello fiduciario del 100(1-)% :
C C
X X
CC E
C C
C C
E C
Var
C C
E
1 2
ˆ ˆ
ˆ ˆ
ˆ ˆ
n k
tn ke e
C X
X C
C C
C X
X C C
N C
2
1
2 1
ˆ ˆ ,
2 2
1 2
ˆ ˆ
ˆ
t C
C t
C
C X
X C t
C
3
APPLICAZIONE
Voglio prevedere Y da X0. Per calcolare l’intervallo devo determinare
Infatti .
u X
Y 1 2
2
22 0 0
2 1
0
2
2 1
X X
u
X u X
X C X
X X C
X C
X X
X X n
X
2 2
0 2
0 0
2
0 0
0 2
2 2
0 2
2 2 0
, 1 1
1 1 1
X X
n
X X
n X X
X X
X X n
X X X
X X X
n
X n
X
X X
X X
X n
4
Lo standard error di Y0 sarà
A parità di dati osservati l’intervallo sarà tanto più largo quanto più X0 è distante da
2
2 0
2 2
2 0 0
2 2 1
X X X
X n X
n
nX X
X X
X
0 2 2
0 ( )
) (
1 1 ˆ )
.(
. X X
X X
s n Y
e s
i
5
CENNI SULLE VARIABILI DUMMY (Variabili di comodo)
Fino ad ora abbiamo assunto che nella equazione generale Y = X + u
Le variabili X siano variabili cardinali date dalla teoria economica.
E’ possibile introdurre variabili cosiddette “di comodo” che riescano a rappresentare diversi
fattori :
– EFFETTI TEMPORALI – EFFETTI SPAZIALI
– VARIABILI QUALITATIVE
6
È possibile che un modello economico possa subire mutamenti strutturali :
FUNZIONE DI CONSUMO
Tempo di guerra Tempo di pace
Si ipotizza comunque che la propensione
marginale al consumo rimanga invariata in entrambi i periodi
u Y
C
u Y
C
2 1
Y C
7
Invece di considerare i due modelli separatamente (stime meno precise) vengono uniti in una sola
relazione
Dove X1 e X2 sono variabili dummy :
La matrice dei coefficienti sarà e la matrice dei dati
u Y
X X
C 1 1 2 2
pace di
anni
guerra di
X anni
pace di
anni
guerra di
X anni
1 0 0
1
2 1
21
Yn
Y Y Y
Y X
X X
1
0. 1. ..
0 0 .
1. 0. ..
1 0 .
1 1 .
0 . .
1 0
1 0
3 2 1
2 1
8
La trappola delle variabili di comodo
Quando utilizziamo le variabili dummy è necessariob fare attenzione a come viene costruito il modello, per non rendere la matrice
(X’X) singolare .
Infatti se nel modello precedente lasciavamo una
intercetta :
Abbiamo che le 4 colonne di X sono linearmente
dipendenti (X’X) non è invertibile
0 0
1 1
1
1 0
1. 0. 1. ..
1 1 0 .
1. 1. 0. ..
1 1 0 .
1 0 1 .
1. . . . 1
0 1
1 0 1
2 1
0
2 1
2 2 1
1 0
Y X
X X
Y Y Y
X
u Y
X X
C
n
X rank
X X
krank 3
9
Volendo utilizzare una regressione con intercetta si utilizzerà così solo una dummy :
= PMC in entrambi i periodi 1 = 1 = intercetta anni di guerra 2 = 1 + 2 = intercetta anni di pace
1 – 2 = 2 = differenza tra l’intercetta del
periodo guerra e pace
• Cambiamento di coefficiente angolare
2 – 1 = differenza propensione marginale al
consumo nei due periodi
pace di
anni
guerra di
X anni
u Y
X C
1 0
2
2 2 1
u Y
C pace
di anni
u Y
C guerra
di X anni
u Y
X Y
C
2 2 1
2 1
2 1
1 0
10
APPLICAZIONE (p.255 Maddala)
Y = 1 + 2 SVA + u Y = km / litro
SVA = Stima Vita Auto in anni
W = peso in Kg
82 . 0
415 .
0 28
. 3 760
. 2 002
. 0 008 .
ˆ 22
1 0 1
0
74 . 0
693 .
0 952 .
ˆ 7
2
097 . 413 0
. 1 708
. 001 0
. 349 0
. 5
5 4
3 2
1
2
061 . 0 753
. 1
R
D SVA A G
W S Y
diesel gas G D
automatico cambio
ndard sta
cambio S A
u D SVA
A G W S
Y
R
SVA Y
11
MULTICOLLINEARITA’
Quando tra due o più variabili esplicative vi è perfetta collinearità o multicollinearità, la matrice (X’X) non è più a rango pieno e le stime OLS non
possono essere calcolate.
Si può però facilmente fare una sostituzione di variabile
Es :
2 1
2
2 1
1 2 1
1 2
2 1
1
1 2
2 2 1
1
u X
u X
X Y
X X
u X
X Y
12
Il problema della multicollinearità esiste quindi quando due o più regressori sono quasi-collineari
ovvero quando il coefficiente di correlazione tra i regressori è alto .
•MODELLO A 3 VARIABILI
2 2 3
2
3 2 2
3 2
3 2 2
3 2
2
2 2 1
1
3 2
3 3 2
2
3 3 2
2 1
ˆ ˆ ˆ ˆ
X X
X
X X X
X X X
X
X X V
y X X
X
u u X
X Y
u X
X Y
13
È facile vedere che valori molto alti di rendono le stime OLS molto imprecise.
Inoltre piccole variazioni nella matrice dei dati provocano o possono provocare grandi variazioni
nella stima dei parametri.
2 23 2
3 2 3
2 23 2
2 2
2 3 2
2
2 3 2 2
3 2
2 2 3 2
2
2 3 2
2 3 2 2
3 2
2
2 3 2
2
ˆ 1
1 ˆ
r V X
r X
X X
X X X
X X X
X
X X X
X V X
2
r23
14
ESEMPIO-APPLICAZIONE:
instabilità delle stime
Dati :
u u
X X
Y 2 2 3 3
263 350 113
150 200
3 2 2
3
3 2 2
2
i i
i i i
i i i
Y X
Y X X
X X X
100 1 100 22500
22600
52500 52600
ˆ
100 1 100 22500
22600
39450 39550
150 113
200
263 150
350 113
ˆ
3
2
2 3 2 2
3 2
2
3 3
2 2
2 3 2
X X X
X
Y X X
X Y
X X
995 . 113 0
200 1502
2 3 2
2
2 3 2 2
3
2
X X
X rX X X
15
Togliendo solo una osservazione:
Si modificano molto le stime 87 3 261 149
112 199
5 . 347 149
5 . 261 ˆ 199
2 1 87
5 . 43 149
112 199
5 . 261 149
5 . 347 ˆ 112
5 . 261
5 . 327 112
149 199
3 2 2 2
3 2 2
3
3 2 2
2
Y X
Y X X
X X X
16
ETEROSCHEDASTICITA’
Avevamo ipotizzato che
tale assunzione è in molte situazioni non valida
dobbiamo quindi riformulare il problema nella forma
uu IE ' 2
' 2
0
uu
E u E
17
Sono ancora corretti ma non efficienti (ovvero non sono necessariamente a varianza minima)
u E X X
X E
u X
y
y X X
X
1 1
ˆ ˆ
1
1 21
1 '
ˆ
X X X
X X
X
X X X uu E X X
X V
18
GOLDFELD – QUANDT TEST
- Si ordinano le osservazioni secondo la variabile Xj che si ipotizza sia la causa dell’eteroschedasticità
- Si divide il campione in tre parti di numerosità n1 n2 n3 .
- Dopo la stima OLS nei tre sottocampioni si calcola e
Sotto H0 : omoschedasticità : (il valore di F è piccolo)
k n k
Fn
e e
e F e
e e e
e
3
1 ,
3 3
1 1
3 3 1
1
H0
Rifiuto F
Fempirico teorico
19
RIMEDI
1. i i = 1 , … , n siano valori noti.
si applicano i MINIMI QUADRATI PESATI (WLS)
ovvero si applica OLS al modello trasformato
Ovvero
Dove
2. relazione tra la componente stocastica e uno dei regressori
Es.
i i i
i ij ij
i i i
x x y y
* *
* ; ;
*
*
* 2 2
* 1 1
* i i ... k ik i
i x x x
y
* 12
22 1
i i i
i i
i Var i Var
Var
2 2 2
2
1 ...
i i
i ik
k i
i
x C Var
x x
y
20
Trasformiamo il modello
Dove
Applico OLS
2 2
2 2
1 2
2
* 2
* 2
*
1 ...
;
;
i i i
k ik i
i i
i i i
i ij ij
i i i
x x
x x
x y
x x
x x x
y y
Var
Cx Var x
Var i
i i
i
i
2
2 2
* 1
21
ESERCIZIO
La stima di un modello lineare sulla base dei valori del Reddito e del Consumo di 30 famiglie
americane fornisce i seguenti valori :
La stima dello stesso modello sulle prime 12 e sulle ultime 12 osservazioni fornisce i seguenti
valori:
Verificare l’ipotesi di presenza di
eteroschedasticità ed in caso affermativo indicare la procedura di correzione.
C’è presenza di eteroschedasticità
0.788 0.97
ˆ 1480 2
37 . 29 29
.
3
y R
C
3344000 71
. 0 747
. 0 7
. ˆ 2306
1069000 91
. 0 837
. 0 7
. ˆ 846
2 00
. 79 5
. 0
2 91
. 74 9
. 0
RSS R y
C
RSS R y
C
83 . 1 12
. 1069000 3
3344000
10 ,
10
F
F
22
AUTOCORRELAZIONE DEI RESIDUI Molto spesso la assunzione
cade perché gli errori sono autocorrelati, effetto molto usuale nelle serie storiche.
Per illustrare il problema consideriamo una semplice relazione a due variabili
t t
t
t t
t
u u
u X
y
1
0 0
0 0
1
2
s E s
E
s t t t
t t
tt t
t
u u u
1 2
1
uu I E ' 223
0 0
0
0 :
2 2
1 ...
r
r t r
t t
t
0 :
0
r
r t r
t E
u E
2 2
2
4 2
2
2 1
2 2
1
2 2 4
2 1 2
2 2
1
...
1
...
2
...
2 2
...
u
t t
t t t
t
t t
t t
E
E E
E E
E u
E
24
2 2
2
4 2
2
2 5 2
3 2
2 1
2 2
1 1
1
...
1
...
...
...
u
t t
t t
t t
t u E
u E
2 2 2
2 2
2 6 2
4 2
2
4 2 3
2
3 3 2
2 1
2
1
...
...
u
t t
t
t t
t t
t
t u E
u E
ut ut s
s u2E
1 .
. .
. .
. .
.
. 1
. 1
2 1
2
2 1 2
2
n n
n n
V u
u u E
25
CONSEGUENZE 1. Stime OLS di corrette
2. Varianze di molto grandi ovvero 3. Sottostima di tali varianze
inefficienti
4. Conseguente non validità dei test t ed F Infatti si può dimostrare che
Solo se 2 = 0
Con N=20 ; = 0.5 :
sottostima 4%
Con N=20 ; = 0.8
sottostima 19%
ˆ
2 22
1 u 1 e
e
E u
ˆ 2 21 E u
n e
E e
2
19 3 . 18
1 u
n e
E e
2
19 4 . 15
1 u
n e
E e
26
TEST DI DURBIN - WATSON
residui nella stima OLS per n grande
0 dL dH 2 4-dH 4-dL 4
autocorr.(+) ? No autocorr. ? Autocorr.(-)
Il limite tra la zona di accettazione e quella di rifiuto è funzione della matrice X .
D – W hanno costruito delle bande valide sempre.
r
e e e e
e d e
e
e e e
e d
X y
e e
e e
d
t t t t
t t
n
t t
n
t
t t n
t
n
t t t
n
t t n
t
t t
1 2 1
2 2
2
2
ˆ ˆ
2 1 2
1 1
2
2
1
2 2
2 1 2
1 2 2
2 1
4 0 d
27
METODI RISOLUTIVI 1. GLS : se ho una stima di
Riesco a trovare la matrice e trasformo il modello in
stima OLS
2. Procedura iterativa per stimare Avendo:
E (1)
t (2) Procedura:
- Da (1) stimo e con OLS
(partendo da un valore iniziale per ) - Sostituisco e in (2)
1 .
. .
. .
. .
. .
ˆ 1
. ˆ 1 ˆ
ˆ
1
2 1
n
t t t
e e e
: TT 1
T
Tu I Var
Tu TX
Ty
2
t t
t 1 t 1
t1 t t
1 t t
1 t t
1 t 1
t 1
t
t 1
t t
t t
t
X y
X y
u u
X X
1 y
y
u X
y
u u
, u
X y
XX
X y
ˆˆ 1
ˆ ˆ ˆ