Tiziano Razzolini
March 9, 2018
Chiameremo bβ1e bβ2stimatori OLS. Abbiamo accennato senza troppo approfondire le proprietà degli stimatori OLS.
Gli stimatori OLS sono variabili aleatorie e in quanto tali possiamo chiederci quali siano i loro valori attesi, varianze, covarianze e distribuzioni di probabilità.
È importante inoltre studiare le differenze tra gli stimatori OLS ed eventuali stimatori alternativi.
Cave!Stimatori e stime sono due concetti diversi.
Correttezza dello stimatore OLS
Inizieremo la nostra analisi a partire dallo stimatore OLS di β2. Abbiamo visto che
βb2= Pn
i=1(xi − ¯x )(yi− ¯y ) Pn
i=1(xi− ¯x )2 = Pn
i=1(xi− ¯x )yi Pn
i=1(xi− ¯x )2 =
n
X
i=1
wiyi.
Usando l’ipotesi di corretta specificazione del modello (RS1) possiamo scrivere
βb2=
n
X
i=1
wiyi =
n
X
i=1
wi(β1+ β2xi+ei) = β2+
n
X
i=1
wiei.
Correttezza dello stimatore OLS
Se le ipotesi del modello sono valide possiamo dimostrare che lo stimatore per β2è corretto o non distorto. Questo significa che E [ bβ2|x] = β2. Quindi
E [ bβ2|xi] =E
"
β2+
n
X
i=1
wiei|xi
#
= β2+
n
X
i=1
wiE [ei|xi] = β2.
Il risultato finale deriva dalle proprietà degli operatori sommatoria e valore atteso e l’ipotesiRS2.
Correttezza dello stimatore OLS
Problem
Dimostrare che E [ bβ1|x] = β1.
Correttezza dello stimatore OLS
Solution
Sappiamo che bβ1= ¯y − bβ2¯x , quindi
E [ bβ1|xi] =E [¯y − bβ2¯x |xi] =E [β1+ β2x + ¯¯ e − bβ2x |x¯ i] = β1. Il risultato finale deriva dal fatto che bβ2è corretto, dalle proprietà dell’operatore valore atteso e dall’ipotesiRS2.
Correttezza dello stimatore OLS
La correttezza dello stimatore è una proprietà importante ed è valida, una volta dimostrata, per qualsiasi dimensione
campionaria.
In generale possiamo dire che uno stimatore non distorto è un buon stimatore.
La correttezza, tuttavia, è una proprietà che vale in media.
La stima di β1e β2è generalmente calcolata per un solo campione e non possiamo sapere se sono vicine o lontane dai valori campionari.
Correttezza dello stimatore OLS
Varianza dello stimatore OLS
Varianza dello stimatore OLS
Se le ipotesi del modello di regressioneRS1-RS5 sono valide possiamo calcolare varianze e covarianze degli stimatori.
Var[ bβ2|xi] = Var
Pn
i=1(xi− ¯x )yi Pn
i=1(xi− ¯x )2|xi
=
1
Pn
i=1(xi− ¯x )2
2
Var
" n X
i=1
(xi− ¯x )ei|xi
#
=
1
Pn
i=1(xi− ¯x )2
2 n
X
i=1
(xi− ¯x )2Var [ei|xi]
= σ2
Pn
i=1(xi− ¯x )2.
Varianza dello stimatore OLS
Var[ bβ1|xi] = Var[¯y − bβ2x |x¯ i] = Var[β1+ β2x + ¯¯ e − bβ2x |x¯ i]
= Var[¯e − bβ2x |x¯ i] = Var[¯e|xi] + Var[ bβ2¯x |xi]
= σ2
n + σ2x¯2 Pn
i=1(xi− ¯x )2 = σ2 Pn
i=1(xi− ¯x )2+n¯x2 nPn
i=1(xi− ¯x )2
= σ2
Pn i=1xi2 nPn
i=1(xi− ¯x )2
Varianza dello stimatore OLS
Cov[ bβ1, bβ2|xi] =E [( bβ1− β1)( bβ2− β2)|xi]
=E [(¯y − bβ2x − β¯ 1)( bβ2− β2)|xi]
=E [¯y ( bβ2− β2)|xi] −E [ bβ2x ( b¯ β2− β2)|xi]
=E [¯e( bβ2− β2)|xi] − ¯x E [( bβ2− β2)( bβ2− β2)|xi]
=E [¯e
n
X
i=1
wiei|xi] − ¯x Var[ bβ2|xi]
= 1 nE [
n
X
i=1
wie2i|xi] − ¯x Var[ bβ2|xi]
= −¯x Var[ bβ2|xi]
Varianza dello stimatore OLS
Le formule della varianza e della covarianza ci forniscono delle informazioni estremamente interessanti circa il comportamento degli stimatori.
Sappiamo che l’errore raccoglie tutta l’informazione a noi ignota. Se la varianza dell’errore σ2è grande, lo sarà anche quella degli stimatori.
La precisione degli stimatori è direttamente proporzionale alla dimensione del campione n e alla variabilità di x (in realtà sarebbe la somma dei quadrati degli scarti x ).
La varianza di bβ1è direttamente proporzionale aPn i=1xi2. Il valore assoluto della covarianza tra bβ1e bβ2è
direttamente proporzionale a ¯x .
Varianza dello stimatore OLS
Il teorema di Gauss-Markov
Il teorema di Gauss-Markov è un risultato estremamente importante e giustifica, per certi versi, l’uso dello stimatore OLS.
Theorem
Sotto le ipotesiRS1-RS5 del modello di regressione semplce, gli stimatori bβ1e bβ2di β1e β2sono gli stimatorimigliori nella classe degli stimatori lineari e corretti.
Il teorema di Gauss-Markov
Spesso si dice che lo stimatore OLS è BLUE (best linear unbiased estimator).
Cosa vogliamo dire quando affermiamo che lo stimatore OLS è il migliore in una determinata classe di stimatori?
La risposta è semplice: lo stimatore OLS è il migliore nel senso che ha la varianza più piccola nella famiglia degli stimatori non distorti e lineari.
Se le ipotesi del teorema di Gauss-Markov non sono valide lo stimatore OLS non è il migliore.
È tuttavia possibile, in alcuni casi, generalizzare il teorema di Gauss-Markov.
I risultati del teorema di Gauss-Markov non dipendono dalla
Distribuzione degli stimatori OLS
Tramite l’ipotesiRS6 possiamo facilmente dimostrare che lo stimatore OLS è distribuito normalmente
βb1∼ N β1, σ2Pn i=1xi2 nPn
i=1(xi− ¯x )2
! ,
βb2∼ N β2, σ2 Pn
i=1(xi− ¯x )2
! .
Possiamo fare a meno dell’ipotesiRS6 e fare affidamento sul fatto che lo stimatore sia asintoticamente normale.
Distribuzione degli stimatori OLS
Il concetto di normalità asintotica si riferisce al fatto che quando n è sufficientemente grande la distribuzione di bβ1e bβ2è
prossima ad una distribuzione normale.
L’ipotesiRS6 invece implica che lo stimatore OLS sia normale per qualsiasi valore di n.
Stima della varianza del termine d’errore
Stimare il termine d’errore è estremamente importante se vogliamo fare inferenza sui parametri del modello. Dalle ipotesi del modello sappiamo che
Var[ei|xi] =Eh
(ei− E [ei])2|xii
=Eh e2i|xii
= σ2 perchè E [ei] =0. Chiaramente σ2è ignoto.
Come possiamo stimare in modo corretto σ2.
Stima della varianza del termine d’errore
Un modo naturale per stimare un valore atteso è quello di usare una media campionaria. Quindi
¯ σ2= 1
n
n
X
i=1
e2i.
Chiaramente questo stimatore non è utilizzabile.
Stima della varianza del termine d’errore
Quello che possiamo fare è stimare il termine d’errore bei =yi − bβ1− bβ2xi.
Di conseguenza
eσ2= 1 n
n
X
i=1
be2i.
Si può dimostrare cheeσ2è uno stimatore distorto, quindi Eh
σe2i 6= σ2.
Stima della varianza del termine d’errore
Con una piccola modifica otteniamo
σb2= 1 n − 2
n
X
i=1
be2i.
Si può dimostrare chebσ2è uno stimatore non distorto, quindi Eh
σb2 i
= σ2.
È importante sottolineare il fatto che quando n è molto grande i due stimatori sono quasi uguali
bσ2≈eσ2.
Stima della varianza del termine d’errore
Grazie alla stima della varianza σ2possiamo stimare varianze e covarianza di bβ1e bβ2.
dVar[ bβ1|xi] =bσ2
Pn i=1xi2 nPn
i=1(xi− ¯x )2 dVar[ bβ2|xi] = σb2
Pn
i=1(xi− ¯x )2 Cov[ bd β1, bβ2|xi] = −¯x dVar[ bβ2|xi]
Stima della varianza del termine d’errore
Delle quantità che son molto utili in pratica sono gli errori standard o standard errors
se[ bβ1] = q
dVar[ bβ1|xi] se[ bβ2] =
q
dVar[ bβ2|xi].
Stima della varianza del termine d’errore
Example (Stima del modello di consumo)
σb2= Pn
i=1bei2
n − 2 = 304505.2
38 =8013.29.
Stima della varianza del termine d’errore
Le varianze e covarianza degli stimatori OLS vengono in genere organizzati in una tabella detta matrice di varianza covarianza
dVar
"
βb1 βb2
!#
=
dVarh
βb1i
Covdh βb1, bβ2i Covd
h βb1, bβ2
i
dVar h
βb2 i
La matrice è simmetrica e le varianze degli stimatori si trovano nella diagonale principale.
Stima della varianza del termine d’errore
Example (Stima del modello di consumo)
Nel caso dei dati sulla spesa alimentare, la stima della matrice di covarianza degli stimatori dei minimi quadrati è data da:
Parametri Costante b1
Reddito b2 Costante
b1
1884.442 -85.90316 Reddito
b2 -85.90316 4.381752
Stima della varianza del termine d’errore
Lo standard error è una quantità estremamente importante nell’analisi empirica.
Lo standard error è una misura della variabilità degli stimatori.
Se lo standard error è grande la variabilità dello stimatore è grande.
Di conseguenza, se lo standard error è piccolo è alta la probabilità che la stima sia vicina al valore vero.
Stima della varianza del termine d’errore
Il mondo non è lineare così come le relazioni economiche che cerchiamo di studiare con i nostri modelli econometrici.
Questo significa che il modello lineare che abbiamo visto fino a questo momento è inadeguato? E cosa significa in realtà modello lineare?
Quando parliamo di modello lineare parliamo dilinearità nei parametri.
È possibile quindi introdurre all’interno del modello lineare delle componenti non lineari che ci permettono capire meglio il fenomeno che stiamo studiando.