Econometria Il modello di regressione multipla Tiziano Razzolini

(1)

Econometria

Il modello di regressione multipla

Tiziano Razzolini

Università di Siena

Siena, 2020

(2)

Calcolo degli stimatori OLS

Minimizziamo la somma degli errori al quadrato calcolando le derivate parziali rispetto a b₁e b₂e ponendole pari a zero.

Pn

i=1(y_i− b₁− b₂x_i)²

∂

∂b1

Pn

i=1(y_i− b₁− b₂x_i)²= −2Pn

i=1(y_i− b₁− b₂x_i) =0

∂

∂b₂

Pn

i=1(y_i− b1− b2x_i)²= −2Pn

i=1(y_i− b1− b2x_i)x_i =0

(3)

Regressione con un singolo regressore

Calcolo degli stimatori OLS 1) −2Pn

i=1(y_i− b₁− b₂x_i) =0 ⇔ n¯y − nb₁− b₂n¯x = 0 ⇔ βˆ₁= ¯y − ˆβ₂x¯

2)−2Pn

i=1(y_i− b1− b2x_i)x_i =0 ⇔ Pn

i=1x_iy_i− b1Pn

i=1x_i− b2Pn

i=1x_i²=

=Pn

i=1x_iy_i− (¯y − b₂¯x )Pn

i=1x_i− b2Pn

i=1x_i²=

=Pn

i=1x_iy_i− n¯x ¯y + nb₂x¯²− b₂Pn

i=1x_i²=0 Notate che:Pn

i=1(x_i− ¯x ) (y_i− ¯y ) =Pn

i=1x_iy_i− n¯x ¯y e che Pn

i=1(x_i− ¯x )²=Pn

i=1x_i²− n¯x²

(4)

Calcolo degli stimatori OLS

Quindi si ha:

2)−2Pn

i=1(y_i− b₁− b₂X_i)x_i =0 ⇔

=Pn

i=1x_iy_i− n¯x ¯y + nb₂x¯²− b₂Pn

i=1x_i²=

=Pn

i=1(x_i− ¯x ) (y_i− ¯y ) − b₂Pn

i=1(x_i− ¯x )²=0 βˆ₂=

Pn

i=1(x_i−¯x )(y_i−¯y ) Pn

i=1(xi−¯x )²

Se dividiamo entrambi i membri per (n − 1) si ha:

βˆ₂= ^s^xy

s²_x

(5)

Regressione con un singolo regressore

Proprietà degli OLS Pn

i=1eˆ_i =0. Si ha infatti: ˆe_i =y_i− ˆy_i=y_i − ˆβ₁− ˆβ₂x_i. Sostituendo ˆβ1= ¯y − ˆβ2x si ha che:¯

eˆ_i =y_i− ¯y + ˆβ₂¯x − ˆβ₂x_i facendo la sommatoria si ha:

Pn

i=1eˆ_i =Pn

i=1(y_i− ¯y ) − ˆβ₂Pn

i=1(x_i− ¯x ) = 0 Entrambi i termini sono pari zero.

1 n

Pn

i=1yˆ_i = ¯y si ha infatti che: y_i = ˆy_i+ ˆe_i e quindi Pn

i=1y_i =Pn

i=1ˆy_i+Pn

i=1eˆ_i =Pn i=1yˆ_i

(6)

Altra proprietà degli OLS Pn

i=1eˆ_ix_i =0 e s_ˆ_ex =0 Vale infatti: Pn

i=1eˆ_ix_i =Pn

i=1ˆe_i(x_i− ¯x ) =

=Pn

i=1eˆ_ix_i− ¯xPn i=1eˆ_i Pn

i=1eˆ_ix_i =Pn

i=1(y_i− ˆy_i) (x_i− ¯x ) =

=Pn i=1

y_i− ˆβ₁− ˆβ₂x_i

(x_i− ¯x ) =

=Pn i=1

y_i− ¯y + ˆβ₂x − ˆ¯ β₂x_i

(x_i− ¯x ) =

=Pn

i=1(y_i− ¯y ) (x_i− ¯x ) −Pn

i=1βˆ₂(x_i− ¯x )²=0 Dato che: ˆβ2=Pn

i=1(y_i− ¯y ) (x_i− ¯x ) /Pn

i=1(x_i− ¯x )²

(7)

Esercizi

Modello trivariato

Considerate il modello: Y_i = β₁+ β₂x_2i + β₃x_3i +e_i La somma dei residui al quadrato è:

Pn

i(Y_i− β₁− β₂x_2i− β₃x_3i)²Le derivate rispetto ai tre

coefficienti poste uguali a zero β costituiscono un sistema di 3 equazioni

b₁n + b₂P

ix_2i +b₃P

ix_3i =P

iY_i b₁P

ix_2i +b₂P

ix_2i² +b₃P

ix_2ix_3i =P

ix_2iY_i b₁P

ix_3i +b₂P

ix_2ix_3i +b₃P

ix_3i² =P

ix_3iY_i

(8)

Modello trivariato

Il sistema puo’ essere risolto come prima dividendo la prima equazione di ottimo per n:

b₁= ¯Y − b₂x¯₂− b3x¯₃ e sostituendo b₁nelle altre due equazioni.

(9)

Esercizi

Abbiamo quindi:

b₂X

i

(x_2i− ¯x₂)²+b₃X

i

(x_2i− ¯x₂)(x_3i− ¯x₃) =X

i

(x_2i− ¯x₂)(Y_i− ¯Y )

b₂X

i

(x_2i− ¯x₂)(x_3i− ¯x₃)+b₃X

i

(x_3i− ¯x₃)²=X

i

(x_3i− ¯x₃)(Y_i− ¯Y ) Indichiamo con ˜x_2i , ˜x_3i e ˜y_i le deviazioni attorno alla media:

b₂=

P

i˜x_2iy˜_iP

i˜x_3i²−P

ix˜_3i˜y_iP

ix˜_2i˜x_3i P

ix˜_2i²P

i˜x_3i²−(P

i˜x_3i˜x_2i)²

b₃=

P

i˜x3iy˜iP

i˜x_2i²−P

ix˜2i˜yiP

ix˜2i˜x3i

P

ix˜_2i²P

i˜x_3i²−(P

i˜x_3i˜x_2i)²

(10)

Modello trivariato

Ricordiamo che: byx = ^s_s^xy2

x =

P

i˜xiy˜i

P

i˜x_i² =

P

i(xi−¯x )(yi−¯y ) P

i(xi−¯x )²

Dividiamo numeratore e denominatore di b₃perP

ix˜_2i²P

ix˜_3i² Definiamo la correlazione campionaria ˜x_2i e ˜x_3i come:

r_x²₂_x₃ =P

i(˜x_3ix˜_2i)²/P

i(˜x_3i²)P

i(˜x_2i²)

Usando la definizione di byx₃ and bx₂x₃ abbiamo:

b_yx₃_·x₂ = byx₃

1 − r_x²₃_x₂ −byx₂bx₂x₃

1 − r_x²₃_x₂

dove byx₃·x2 è la pendenza in una regressione di y su x₃in presenza di x₂.

(11)

Esercizi

Modello trivariato In maniera simile:

b_yx₂_·x₃ = b_yx₂− b_yx₃b_x₃_x₂ 1 − r_x²₂_x₃

L’effetto di x₂su Y deve considerare l’effetto di x₂su Y e su x₃. Nota che se r_x²₂_x₃ =0 allora bx₃x₂ =0, e byx₂·x3 =byx₂

Theorema: Regressione Ortogonale: Se le variabili

esplicative in una regressione multipla non sono correlate (i.e.

sono ortogonali) allora i coefficienti/pendenze sono gli stessi che otterreste da regressioni semplici sulle singole variabili.