finanziaria
Esercizio eteroschedasticit´ a
Tiziano Razzolini Universit` a di Siena.
mail: [email protected]
3 aprile 2012
Esercizio eteroschedasticit´ a
Ipotizzate la seguente funzione di risparmio:
sav
i=
β0+
β1Inc
i+ e
i, e
i= √ inc
iu
icon u
itale che E ( u
i) = 0, e Var ( u ) =
σu2. u ´ e indipendente da inc
i.
1.
Mostrate che E ( e | inc ) = 0,e che quindi la prima assunzione dei minimi quadrati ´ e soddisfatta
2.
Mostrate che Var ( e
i| inc
i) =
σu2inc
i,e che l’ipotesi di omoschedasticit´ a ´ e violata. La varianza di sav
iinfatti aumenta con inc.
3.
Perch´ e la varianza del risparmio dovrebbe aumentare con il
reddito?
Esercizio eteroschedasticit´ a
1.
Quando condizioniamo su inc, √
inc
idiventa una costante.
Quindi E ( e | inc
i) = E ( √
inc
iu
i| inc
i) = √
inc
iE ( u
i| inc
i) =
√ inc
i0 = 0 poich´ e E ( u | inc
i) = 0
2.
Nuovamente, quando condizioniamo su inc, √
inc diventa una costante. Quindi,
var ( e
i| inc
i) = var ( √
inc
iu
i| inc
i) = inc
ivar ( u
i| inc
i) = ´ uinc
iσu2 3.Le famiglie con basso reddito utilizzano la maggior parte del
reddito per consumi di base. Famiglie con redditi maggiori
possono decidere se consumare di piu’, e quindi risparmiare di
meno, o risparmiare di piu’. La possibilit´ a di maggiore scelta
per le famiglie con redditi maggiori crea questa variabilit´ a nel
risparmio dipendente dal livello di reddito.
Si supponga che un ricercatore, utilizzando i dati sulla dimensione delle classi (DC) e i punteggi medi dei test di 100 classi relative a un terzo livello di istruzione (TS), stimi con il metodo OLS la seguente regressione:
TS c = 520, 4
(20,4)
− 5, 82
(2,21)
× DC R
2= 0, 08 SER = 11, 5 (1)
1.Si costruisca un intervallo di confidenza di livello 95% per β
1,
il coefficiente angolare della regressione
2.
Si calcoli il valore-p di un test bilaterale per l’ipotesi nulla H
0: β
1= 0. Si rifiuta l’ipotesi nulla al livello di significativit´ a del 5%? E all’1%?
3.
Si calcoli il valore-p di un test bilaterale per l’ipotesi nulla H
0: β
1= − 5, 6. Senza fare alcun calcolo aggiuntivo, si determini se − 5, 6 ´ e contenuto nell’intervallo di confidenza al 95% per β
14.
Si costruisca un intervallo di confidenza al 99% per β
01. Si costruisca un intervallo di confidenza di livello 95% per β1, il coefficiente angolare della regressione
{ˆβ1±1.96×SE(ˆβ1)} = {−5, 82±1, 96×2, 21} = {−10, 15;−1, 49} (2) 2. Si calcoli il valore-p di un test bilaterale per l’ipotesi nulla
H0: β1=0. Si rifiuta l’ipotesi nulla al livello di significativit´a del 5%? E all’1%?
tact= ˆβ1− (0) SE ˆβ1
= −5, 82
2, 21 = −2, 63 (3)
Valore−p=2Φ(−|tact|) =2×Φ(−| −2, 63|) =2×0, 0043=0, 0086 (4) Il valore-p ´e minore di 0, 01, sicch´e possiamo rigettare l’ipotesi nulla al livello di significativit´a del 5% e anche al livello di significativit´a del 1%.
3. Si calcoli il valore-p di un test bilaterale per l’ipotesi nulla
H0: β1= −5, 6. Senza fare alcun calcolo aggiuntivo, si determini se
−5, 6 ´e contenuto nell’intervallo di confidenza al 95% per β1
tact= ˆβ1− (−5, 6) SE ˆβ1
= −0, 22
2, 21 = −0, 10 (5)
Il valore-p per il test H0: β1= −5, 6 contro H1: β16= −5, 6 ´e valore−p=2Φ(−tact
) =2Φ(−0, 10) =0, 92 (6) Il valore-p ´e maggiore di 0, 10, sicch´e non possiamo rigettare l’ipotesi nulla al livello di significativit´a del 10%, 5% o 1%. Poich´e β1= −5, 6 non ´e rigettato al 5%, tale valore ´e contenuto nell’intervallo di confidenza al 95%.
4. Si costruisca un intervallo di confidenza al 99% per β0
{520, 4±2, 58×20, 4} cio´e (467, 7≤β0≤573, 0) (7)
Si supponga che un ricercatore, utilizzando i dati su 250 lavoratori uomini e 280 lavoratrici donne selezionati casualmente, stimi con il metodo OLS la seguente regressione
Wage[ = 12, 52
(0,23)
+ 2, 12
(0,36)
× Male R2= 0, 06 SER= 4, 2 (8) dove Wage ´e misurato in $/ora e Male ´e una variabile binaria che ´e uguale a 1 se la persona ´e di genere maschile e 0 se di genere femminile. Si definisca la differenza salariale di genere come la differenza tra il salario medio di uomini e donne.
1. Qual ´e la differenza di genere stimata?
2. La differenza di genere ´e significativamente diversa da zero? (Si calcoli il valore-p per verificare l’ipotesi nulla che non ci sia alcuna differenza dovuta al genere)
3. Si costruisca un intervallo di confidenza del livello 95% per la differenza di genere
4. Nel campione, qual ´e il salario medio delle donne? E degli uomini?
5. Un altro ricercatore usa gli stessi dati ma effettua una regressione di Wage su Female, una variabile che ´e uguale a 1 se la persona ´e di genere femminile e a 0 se di genere maschile. Quali sono le stime di regressione calcolate da tale regressione?
1. Qual ´e la differenza stimata dovuta al genere?
Gli uomini sono pagati 2, 12 $/ora pi´u delle donne
2. La differenza dovuta al genere ´e significativamente diversa da zero?
(Si calcoli il valore-p per verificare l’ipotesi nulla che non ci sia alcuna differenza dovuta al genere)
tact= ˆβ1− (0) SE ˆβ1
= 2, 12
0, 36=5, 89 (9)
Valore−p=2Φ(−|tact|) =2×Φ(−|5, 89|) =numero molto piccolo (10) Il valore-p ´e estremamente basso, sicch´e rigettiamo l’ipotesi nulla anche al livello di significativit´a del 1% (e quindi anche del 10% e 5%).
3. Si costruisca un intervallo di confidenza del livello 95% per la differenza dovuta al genere
{ˆβ1±1, 96×SE(ˆβ1)} = {2, 12±1, 96×0, 36} = {1, 41; 2, 83} (11)
4.
Nel campione qual ´ e il salario medio delle donne? E degli uomini?
Wage
donne= 12, 52$/ora Wage
uomini= 14, 64$/ora
5.
Un altro ricercatore usa gli stessi dati ma effettua una
regressione di Wage su Female, una variabile che ´ e uguale a 1 se la persona ´ e di genere femminile e a 0 se di genere
maschile. Quali sono le stime di regressione calcolate da tale regressione?
Wage = 14, 64 − 2, 12 × Female R
2= 0, 06 SER = 4, 2
(12)
Si supponga che un campione casuale di 200 uomini di 20 anni sia selezionato da una popolazione e siano registrati le loro altezze e il loro peso.
Attraverso una regressione del peso sull’altezza si ottiene Weight \ = 2, 15
(−99,41)
+ 3, 94
(0,31)
× Height R
2= 0, 81 SER = 10, 2 (13) dove Weight ´ e misurato in libbre e Height in pollici.
Un uomo ha uno scatto ritardato di crescita e cresce di 1, 5 pollici nel corso di un anno.
1.
Si costruisca un intervallo di confidenza al 99% per il peso
guadagnato dalla persona.
1.
L’intervallo di confidenza al 99% ´ e 1, 5 × { 3, 94 ± 2, 58 × 0, 31 } o
4, 71 libbre ≤ WeightGain ≤ 7, 11 libbre.
Si legga il riquadro “Il valore economico di un anno di istruzione:
eteroschedasticit´ a o omoschedasticit´ a?”nel paragrafo 5.4. Si usi la regressione riportata nella (5.23) per rispondere ai seguenti punti.
1.
Un lavoratore di 30 anni selezionato casualmente presenta un livello di istruzione di 16 anni? Qual ´ e la retribuzione oraria attesa del lavoratore?
2.
Un diplomato (con 12 anni di istruzione) considera la
possibilit´ a di andare all’universit´ a per una laurea biennale. Di quanto ci attende che cresca la sua retribuzione oraria media?
3.
Un consulente scolastico di una scuola superiore dice a uno
studente che, in media, i laureati guadagnano 10 dollari all’ora
in pi´ u rispetto ai diplomati. Questa affermazione ´ e coerente
con l’evidenza della regressione? Quale intervallo di valori ´ e
coerente con l’evidenza della regressione?
1. Un lavoratore di 30 anni selezionato casualmente presenta un livello di istruzione di 16 anni? Qual ´e la retribuzione oraria attesa del lavoratore?
−3, 13+1, 47×16=20, 39$ per ora
2. Un diplomato (con 12 anni di istruzione) considera la possibilit´a di andare all’universit´a per una laurea biennale. Di quanto ci attende che cresca la sua retribuzione oraria media?
Ci si attende che la sua retribuzione oraria aumenti da 14,51$ a 17,45$ ovvero di 2,94$ all’ora.
3. Un consulente scolastico di una scuola superiore dice a uno studente che, in media, i laureati guadagnano 10 dollari all’ora in pi´u rispetto ai diplomati. Questa affermazione ´e coerente con l’evidenza della regressione? Quale intervallo di valori ´e coerente con l’evidenza della regressione?
L’aumento nella retribuzione dovuta all’avere frequentato l’universit´a
´e β1×4. Pertanto, l’affermazione del consulente ´e che β1=10/4=2, 50. La statistica-t per tale nulla ipotesi ´e t=1,47−2,500,07 = −14, 71, che ha un p-valore di 0,00. Pertanto, l’affermazione del consulente pu´o essere rigettata al livello di significativit´a dell’1%. Un intervallo di confidenza per β1×4 ´e 4× {1,47±1,97×0,07} ovvero 5, 33$≤Gain≤6, 43$.
Negli anni 80, il Tennessee ha condotto un esperimento in cui gli studenti dell’asilo sono stati assegnati casualmente a classi “regolari”o a classi
“piccole”, e quindi sono stati esaminati con test standardizzati alla fine dell’anno. (Le classi regolari erano approssimativamente formate da 24 studenti, mentre le classi piccole contenevano approssimativamente 15 studenti). Si supponga che nella popolazione, il test standardizzato abbia un punteggio medio di 925 punti e una deviazione standard di 75 punti.
Sia SmallClass una variabile binaria uguale a 1 se lo studente ´e assegnato a una classe piccola e uguale a 0 altimenti. Attraverso una regressione di TestScore su SmallClass si ottiene
\
TestScore= 918, 0
(1,6)
+ 13, 9
(2,5)
× SmallClass R2 = 0, 01 SER= 74, 6 (14) 1. Le classi piccole migliorano i punteggi? Di quanto? L’effetto ´e
grande? Si spieghino le risposte.
2. L’effetto stimato della dimensione della classe sui punteggi ´e statisticamente significativo? Si effettui un test al livello 5%.
3. Si costruisca un intervallo di confidenza al 99% per l’effetto di SmallClass sul punteggio del test.
1. Le classi piccole migliorano i punteggi? Di quanto? L’effetto ´e grande? Si spieghino le risposte.
Il guadagno stimato trovandosi in una classe piccola ´e di 13,9 punti.
Tale guadagno ´e uguale a circa 1/5 della deviazione standard del risultato del test: si tratta quindi di un aumento di moderata entit´a.
2. L’effetto stimato della dimensione della classe sui punteggi ´e statisticamente significativo? Si effettui un test al livello 5%.
La statistica-t ´e tact= 13,92,5 =5, 56, che ha un p-valore di 0, 00.
Pertanto, l’ipotesi nulla ´e rifiutata al livello del 5% (e dell’1%).
3. Si costruisca un intervallo di confidenza al 99% per l’effetto di SmallClass sul punteggio del test.
{13, 9±2, 58×2, 5} = {13, 9±6, 45}
Si faccia riferimento alla regressione descritta nell’esercizio 5.5.
1. Si ritiene che gli errori di regressione siamo plausibilmente omoschedastici? Si spieghi.
2. SE(β1)´e stato calcolato usando l’equazione 5.3. Si supponga che gli errori di regressione siamo omoschedastici: tale ipotesi influirebbe sulla validit´a dell’intervallo di confidenza costruito al punto (3.) dell’esercizio 5.5?
1. Si ritiene che gli errori di regressione siamo plausibilmente omoschedastici? Si spieghi.
Per rispondere alla domanda occorre chiedersi se la variabilit´a del risultato del test nelle classi grandi e nelle classi piccole ´e la medesima. Non ´e facile rispondere a questa domanda. Da un lato, gli insegnanti delle classi piccole potrebbero dedicare pi´u tempo a portare gli studenti al medesimo livello migliorando la performance degli studenti meno preparati. D’altro lato, la maggior parte della variabilit´a nel risultato del test potrebbe essere al di l´a del controllo degli insegnanti.
2. SE(β1)´e stato calcolato usando l’equazione 5.3. Si supponga che gli errori di regressione siamo omoschedastici: tale ipotesi influirebbe sulla validit´a dell’intervallo di confidenza costruito al punto (3.) dell’esercizio 5.5?
La formula 5.3 ´e valida indipendentemente dalla
eteroschesdasticit´a o dalla omoschedasticit´a; pertanto, l’inferenza condotta usando tale formula ´e valida in entrambi i casi.