March 7, 2020
Il mondo non è lineare così come le relazioni economiche che cerchiamo di studiare con i nostri modelli econometrici.
Questo significa che il modello lineare che abbiamo visto fino a questo momento è inadeguato? E cosa significa in realtà modello lineare?
Quando parliamo di modello lineare parliamo dilinearità nei parametri.
È possibile quindi introdurre all’interno del modello lineare delle componenti non lineari che ci permettono capire meglio il fenomeno che stiamo studiando.
prezzo delle case (PRICE ) e la superficie misurata in piedi quadrati (SQFT ):
PRICE = β1+ β2SQFT + e.
β2misura la variazione del prezzo quando la dimensione della casa varia di un piede quadrato.
La variazione del prezzo è costante, cioè non dipende da SQFT .
Potrebbe avere più senso che la variazione di PRICE dipenda da SQFT .
Example (Prezzo delle case e superficie)
Possiamo incorporare questa idea nel nostro modello in due modi
introdurre nel modello il termine al quadrato SQFT2; trasformare il modello lineare in un modello log-lineare, dove la variabile dipendente diventa log(PRICE ).
In entrambe le circostanze osserveremo che la variazione di PRICE rispetto a SQFT non è costante.
y = a + bx2.
Diamo per scontato il significato di a b. La pendenza della curva è data da
dy
dx =2bx . L’elasticità invece è data da
ε = dy /y dx /x = dy
dx x
y = 2bx2 y .
Example (Prezzo delle case e superficie) Consideriamo un modello quadratico
PRICE = β1+ β2SQFT2+e.
La pendenza stimata è d \PRICE
dSQFT =2 bβ2SQFT .
Una possibile interpretazione è la seguente: se bβ2>0, il prezzo di case più grandi aumenta più che proporzionalmente.
Example (Prezzo delle case e superficie)
Consideriamo i dati. Per 1080 abitazioni vendute a Baton Rouge, LA, nel 2005, l’equazione quadratica stimata è
PRICE = 55776.56 + 0.0154SQFT\ 2. L’inclinazione stimata è
d \PRICE
dSQFT =2 × 0.0154 × SQFT mentre l’elasticità stimata è data da
bε = d \PRICE dSQFT
SQFT
PRICE =2 × 0.0154SQFT2 PRICE.
Example (Prezzo delle case e superficie)
Example (Prezzo delle case e superficie)
Per calcolare l’elasticità in pratica partiamo dal modello stimato PRICE = b\ β1+ bβ2SQFT2.
Supponiamo di voler conoscere il prezzo per tre valori di SQFT SQFT = {2000, 4000, 6000} .
I valori corrispondenti di \PRICE sono
PRICE = {117461.77, 302517.39, 610943.42} .\
Sostituendo i valori di \PRICE e SQFT nell’espressione della elasticità
ε =b d \PRICE dSQFT
SQFT
PRICE =2 × 0.0154SQFT2 PRICE otteniamo
bε = {1.05, 1.63, 1.82} .
Questo significa che, nel caso di un’abitazione di 2000 piedi quadrati, se la superficie abitabile aumenta dell’1%, il prezzo crescerà dell’1.05%.
Consideriamo la funzione log-lineare logy = a + bx .
La prima cosa che possiamo notare è che sia la pendenza che l’elasticità variano in ogni punto ed hanno lo stesso segno di b.
La pendenza è d log y
dx = d log y dy
dy dx = 1
y dy
dx =b =⇒ dy dx =by L’elasticità invece è data da
ε = dy /y dx /x =bx .
Il modello log-lineare ci permette di calcolare la semielasticità, cioè la variazione percentuale di y a fronte di un incremento unitario di x . Dai risultati precedenti abbiamo che
d log y dx =b quindi
η =100dy /y
dx =100 × b
Example (Prezzo delle case e superficie) Consideriamo un modello log-lineare
log(PRICE ) = β1+ β2SQFT + e.
Una delle proprietà della trasformazione log-lineare è che regolarizza variabili distribuite asimmetricamente.
Questa trasformazione può essere quindi molto utile quando si usano variabili strettamente positive come prezzi, età, misure di vario tipo (per esempio peso, altezza, distanza, superficie).
Example (Prezzo delle case e superficie)
Example (Prezzo delle case e superficie) Il modello log-lineare stimato è
log( \PRICE ) = 10.8386 + 0.0004113SQFT . La stima del prezzo si può quindi calcolare usando una trasformazione esponenziale
PRICE = exp\
log( \PRICE )
= exp (10.8386 + 0.0004113SQFT ) .
Example (Prezzo delle case e superficie)
La pendenza nel modello log-lineare si calcola nello stesso modo
d \PRICE
dSQFT = d exp(10.8386 + 0.0004113SQFT ) dSQFT
=0.0004113 \PRICE .
Questo significa che se abbiamo una casa con
PRICE = $100000, l’aumento stimato di PRICE , se SQFT\ aumenta di una unità, è pari a $41.13.
Allo stesso modo, se \PRICE = $500000, l’aumento stimato è di $205.63.
Ricordiamoci che nel modello log-lineare l’elasticità è ε = bx , quindi, nel nostro caso, l’elasticità stimata è
ε = bb β2SQFT = 0.0004113SQFT .
Per una abitazione di 2000 piedi quadrati, l’elasticità stimata è 0.823. Quindi, se la superficie aumenta dell’1% il prezzo aumenterà dello 0.823%.
Allo stesso modo, per una abitazione di 4000 piedi quadrati, l’elasticità stimata è 1.645. Quindi, se la superficie aumenta dell’1% il prezzo aumenterà dello 1.645%.
Example (Prezzo delle case e superficie) Usando l’espressione della semielasticità
η =100dy /y
dx =100b
osserviamo che per un aumento unitario della superficie l’aumento stimato del prezzo è pari allo 0.04%.
Alternativamente, possiamo dire che ad aumento di 100 piedi quadrati causa un aumento del prezzo di circa il 4%.
Come scegliamo la nostra forma funzionale?
Abbiamo alcune linee guida essenziali che possono aiutarci a risolvere questo problema.
La forma funzionale deve essere coerente con la teoria economica.
La forma funzionale deve adattarsi bene ai dati.
La forma funzionale deve soddisfare le ipotesi del modello.
Nella scelta della forma funzionale dobbiamo tenere in
considerazione il fatto che il modello vero è ignoto e possiamo solo sperare che i suggerimenti di cui sopra ci indirizzino verso la scelta corretta.
Una variabile indicatrice (dicotomica, binaria, dummy) assume valori 0 o 1.
Di solito queste variabili sono usate per rappresentare caratteristiche qualitative come il genere, l’etnia o il luogo di residenza. Consideriamo, per esempio, la variabile UTOWN
UTOWN =
1 : l0abitazione si trova a University Town 0 : l0abitazione si trova a Golden Oaks Supponiamo di avere il modello
PRICE = β1+ β2UTOWN + e.
Come interpretiamo una regressione di questo tipo?
Dal modello
PRICE = β1+ β2UTOWN + e.
Calcoliamo il valore atteso
E [PRICE |UTOWN] = E [β1+ β2UTOWN + e|UTOWN]
= β1+ β2UTOWN.
Il risultato finale de dovuto alle ipotesiRS1 e RS2.
Adesso calcoliamo il valore atteso per i due valori di UTOWN E [PRICE |UTOWN = 1] = β1+ β2UTOWN = β1+ β2 e
E [PRICE |UTOWN = 0] = β1+ β2UTOWN = β1. Cosa osserviamo?
In questo modello semplice possiamo stimare i parametri usando delle medie campionarie. In particolare
βb1=PRICE(UTOWN=0). Inoltre
E [PRICE |UTOWN = 1] − E [PRICE |UTOWN = 0] = β2 quindi lo stimatore naturale sarebbe
βb2=PRICE(UTOWN=1)− PRICE(UTOWN=0). La meccanica del risultato è probabilmente chiara. Il suo significato è cheun regressore che è una dummy ci consente di stimare la differenza di medie fra sottopopolazioni.