trasformare il modello lineare in un modello log-lineare, dove la variabile dipendente diventa log(PRICE

(1)

March 7, 2020

(2)

Il mondo non è lineare così come le relazioni economiche che cerchiamo di studiare con i nostri modelli econometrici.

Questo significa che il modello lineare che abbiamo visto fino a questo momento è inadeguato? E cosa significa in realtà modello lineare?

Quando parliamo di modello lineare parliamo dilinearità nei parametri.

È possibile quindi introdurre all’interno del modello lineare delle componenti non lineari che ci permettono capire meglio il fenomeno che stiamo studiando.

(3)

prezzo delle case (PRICE ) e la superficie misurata in piedi quadrati (SQFT ):

PRICE = β₁+ β₂SQFT + e.

β₂misura la variazione del prezzo quando la dimensione della casa varia di un piede quadrato.

La variazione del prezzo è costante, cioè non dipende da SQFT .

Potrebbe avere più senso che la variazione di PRICE dipenda da SQFT .

(4)

Example (Prezzo delle case e superficie)

Possiamo incorporare questa idea nel nostro modello in due modi

introdurre nel modello il termine al quadrato SQFT²; trasformare il modello lineare in un modello log-lineare, dove la variabile dipendente diventa log(PRICE ).

In entrambe le circostanze osserveremo che la variazione di PRICE rispetto a SQFT non è costante.

(5)

y = a + bx².

Diamo per scontato il significato di a b. La pendenza della curva è data da

dy

dx =2bx . L’elasticità invece è data da

ε = dy /y dx /x = dy

dx x

y = 2bx² y .

(6)

(7)

Example (Prezzo delle case e superficie) Consideriamo un modello quadratico

PRICE = β₁+ β₂SQFT²+e.

La pendenza stimata è d \PRICE

dSQFT =2 bβ₂SQFT .

Una possibile interpretazione è la seguente: se bβ₂>0, il prezzo di case più grandi aumenta più che proporzionalmente.

(8)

Consideriamo i dati. Per 1080 abitazioni vendute a Baton Rouge, LA, nel 2005, l’equazione quadratica stimata è

PRICE = 55776.56 + 0.0154SQFT\ ². L’inclinazione stimata è

d \PRICE

dSQFT =2 × 0.0154 × SQFT mentre l’elasticità stimata è data da

bε = d \PRICE dSQFT

SQFT

PRICE =2 × 0.0154SQFT² PRICE.

(9)

(10)

Per calcolare l’elasticità in pratica partiamo dal modello stimato PRICE = b\ β₁+ bβ₂SQFT².

Supponiamo di voler conoscere il prezzo per tre valori di SQFT SQFT = {2000, 4000, 6000} .

I valori corrispondenti di \PRICE sono

PRICE = {117461.77, 302517.39, 610943.42} .\

(11)

Sostituendo i valori di \PRICE e SQFT nell’espressione della elasticità

ε =b d \PRICE dSQFT

SQFT

PRICE =2 × 0.0154SQFT² PRICE otteniamo

bε = {1.05, 1.63, 1.82} .

Questo significa che, nel caso di un’abitazione di 2000 piedi quadrati, se la superficie abitabile aumenta dell’1%, il prezzo crescerà dell’1.05%.

(12)

Consideriamo la funzione log-lineare logy = a + bx .

La prima cosa che possiamo notare è che sia la pendenza che l’elasticità variano in ogni punto ed hanno lo stesso segno di b.

La pendenza è d log y

dx = d log y dy

dy dx = 1

y dy

dx =b =⇒ dy dx =by L’elasticità invece è data da

ε = dy /y dx /x =bx .

(13)

Il modello log-lineare ci permette di calcolare la semielasticità, cioè la variazione percentuale di y a fronte di un incremento unitario di x . Dai risultati precedenti abbiamo che

d log y dx =b quindi

η =100dy /y

dx =100 × b

(14)

Example (Prezzo delle case e superficie) Consideriamo un modello log-lineare

log(PRICE ) = β₁+ β2SQFT + e.

Una delle proprietà della trasformazione log-lineare è che regolarizza variabili distribuite asimmetricamente.

Questa trasformazione può essere quindi molto utile quando si usano variabili strettamente positive come prezzi, età, misure di vario tipo (per esempio peso, altezza, distanza, superficie).

(15)

(16)

(17)

Example (Prezzo delle case e superficie) Il modello log-lineare stimato è

log( \PRICE ) = 10.8386 + 0.0004113SQFT . La stima del prezzo si può quindi calcolare usando una trasformazione esponenziale

PRICE = exp\

log( \PRICE )

= exp (10.8386 + 0.0004113SQFT ) .

(18)

La pendenza nel modello log-lineare si calcola nello stesso modo

d \PRICE

dSQFT = d exp(10.8386 + 0.0004113SQFT ) dSQFT

=0.0004113 \PRICE .

Questo significa che se abbiamo una casa con

PRICE = $100000, l’aumento stimato di PRICE , se SQFT\ aumenta di una unità, è pari a $41.13.

Allo stesso modo, se \PRICE = $500000, l’aumento stimato è di $205.63.

(19)

Ricordiamoci che nel modello log-lineare l’elasticità è ε = bx , quindi, nel nostro caso, l’elasticità stimata è

ε = bb β₂SQFT = 0.0004113SQFT .

Per una abitazione di 2000 piedi quadrati, l’elasticità stimata è 0.823. Quindi, se la superficie aumenta dell’1% il prezzo aumenterà dello 0.823%.

Allo stesso modo, per una abitazione di 4000 piedi quadrati, l’elasticità stimata è 1.645. Quindi, se la superficie aumenta dell’1% il prezzo aumenterà dello 1.645%.

(20)

Example (Prezzo delle case e superficie) Usando l’espressione della semielasticità

η =100dy /y

dx =100b

osserviamo che per un aumento unitario della superficie l’aumento stimato del prezzo è pari allo 0.04%.

Alternativamente, possiamo dire che ad aumento di 100 piedi quadrati causa un aumento del prezzo di circa il 4%.

(21)

Come scegliamo la nostra forma funzionale?

Abbiamo alcune linee guida essenziali che possono aiutarci a risolvere questo problema.

La forma funzionale deve essere coerente con la teoria economica.

La forma funzionale deve adattarsi bene ai dati.

La forma funzionale deve soddisfare le ipotesi del modello.

Nella scelta della forma funzionale dobbiamo tenere in

considerazione il fatto che il modello vero è ignoto e possiamo solo sperare che i suggerimenti di cui sopra ci indirizzino verso la scelta corretta.

(22)

Una variabile indicatrice (dicotomica, binaria, dummy) assume valori 0 o 1.

Di solito queste variabili sono usate per rappresentare caratteristiche qualitative come il genere, l’etnia o il luogo di residenza. Consideriamo, per esempio, la variabile UTOWN

UTOWN =

1 : l⁰abitazione si trova a University Town 0 : l⁰abitazione si trova a Golden Oaks Supponiamo di avere il modello

PRICE = β₁+ β₂UTOWN + e.

Come interpretiamo una regressione di questo tipo?

(23)

(24)

Dal modello

PRICE = β₁+ β₂UTOWN + e.

Calcoliamo il valore atteso

E [PRICE |UTOWN] = E [β₁+ β2UTOWN + e|UTOWN]

= β₁+ β₂UTOWN.

Il risultato finale de dovuto alle ipotesiRS1 e RS2.

(25)

Adesso calcoliamo il valore atteso per i due valori di UTOWN E [PRICE |UTOWN = 1] = β₁+ β₂UTOWN = β₁+ β₂ e

E [PRICE |UTOWN = 0] = β₁+ β₂UTOWN = β₁. Cosa osserviamo?

(26)

In questo modello semplice possiamo stimare i parametri usando delle medie campionarie. In particolare

βb1=PRICE_(UTOWN=0). Inoltre

E [PRICE |UTOWN = 1] − E [PRICE |UTOWN = 0] = β₂ quindi lo stimatore naturale sarebbe

βb2=PRICE_(UTOWN=1)− PRICE_(UTOWN=0). La meccanica del risultato è probabilmente chiara. Il suo significato è cheun regressore che è una dummy ci consente di stimare la differenza di medie fra sottopopolazioni.