• Non ci sono risultati.

3 ANALISI DEL MERCATO: LA DIPENDENZA DALLE BANCHE DELLE

3.2 I MODELLI ECONOMETRICI

Generalmente, la maggior parte delle applicazioni di regressioni multiple si effettua su dataset con dati puramente cross-section o time-series. Nonostante questi due casi siano molto frequenti, un utilizzo congiunto delle due dimensioni è sempre più utilizzato nella ricerca empirica.

La scelta di effettuare l’analisi tramite dati panel permette di lavorare con maggiori informazioni rispetto a dataset più semplici, introducendo più variabilità e riducendo di conseguenza la collinearità fra le variabili. Di conseguenza i parametri sono stimati più efficientemente e precisamente. Inoltre essi permettono di studiare le dinamiche di variazione dei dati, mentre, ad esempio, dati puramente cross-section permettono solamente di studiare un’immagine istantanea della situazione in un determinato momento (Hsiao C., 2003).

Per questo motivo nell’analisi empirica si è utilizzato un dataset in forma panel che, combinando gli approcci cross-section e time-series, permette di ottenere le osservazioni campionando i medesimi k individui, famiglie, gruppi o aziende in differenti T periodi temporali. Nello specifico, le variabili relative alle 75 aziende

1 Al momento della scrittura dell’elaborato di tesi (Agosto 2017), il numero delle imprese quotate è

36 quotate su AIM Italia – MAC, si riferiscono ad un arco temporale di dieci anni che va dal 2007 al 2016.

Normalmente i dati panel vengono utilizzati in modo da verificare se l’ipotesi di esistenza di una funzione lineare tra la variabile dipendente e un numero k di variabili indipendenti è verificata. Il modello generale per l’unità statistica i al periodo t è il seguente:

𝑦

𝑖𝑡

= 𝛽

0

+ 𝛽

1

𝑥

1𝑖𝑡

+ 𝛽

2

𝑥

2𝑖𝑡

+ ⋯ + 𝛽

𝑘

𝑥

𝑘𝑖𝑡

+ 𝑢

𝑖𝑡

𝑖 = 1 … 𝑁 ; 𝑡 = 1 … 𝑇

In questa formula, il termine yit rappresenta la variabile dipendente, β0 è la costante del

modello, i vari βi sono i coefficienti delle variabili e le xit sono le variabili indipendenti.

Il termine d’errore uit può essere scomposto in due parti: αi e Ꜫit. Il primo termine indica

una costante caratteristica di ogni unità statistica i, che tiene conto dell’effetto sulla variabile dipendente di un insieme di variabili non osservate che rimangono costanti nel tempo. Generalmente αi viene anche chiamato unobserved factor o effetto fisso. Il fatto

stesso che il pedice sia scritto come i e non come it indica come l’effetto fisso sia time invariant (Wooldridge J.M., 2013). Il secondo termine Ꜫit invece viene chiamato time

varying error o errore idiosincratico, perché rappresenta l’errore casuale che influenza la variabile dipendente.

Al fine di ottenere risultati il più possibile precisi ed attinenti alla realtà sono stati utilizzati tre modelli: il modello Pooled Ordinary Least Squares, il modello ad effetti fissi (Fixed Effects, FE) ed il modello ad effetti casuali (Random Effects, RE).

Pooled Ordinary Least Squares

Il più semplice modello di stima per dati panel è il modello Pooled OLS, che sfrutta lo stimatore dei minimi quadrati ordinari. Nella maggior parte dei casi è improbabile che esso sia adeguato ma offre un supporto di base per un confronto con modelli più complessi. La definizione del modello Pooled OLS può essere scritta come:

37 yit rappresenta l’osservazione della variabile dipendente per l’unità cross-section i al

periodo t, xit è l’osservazione della variabile indipendente per l’unità i al periodo t, β è il

parametro relativo alla variabile indipendente e uit è un errore o termine di disturbo

specifico per l’unità i al tempo t.

L’utilizzo del modello Pooled OLS presenta uno svantaggio rilevante, ovvero il fatto che, per utilizzare il modello ed ottenere stime corrette e consistenti di β, è necessario assumere che la media degli errori uit, condizionata alla conoscenza delle variabili

indipendenti xit o degli unobserved factors αi, sia nulla e quindi che valga la seguente

condizione:

𝐸[𝑢

𝑖𝑡

|𝑥

𝑖𝑡

, 𝛼

𝑖

] = 0

Se viene stimato il modello Pooled OLS, esso è inconsistente e distorto se tale condizione non è verificata. La distorsione dovuta a questo problema viene chiamata anche heterogeneity bias ed è dovuta semplicemente al fatto che non sono state incluse variabili rilevanti del modello, le quali però sono correlate con le variabili osservate. Gli stimatori Pooled OLS necessitano della validità di altre quattro ipotesi per essere considerati corretti e consistenti:

• Linearità nei parametri: La variabile dipendente è formulata come funzione lineare di variabili indipendenti e del termine di disturbo;

𝑦

𝑖𝑡

= 𝛽

0

+ 𝛽

1

𝑥

1𝑖𝑡

+ 𝛽

2

𝑥

2𝑖𝑡

+ ⋯ + 𝛽

𝑘

𝑥

𝑘𝑖𝑡

+ 𝛼

𝑖

+ 𝑢

𝑖𝑡

• I dati sono ottenuti da un campionamento casuale della popolazione; • Assenza di collinearità perfetta;

• La covarianza tra gli effetti fissi e le variabili indipendenti deve essere uguale a zero;

𝐶𝑜𝑣 (𝛼

𝑖

, 𝑥

𝑖𝑡

) = 0

Il modello ad effetti fissi (FE Model)

Dal momento che, in molti casi, le condizioni di media condizionata nulla e covarianza nulla fra effetti fissi e variabili indipendenti, necessarie per ottenere stimatori corretti e

38 consistenti con il metodo Pooled OLS sono violate, è necessario eliminare la parte di errore che rimane costante nel tempo e stimare un nuovo modello che contempli solamente l’errore idiosincratico: questa è la procedura alla base del modello ad effetti

fissi. Come abbiamo già visto, è possibile scomporre il termine uit, indicante tutte le

variabili non osservabili, nelle sue due componenti Ꜫit e αi.

𝑢

𝑖𝑡

= 𝛼

𝑖

+ 𝜀

𝑖𝑡

Sostituendo la scomposizione dell’errore nel modello base utilizzato anche nel modello Pooled OLS si da origine al modello seguente:

𝑦

𝑖𝑡

= 𝛽𝑥

𝑖𝑡

+ 𝛼

𝑖

+ 𝜀

𝑖𝑡

αi è la parte dell’errore dipendente dall’unità osservata e indipendente rispetto al tempo,

comprendente l’effetto di tutte le variabili non osservabili e Ꜫit è la parte dell’errore

peculiare dell’osservazione. Il modello ad effetti fissi si concentra sull’eliminazione dell’intercetta αi, costante nel tempo, in quanto essa contiene valori non osservabili e

che quindi verrebbero considerati parte integrante dell’errore del modello. “L’interpretazione di αi come intercetta specifica per ogni i deriva dall’analisi della retta

di regressione per l’i-esimo stato; tale retta è αi + βxit. La pendenza della retta di

regressione β è la stessa per tutti gli stati, ma la sua intercetta varia da uno stato a un altro” (Stock J.H., Watson M.W., 2005). Tali valori potrebbero essere correlati con le variabili esplicative xit, restituendo una stima distorta. L’eliminazione del termine αi si

basa sul procedimento di data-demeaning: esso consiste nella sottrazione della media di gruppo da ognuna delle variabili e nella stima del modello senza intercetta attraverso lo stimatore Pooled OLS (Wooldridge J.M., 2013). La variabile dipendente può essere riscritta come:

𝑦

𝑖𝑡

̈ = 𝑦

𝑖𝑡

− 𝑦̅

𝑖

E la media di gruppo è definita come:

𝑦̅ =

𝑖

1

𝑇∑

𝑦

𝑖𝑡

𝑇 𝑡=1

39 dove T è il numero di osservazioni per l’unità i. Una formulazione analoga si applica anche alle variabili indipendenti. Si consideri un modello semplificato, per chiarezza, con una sola variabile esplicativa.

𝑦

𝑖𝑡

= 𝛽

1

𝑥

𝑖𝑡

+ 𝛼

𝑖

+ 𝜀

𝑖𝑡

Si vada a riscrivere l’equazione utilizzando le medie delle variabili nel tempo.

𝑦̅ = 𝛽

𝑖 1

𝑥̅ + 𝛼

𝑖 𝑖

+ 𝜀̅

𝑖

Dal momento che αi è costante nel tempo, esso appare in entrambe le due precedenti

operazioni. Se si sottrae la penultima equazione all’ultima equazione per ogni t si ottiene:

𝑦

𝑖𝑡

− 𝑦̅ = 𝛽

𝑖 1

(𝑥

𝑖𝑡

− 𝑥̅ ) + 𝜀

𝑖 𝑖𝑡

− 𝜀̅̅̅

𝑖𝑡

𝑦

𝑖𝑡

̈ = 𝛽

1

𝑥

𝑖𝑡

̈ + 𝜀

𝑖𝑡

̈

In questo modo l’effetto fisso αi scompare dall’equazione, ed è possibile procedere alla

stima tramite Pooled OLS sulle variabili time-demeaned (Wooldridge J.M., 2013).

Riscrivere l’equazione appena ottenuta per un modello con più variabili è un procedimento ora semplice, ottenendo la seguente equazione con variabili time- demeaned per ogni i:

𝑦

𝑖𝑡

̈ = 𝛽

1

𝑥

𝑖𝑡1

̈ + 𝛽

2

𝑥

𝑖𝑡2

̈ + ⋯ + 𝛽

𝑘

𝑥

𝑖𝑡𝑘

̈ + 𝜀

𝑖𝑡

̈

In questo modello come possiamo ben comprendere, non si ha più la necessità dell’ipotesi relativa alla media condizionata nulla degli errori rispetto agli effetti fissi, questo perché, l’effetto fisso stesso, viene eliminato mediante il processo di data- demeaning.

Il modello ad effetti casuali (RE Model)

Diversamente dal FE Model, il modello ad effetti casuali viene qualificato come un quasi-demeaned system dal momento che invece di sottrarre l’intera media dai valori di tutte le variabili, ne viene sottratta solamente una frazione, equivalente a λ. Per la stima

40 di coefficienti corretti e consistenti, in questo caso, devono valere le stesse cinque condizioni necessarie nel modello Pooled OLS.

Partendo dal modello base ad una sola variabile, rappresentabile dall’equazione seguente:

𝑦

𝑖𝑡

= 𝛽

0

+ 𝛽

1

𝑥

1𝑖𝑡

+ 𝛼

𝑖

+ 𝜀

𝑖𝑡

Sfruttando questa equazione si prosegue col determinare i quasi-demeaned data, ossia la frazione della media dei valori delle variabili.

λ𝑦

̅

𝑖

= λ𝛽

0

+ λ𝛽

1

𝑥

̅̅̅̅

1𝑖

+ 𝛼

𝑖

+ 𝜀

̅

𝑖

Sottraendo l’ultima equazione alla penultima equazione, il risultato che si ottiene è:

𝑦

𝑖𝑡

− λ𝑦̅ = 𝛽

𝑖 0

(1 − λ) + 𝛽

1

(𝑥

1𝑖𝑡

− λ𝑥̅̅̅̅) + 𝜀

1𝑖 𝑖𝑡

− 𝜀̅

𝑖

Per quanto riguarda il termine λ, matematicamente rappresenta la frazione per cui viene moltiplicata la media delle varie variabile e analiticamente si può calcolare nel modo seguente:

λ = 1 − (

𝜎

𝜀 2

𝜎

𝜀2

+ 𝑇𝜎

𝛼2

)

1 2

σꜪ2 rappresenta la varianza dell’errore idiosincratico mentre σα2 rappresenta la varianza

dell’effetto fisso. Generalmente il valore di λ, è compreso tra zero ed uno, poiché nel caso in cui lambda valga zero, una volta ottenuto il modello, si svolge una regressione lineare semplice nello stesso modo in cui avviene nel modello Pooled, mentre nel caso in cui lambda valga uno si otterrebbe il modello con effetti fissi, sfruttando il processo di data-demeaning.

L’Hausman Test

Uno strumento per comprendere che tipo di modello statistico sia più adatto a spiegare i dati fra il modello ad effetti casuali ed il modello ad effetti fissi è il cosiddetto Hausman Test. L’Hausman Test è stato progettato per rilevare l’eventuale violazione dell’ipotesi

41 necessaria nel modello ad effetti casuali secondo cui le variabili indipendenti debbano essere incorrelate con l’unobserved factor, ossia:

𝐶𝑜𝑣(𝛼

𝑖

; 𝑋

𝑖𝑡

) = 0

Nel caso in cui la suddetta ipotesi sia valida, ciò comporterebbe che gli stimatori dei modelli random effects e fixed effects siano entrambi consistenti ma sarebbe da preferire il primo in quanto più efficiente, grazie ad uno standard error minore. Viceversa, se l’ipotesi non fosse valida, solamente lo stimatore del modello ad effetti fissi sarebbe consistente ma non quello del modello ad effetti casuali e la scelta ricadrebbe sull’utilizzo del fixed effects. La statistica H dell’Hausman Test, in estrema sintesi, è una misura della differenza fra questi due stimatori:

𝐻 =

(𝛽̂

𝐹𝐸

− 𝛽̂

𝑅𝐸

)

𝑉𝑎𝑟(𝛽̂

𝐹𝐸

) − 𝑉𝑎𝑟(𝛽̂

𝑅𝐸

)

Sotto l’ipotesi nulla di ortogonalità, H si distribuisce come una funzione Chi-quadrato con gradi di libertà pari al numero di regressori nel modello. Con un risultato pari a p < 0.05, ai livelli di significatività convenzionali, i modelli possono essere considerati diversi abbastanza da rifiutare l’ipotesi nulla e quindi di usare il modello ad effetti fissi al posto di quello ad effetti casuali. Se l’Hausman Test non produce una significativa differenza (p > 0.05), ciò comunque non significa che lo stimatore del modello random effects sia senza distorsioni e quindi da preferirsi allo stimatore del modello fixed effects. Spesso, infatti, nel caso in cui l’Hausman Test fallisca a rifiutare l’ipotesi nulla non è tanto per il fatto che la reale correlazione tra le variabili indipendenti e l’unobserved factor sia esattamente zero, quanto più per il fatto che il test non ha la “potenza statistica” necessaria, in termini di osservazioni, per rifiutare affidabilmente l’ipotesi nulla (Clark T.S., Linzer D.A., 2012).

3.3 L’ANALISI DEL MERCATO: EFFETTI DELLA QUOTAZIONE SULLA

Documenti correlati