• Non ci sono risultati.

4. Soluzioni metodologiche per l’analisi dei fenomeni finanziari:

4.3 La classificazione dei titoli finanziari

4.3.4 La stima dei modelli

La stima del modello a classi latenti specificato nelle equazioni (4.1) e (4.2) e di quello a profilo latente mostrato nell’equazione (4.3) viene effettuata per diversi valori di K in modo da determinare il minor numero di classi latenti in

grado di spiegare le relazioni osservate tra le variabili manifeste.

Solitamente, l’analisi comincia con la stima del modello base con una sola classe latente che corrisponde all’assumere l’indipendenza tra le variabili osservate. Se il modello base fornisce un adattamento adeguato ai dati allora non

8 Come segnalato nel paragrafo 4.1, recentemente gli indici azionari del mercato italiano elencati

in questa analisi sono stati sostituiti da altri indici realizzati seguendo gli standard del FTSE Group di Londra. Tuttavia, i nuovi indici risultano molto simili e, il più delle volte identici, a quelli considerati soprattutto per quanto riguarda la metodologia di calcolo ed il numero delle azioni

c’è bisogno di effettuare alcuna analisi, in quanto non esistono relazioni tra le variabili manifeste che possono essere spiegate attraverso la variabile latente e tutte le osservazioni appartengono alla stessa popolazione e, quindi, alla medesima classe.

I risultati del modello a classi latenti per diversi valori di K sono riportati nella

tabella 4.5. Il valore significativamente diverso da zero della statistica L2 indica

che il modello con una classe latente debba essere rifiutato e, per questo motivo, le associazioni esistenti nei dati non possono essere spiegate senza il ricorso ad una variabile latente con almeno 2 classi.

Modello LL NPar L2 gdl p-value AIC(LL)

1 classe -303,585 3 140,61 32 1,4E-15 613,17 2 classi -252,244 11 37,93 24 0,035 526,49 3 classi -241,309 19 16,06 16 0,45 520,62 4 classi -238,982 27 11,41 8 0,18 531,96

Tabella 4.5: risultati dei modelli a classi latenti con un diverso numero di classi

Il modello con 2 classi latenti fornisce una forte riduzione del valore di L2

(73% rispetto al modello base), tuttavia, questa statistica risulta ancora troppo elevata (L2 = 37,93; gdl = 24; p-value < 0,05). Aggiungendo una terza classe al

modello si ottiene una ulteriore riduzione di L2 (89% rispetto al modello base) ed

un adattamento ai dati adeguato. La tabella 4.5 mostra che, in base alla statistica AIC che prende in considerazione anche la parsimonia, il modello con 3 classi latenti è preferibile rispetto al modello con 4 classi.

Un altro metodo di diagnostica utile per valutare l’adattamento ai dati del modello è definito sulla base dei residui bivariati (BVR; Magidson e Vermunt, 2001). In questo test basato sul chi-quadrato di Pearson, la relazione tra due variabili viene analizzata confrontando le frequenze osservate con quelle teoriche

stimate dal modello. Un valore del BVR sostanzialmente maggiore di uno suggerisce che il modello a classi latenti non è in grado di spiegare adeguatamente l’associazione esistente tra quelle due variabili.

In tabella 4.6 vengono riportati i valori del BVR per ogni coppia di variabili riferiti ai vari modelli a classi latenti stimati. La tabella 4.6 mostra come i modelli che presentano tutti i valori di BVR inferiori ad 1 siano quelli con 3 e 4 classi latenti, confermando il fatto che K = 3 può considerarsi come la miglior soluzione

in grado di spiegare adeguatamente le associazioni esistenti tra le variabili manifeste. La scelta del numero di classi sulla base di indicatori statistici rappresenta un passo fondamentale dell’analisi, in quanto permette di definire il numero dei gruppi in cui vengono classificati i titoli azionari.

Coppie di

variabili 1 classe 2 classi 3 classi 4 classi [MS] 6,967 0,249 0,002 0,000 [MP] 10,886 0,013 0,007 0,031 [SP] 70,757 0,033 0,011 0,002 [MC] 3,671 1,920 0,403 0,274 [SC] 2,167 0,287 0,053 0,059 [PC] 2,506 0,090 0,156 0,047

Tabella 4.6: valori di residui bivariati (BVR) relativi ai vari modelli a classi latenti

La tabella 4.7 illustra i risultati della stima di massima verosimiglianza per il modello con tre classi latenti. Le stime dei parametri mostrano che due classi latenti hanno probabilità (a priori) piuttosto simili mentre la terza ha una dimensione inferiore: quasi il 45% delle azioni sono stimate essere nella Classe 1 (πx=1 = 0,448), il 40% nella Classe 2 (πx=2 = 0,402) ed il restante 15% nella Classe

Variabile manifesta Classe 1 Classe 2 Classe 3 Categorie 0,4478 0,4022 0,1500 πm=basso|x 0,3605 0,8177 0,0211 M πm=alto|x 0,6395 0,1823 0,9789 x m z | 1,6395 1,1823 1,9789 πs=alto|x 0,0061 0,9063 0,8875 S πs=basso|x 0,9939 0,0937 0,1125 x s z| 1,9939 1,0937 1,1125 πp=basso|x 0,0732 0,9200 0,6503 P πp=alto|x 0,9268 0,0800 0,3497 x p z | 1,9268 1,0800 1,3497

Tabella 4.7: risultati del modello a 3 classi latenti, probabilità condizionate e medie delle variabili manifeste dicotomiche

La stima del modello a profilo latente per diversi valori di K permette la

definizione del numero di classi più adatta a spiegare le relazioni esistenti tra le variabili manifeste continue. In tabella 4.8 vengono illustrati i valori della log- verosimiglianza, il relativo numero di parametri, la statistica AIC ed il test del rapporto di verosimiglianza ottenuto tramite il metodo bootstrap e condotto

confrontando le log-verosimiglianze dei modelli con K e K - 1 classi. Quando il

test risulta significativo, l’aggiunta di una ulteriore classe latente fornisce un miglior adattamento del modello ai dati.

Dalla tabella 4.8 è possibile determinare il modello che presenta il migliore adattamento. In primo luogo, si può notare come la funzione di log- verosimiglianza raggiunga il massimo in corrispondenza del modello con 9 classi latenti. Come secondo riferimento, anche il criterio AIC suggerisce il modello a profilo latente con 9 classi come soluzione più adeguata. Infine, una ulteriore conferma emerge dal test del rapporto di verosimiglianza ottenuto tramite il

metodo bootstrap (Bootstrap -2LL Diff.). I valori del test, infatti, risultano tutti

significativamente diversi da zero, tranne per il confronto tra il modello con 9 e 10 classi latenti, evidenziando, perciò, la presenza di 9 sottopopolazioni diverse in cui i 208 titoli azionari oggetto di analisi sono suddivisi.

Modello LL NPar AIC(LL) Bootstrap

-2LL Diff. p-value 1 classe -1895,49 8 3806,98 - - 2 classi -1712,91 29 3483,83 365,16 0,000 3 classi -1659,09 50 3418,17 107,65 0,000 4 classi -1629,33 71 3400,66 59,51 0,004 5 classi -1601,11 92 3386,22 56,44 0,002 6 classi -1570,73 113 3367,46 60,76 0,000 7 classi -1553,58 134 3375,17 45,89 0,038 8 classi -1528,40 155 3366,80 50,37 0,004 9 classi -1503,00 176 3358,00 50,79 0,000 10 classi -1493,99 197 3381,99 23,36 0,119

Tabella 4.8: risultati dei modelli a profilo latente con un diverso numero di classi

La tabella 4.9 mostra i risultati della stima del modello a profilo latente, illustrando le probabilità a priori e le medie condizionate dei 4 indicatori. Le nove classi latenti sono numerate rispetto alla loro dimensione, ovvero rispetto alle probabilità a priori πx|c,i illustrate nella prima riga di tabella 4.9. La Classe 1 rappresenta il gruppo modale e comprende il 18,8% delle azioni, mentre la Classe 9 è la più piccola e raggruppa solo il 3,8% dei titoli azionari. Dalle probabilità a priori si può osservare la presenza di alcuni gruppi piuttosto piccoli, ad esempio le Classi 7, 8 e 9, ed altri alquanto importanti come le Classi 1, 2 e 3 che, se cumulate, raggruppano il 50% dei titoli azionari.

In tabella 4.9, le nove classi latenti sono state ordinate rispetto al valor medio condizionato dell’indicatore R (µˆ(R |x)). Cl 7 Cl 4 Cl 3 Cl 2 Cl 1 Cl 8 Cl 5 Cl 6 Cl 9 i c x|, π 0,065 0,138 0,146 0,166 0,188 0,043 0,112 0,105 0,038 ) | ( ˆ R x µ -3,17 -0,96 -0,30 -0,24 -0,13 0,01 0,28 0,34 1,71 ) | ( ˆ σ x µ 12,70 15,17 11,44 7,49 9,17 14,92 10,54 5,74 19,37 ) | ( ˆ τ1 x µ -30,7 -32,5 -25,9 -18,1 -21,5 -35,6 -21,9 -13,4 -26,1 ) | ( ˆ σC x µ 3,66 4,69 3,49 2,83 3,18 3,76 3,50 2,67 3,82

Tabella 4.9: risultati del modello a profilo latente con 9 classi, probabilità a priori e medie delle variabili manifeste