• Non ci sono risultati.

Credit scoring

3.3 Analisi multivariata

3.3.1 Analisi discriminante

L’analisi discriminante, introdotta da R. A. Fisher nel 1936, rappresenta un modello sta-tistico basato sull’identificazione di variabili in grado di analizzare e discriminare in modo ottimale tra imprese sane e imprese anomale. Questa tecnica applica l’analisi multivariata, raggiungendo un grande vantaggio dal punto di vista delle analisi economico-finanziarie, in quanto consente di valutare contemporaneamente più variabili.

In poche parole, l’analisi discriminante utilizza tutte le informazioni disponibili estratte da un campione di imprese in esame, con l’obiettivo di tracciare un confine e distinguere, nel modo più corretto possibile, tra imprese sane e imprese anomale.

In questo modo, si riesce a rendere più completo il ragionamento sviluppato sui dati contabili delle imprese: si cerca di verificare se una generica impresa è più vicina a un insieme di imprese sane o a un insieme di imprese anomale e, se è più vicina all’insieme di imprese sane, si dice che l’impresa ha basse probabilità di default, mentre, se è più vicina all’insieme di imprese anomale, si dice che l’impresa ha alte probabilità di default.

3.3 – Analisi multivariata

In figura3.2è possibile osservare l’idea alla base dell’analisi discriminante in un caso semplificato, in cui le imprese sane e le imprese anomale sono descritte da due sole variabili, x1 e x2.

x1

x2

Z

Funzione discriminante

A

zA B

zB

Figura 3.2. Sintesi grafica dell’analisi discriminante.

Sull’asse Z è rappresentato il credit score, che prende il nome di funzione discriminante, generato combinando insieme con determinati coefficienti le variabili di interesse.

Funzione discriminante

L’analisi discriminante, considerando la sua versione più semplice e più utilizzata, ovvero l’analisi discriminante lineare, costruisce il credit score zi come combinazione lineare di una serie di variabili indipendenti xi,j. In generale, considerando n variabili indipendenti, è possibile calcolare il credit score per la generica impresa i-esima nel modo seguente:

zi =

n

∑︂

j=1

γj· xi,j . (3.1)

I coefficienti γj di questa combinazione lineare sono scelti, tra tutte le infinite soluzioni possibili, in modo da ottenere un credit score che discrimini in modo quanto più possibile corretto tra imprese sane e imprese anomale. In questo modo, il credit score deve essere in grado di massimizzare la distanza tra le medie dei due gruppi di imprese, zA e zB, che prendono il nome di centroidi.

Credit scoring

A questo proposito, è possibile dimostrare che, per soddisfare la precedente condizione, il vettore dei coefficienti γ deve verificare la seguente condizione:

γ= Σ−1·(xA− xB) , (3.2)

dove:

• Σ−1 = inversa della matrice di varianza/covarianza tra le n variabili indipendenti;

• xA = vettore della media delle n variabili indipendenti per le imprese sane;

• xB = vettore della media delle n variabili indipendenti per le imprese anomale.

A questo punto, è possibile assegnare, per ogni impresa, un punteggio del credit score, al variare dei valori assunti dalle variabili indipendenti del modello e, una volta fissata una specifica soglia, o cut-off point, differenziare tra imprese sane e imprese anomale.

Stima dei coefficienti

Per spiegare approfonditamente l’analisi discriminante è possibile seguire due step diversi.

Il primo passo dell’analisi discriminante consiste nell’approccio non parametrico, nel quale non si effettua nessuna ipotesi sulla forma della distribuzione delle diverse variabili di interesse. In questo caso, lavorando con due gruppi di imprese diverse, sane e anomale, l’obiettivo è costruire una funzione decisionale di tipo lineare, individuando i parametri che servono per calcolare la media ponderata delle variabili, in modo tale che gli errori di classificazione siano i minori possibili e, conseguentemente, la classificazione sia ottimale.

In pratica, si modella la scelta dei pesi con cui ponderare le variabili, con la finalità di distanziare il più possibile il gruppo delle imprese sane dal gruppo delle imprese anomale, ovvero massimizzando la variabilità tra i gruppi e minimizzando la variabilità nei gruppi.

Per ottenere questo risultato, è sufficiente massimizzare un rapporto specifico, ovvero il rapporto tra la varianza tra i gruppi e la varianza nei gruppi, facendo emergere una soluzione per il vettore dei pesi pari al prodotto tra il vettore della differenza tra le medie e l’inversa della matrice di varianza/covarianza. Il vettore dei pesi, così calcolato, costituisce il vettore ottimale, in grado di ridurre il più possibile gli errori di classificazione.

Il secondo passo dell’analisi discriminante riguarda l’approccio parametrico, che pre-vede di fare un’assunzione forte sulla forma della distribuzione delle variabili di interesse, ipotizzando una distribuzione normale multivariata. In questo caso, è possibile impostare la decisione di assegnare una generica impresa al gruppo delle imprese sane oppure al gruppo delle imprese anomale, analizzando la probabilità di appartenere ai due gruppi.

Pertanto, si sceglie di assegnare una nuova osservazione al gruppo delle imprese sane se la probabilità di appartenere alle sane è maggiore rispetto alla probabilità di appartenere alle anomale e, viceversa, al gruppo delle imprese anomale se la probabilità di appartenere alle sane è minore rispetto alla probabilità di appartenere alle anomale.

A questo punto, è possibile osservare come si ottenga la stessa forma funzionale, sia nel caso di approccio parametrico che nel caso di approccio non parametrico, mettendo in evidenza il fatto che l’analisi discriminante conduce sempre alla stessa funzione decisionale.

L’uguaglianza della forma funzionale costituisce, infatti, un aspetto molto importante, poiché significa che questo modello risulta robusto alla violazione delle ipotesi di partenza.

3.3 – Analisi multivariata

Z-score di E. I. Altman

E. I. Altman ha definito il primo modello di credit scoring basato sull’analisi discriminante, realizzando un significativo salto di qualità sulla valutazione dell’insolvenza di un’impresa.

Questo modello, applicato inizialmente nel 1968 per le imprese quotate degli Stati Uniti e successivamente modificato e aggiornato, è funzione di cinque variabili indipendenti [3]:

zi = 1,20 · xi,1+ 1,40 · xi,2+ 3,30 · xi,3+ 0,60 · xi,4+ 1,00 · xi,5 , (3.3) dove:

• xi,1= capitale circolante/totale attivo;

• xi,2= utili non distribuiti/totale attivo;

• xi,3= EBIT/totale attivo;

• xi,4= valore di mercato del patrimonio netto/valore contabile dei debiti;

• xi,5= fatturato netto/totale attivo.