• Non ci sono risultati.

I modelli logit-probit applicati alla stima della default

2.3 Expected Shortfall ES

3.1.2 Stima della default probability nelle private companies

3.1.2.3 I modelli logit-probit applicati alla stima della default

Entrando nel merito dei modelli in parola applicati alla stima della pd delle con- troparti non quotate, essi rappresentano un’estensione di un modello di regressione lineare definito come:

y 1×n = β k×1 x n×k +  n×1 (3.60) Per semplicità espositiva, senza alcuna perdita di generalità, si procederà conside- rando il caso univariato con un regressore e omettendo la costante della regressione β0. In questo modo, l’Equazione3.60può essere riscritta come:

y= βx +  (3.61)

Il modello rappresentato dall’Equazione3.61è caratterizzato dalla seguente ipotesi distributiva sui termini di erroret:

64 3. Le componenti del rischio di credito

Figura 3.7: Logistic-Normal cumulative distribution function

La v.c. Ytcondizionata alla v.c. Xtsi distribuisce come:

Yt| Xt∼i.i.d. N(βX, σ2). (3.63)

A questo punto è necessario specificare che il modello, così come formulato, permet- te di descrivere l’andamento di una v.c. (endogena) definita nel continuo in funzione di un set di variabili esplicative (esogene). Tuttavia, tenuto conto della natura del problema che si sta affrontando, ovvero la determinazione della pd di una controparte espressa in termini di v.c. bernoulliana, il modello di regressione suddetto non può trovare applicazione diretta. Infatti, al fine proposto, è necessario formulare un mo- dello di regressione non lineare per v.c. discrete a dominio limitato. In altri termini, è necessario stimare un modello in cui la v.c. endogena Yt sia distribuita come una v.c.

di Bernoulli (Yt ∼ Bern(P))23. I modelli idonei a tale scopo sono i modelli logit-probit

che sono stati trattati nella Sezione3.1.2.2.

La principale causa che richiede l’applicazione di modelli non lineari risiede nella natura del problema da analizzare e, più in particolare, nella natura dicotomica degli eventi empiricamente osservabili (default e solvibilità). Tale modo di trattare il proble- ma è senza dubbio più complesso rispetto al caso definito del continuo modellabile

23Tale approccio è correntemente utilizzato da tutte le banche di maggiori dimensioni adottano il

sistema dei rating interni, ovvero da quegli istituti che considerati congiuntamente erogano il 70-80% del credito in Italia.

3.1 Credit Quality 65

attraverso un modello di regressione lineare. Ciò anche perché gli strumenti matema- tici attualmente a disposizione sono più evoluti nella trattazione di fenomeni definiti nel continuo rispetto a quanto non avvenga per i fenomeni definiti nel discreto24. Da qui la necessità di ottenere una rappresentazione biunivoca tra una distribuzione ber- noulliana e una rappresentazione sul continuo attraverso una v.c. continua latente (y∗) ed una soglia (S)25

.

Ricapitolando, si vuole analizzare una v.c. Ybern in funzione di un set di variabili esplicative X (dati di bilancio e dati andamentali) tali per cui la default probability del- la controparte tenderà ad aumentare al peggioramento dei valori dei dati di input e viceversa. Dunque, è indubbio che le variabili di input impattano sulla variabile en- dogena del modello, ovvero la pd; tuttavia resta da chiarire la modalità attraverso cui, all’interno del modello, le v.c. esogene (X) impattano sulla variabile endogena (Ybern): tali variabili, come dimostrato nella Sezione3.1.2.2, impattano nella soglia (S = βX) che è determinata come combinazione lineare di tutti gli indici di bilancio e andamen- tali. Gli spostamenti della soglia impattano sull’ordinamento delle società inserite nel campione ripercuotendosi direttamente sul valore della loro probabilità di default. Più precisamente, spostamenti verso valori maggiori o positivi della soglia indicano una diminuzione della pd, mentre spostamenti della soglia verso valori minori o negativi identificano un aumento della pd. Tutto ciò è una diretta conseguenza del fatto che la G(βx) è funzione lineare di βx e Ybernè funzione non lineare diβx poiché la relazione è

definita per tramite di G(z), ovvero la variabile latente non osservabile.

In termini più generali, un modello di regressione del tipo di quello presentato è definibile non lineare, in quanto le variabili esplicative entrano nel modello come estremi di integrazione (cfr. Figura3.8). Il modello spiega infatti che:

E(ybern = 1 | x) = Z βX=S −∞ G(z) dZ = pd = Pr(bern = 1) (3.64) E(ybern = 0 | x) = Z +∞ βX=SG(z) dZ = 1 − pd = Pr(bern = 0) (3.65)

dove G(z) è la funzione di ripartizione di una v.c. che consente una rappresenta-

24Essenzialmente si tratta della stessa motivazione per cui Black, Scholes e Merton hanno basato la

propria teoria su processi in tempo continuo come il processo di Wiener, seppur dovendo accettare particolari ipotesi distributive dei prezzi dei titoli azionari

25Procedendo in questo modo è stato possibile fornire anche la giustificazione logica, oltre a quella

analitica fornita nella Sezione3.1.2.2, per l’applicazione dei modelli logit-probit alla stima della pd. Infatti, risulterà a questo punto evidente la connessione tra le assunzioni alla base dei modelli logit-probit e la natura del problema che tali modelli sono preposti a trattare. In ogni caso, maggiori approfondimenti in merito verranno forniti nel corso della presente Sezione.

66 3. Le componenti del rischio di credito

Figura 3.8: Rappresentazione nel continuo di una v.c. dicotomica

zione continua del problema discreto seguente:

E(yt|xt)= (1 · pd) + (0 · (1 − pd)) (3.66)

La soglia consente di suddividere in due il dominio della v.c. Z e consente di rappresentare la variabile dicotomica sul continuo. Ancora una volta preme ricordare che le variabili esogene del modello di regressione non definiscono il valore atteso ma gli estremi di integrazione (soglia).

Proseguendo oltre, considerando che la v.c. Z è una variabile di comodo che viene utilizzata per ordinare analiticamente e in modo scientifico le controparti, è possibile scegliere una distribuzione di Z qualsiasi, possibilmente di cui si conosca la formula di risoluzione in forma chiusa26. Per tale ragione, si è optato per una distribuzione logistica che poteva contare sulla possibilità di risoluzione in forma chiusa (Modello Logit). Successivamente, con la diffusione di strumenti di calcolo per la risoluzione in forma aperta degli integrali, si iniziò ad utilizzare anche la distribuzione normale allo scopo di pervenire ad un ordinamento delle controparti (Modello Probit).

26Attualmente per la distribuzione gaussiana non si conosce alcuna formula risolutiva in forma chiusa,

pertanto la distribuzione normale, seppur perfettamente idonea, non sarebbe da preferire qualora non si disponga della possibilità di eseguire numericamente il calcolo.

3.1 Credit Quality 67

E’ evidente che, dal punto di vista logico, non ci sia alcun problema che possa com- promettere la validità del modello: al migliorare dei dati di input aumenta la soglia e diminuisce la pd. Contrariamente, dal punto di vista applicativo, è altrettanto evidente che, a parità di ogni altra condizione, l’ipotesi distributiva sulla v.c. latente influenza in modo considerevole il valore di output del modello, ovvero la probabilità di default. Da questo punto di vista, anche lo stesso Vasicek avrebbe potuto supporre il market value of assets della controparte come v.c. distribuita una distribuzione normale, piuttosto che come una distribuzione log-normale, ottenendo anch’egli risultati diversi. Con riferi- mento al caso ora oggetto di analisi, è possibile avanzare la medesima osservazione, questa volta aggravata dall’impossibilità di dare un’interpretazione economica alla v.c. latente inserita all’interno del modello (almeno nel modello di Merton quella stessa v.c. latente poteva essere interpretata come la pd). Ancora, nel caso in analisi Z è una variabile di comodo, ovvero una v.c. utilizzata solo per rendere continuo un problema che altrimenti sarebbe definito nel discreto. Tuttavia, tale questione non compromette la solidità e l’affidabilità del modello poiché si procede nei termini appena descritti so- lamente per produrre un ordinamento analiticamente fondato delle controparti, tanto che è possibile scegliere qualsiasi v.c. che tale ordinamento non verrà modificato come accade invece per il valore dell’output. Infatti, per costruzione, ad un valore elevato dell’integrale nell’Equazione3.64corrisponde un merito di credito basso: in definitiva, tale v.c. assolve allo stesso ruolo della distance to default nel caso delle società quota- te, ovvero permette di ottenere un ordinamento delle controparti univoco, analitico e fondato. In altri termini, il modello di regressione presentato non è altro che il calcolo della DD per le imprese non quotate, al fine di ottenerne un ordinamento.

Il secondo passo, infine, rimane lo stesso analizzato con riferimento alle imprese quotate (modello kmv) attraverso il mapping della pd: anche in questo caso, infatti, si è reso necessario operare con un metodo a due passi poiché si voglio evitare ipotesi distributive non empiricamente verificabili, ancor più se non è possibile attribuire al- cuna interpretazione economica alla v.c. utilizzata nella specificazione del modello.

Si è visto il modello Logit-Probit che stima la probabilità di default per le private companies: il modello di regressione, per una variabile casuale dicotomica, si basa su una distribuzione latente, ovvero una distribuzione che permette di rappresenta- re in maniera biunivoca una v.c. bernoulliana (variabile discreta) in termini di una distribuzione continua. Quest’ultima non è osservabile e pertanto non è interpreta- bile dal punto di vista economico; in altri termini non è possibile utilizzare il valore dell’integrale nell’Equazione3.64per determinare la probabilità di default. Infatti, per rappresentare la pd in termini corretti si deve necessariamente conoscere la forma di- stributiva sulla quale si va ad applicare l’Equazione3.64. Pertanto, per determinare

68 3. Le componenti del rischio di credito

la pd delle controparti non quotate, ovvero di quelle controparti di cui non si dispone dei prezzi di quotazione delle opzioni e dell’equity, si adotta una logica a due passi che prevede l’ordinamento analitico delle controparti, la loro suddivisione in cluster omogenei e, da ultimo, il mapping della pd sui cluster sulla base dei tassi di default effettivamente osservati.