• Non ci sono risultati.

Stima delle probabilità di default tramite modelli semi markoviani

N/A
N/A
Protected

Academic year: 2021

Condividi "Stima delle probabilità di default tramite modelli semi markoviani"

Copied!
84
0
0

Testo completo

(1)

Università di Pisa

Dipartimento di Economia e Management

LAUREA MAGISTRALE IN:

BANCA, FINANZA AZIENDALE E MERCATI FINANZIARI

TESI DI LAUREA

Stima delle probabilità di default tramite modelli semi markoviani

RELATORE

Prof. Riccardo CAMBINI

LAUREANDO

Alessandro Ghelarducci

(2)
(3)

Sommario

Introduzione ... 1

Capitolo 1: Il rischio di credito ... 3

Cos’è la funzione di intermediazione creditizia ... 3

I processi della funzione creditizia ... 3

Il rischio di credito ... 5

Rating e probabilità di default ... 8

La valutazione del merito creditizio. ... 9

Approcci per la determinazione della probabilità di default ... 11

Capitolo 2: Un’introduzione alle catene di Markov ... 14

Processi stocastici ... 14

Le catene di Markov ... 15

Probabilità di transizione in n passi ... 17

Le equazioni di Chapman-Kolmogorov... 18

Classificazione degli stadi di una Catena di Markov ... 20

Media delle prime n matrici di transizione in t passi ... 22

Distribuzione delle probabilità a tempo t ... 25

Capitolo 3: Un’applicazione pratica delle catene di Markov ... 28

Introduzione all’applicazione pratica ... 28

Calcolo del numero di transizioni avvenute in un periodo considerato ... 29

La matrice di transizione IG-SG ... 40

Capacità predittiva delle catene di Markov... 42

Capitolo 4: Processi semi-markoviani ... 45

Lo strumento delle medie mobili ... 45

Processi semi-markoviani ... 46

Conclusioni ... 66

Appendice ... 67

Bibliografia ... 80

(4)

Introduzione

Considerando che la probabilità di default ricopre un ruolo importante tra le componenti del rischio di credito, in questo lavoro, si è voluto provare a trovare dei metodi per la sua stima. Tra questi abbiamo: la stima delle probabilità di default ottenuta con le catene di Markov e, volendo migliorare l’approssimazione ottenuta con questo metodo, abbiamo utilizzato congiuntamente le catene di Markov con le medie mobili.

Per arrivare a quanto detto, nel primo capitolo viene spiegata che cos’è la funzione di intermediazione creditizia e quali fasi compongono l’attività ad essa relativa. Viene trattato anche il rischio derivante dall’attività creditizia, ovvero il rischio di credito. Nel primo capitolo, inoltre, si analizza le variabili che definiscono tale rischio e come questo possa essere quantificato. In conclusione del primo capitolo, infine, viene posta una maggior attenzione sul rating, sulle probabilità di default e sui metodi che possono essere applicati per il calcolo di queste, in particolare il metodo che tiene in considerazione i rating creditizi.

Nel secondo capitolo, invece, vengono date alcune definizioni introduttive sulle catene di Markov. Per alcune di esse ne viene fornita anche la dimostrazione. Per quanto riguarda i paragrafi conclusivi del capitolo, riguardanti la media delle prime n matrici di transizione in t passi e distribuzione delle probabilità a tempo t, vengono forniti degli esempi pratici. Questi sono stati possibili grazie ai dati messi a disposizione da Matlab.

Nel terzo capitolo viene riportata la descrizione della prima parte dei risultati ottenuti utilizzando Maltab. Con i dati messi a disposizione dallo stesso programma si è calcolato, le probabilità di default effettive e le probabilità di default stimate. Da queste abbiamo estratto quelle riguardanti la classe di rating CCC e le abbiamo riportate su un grafico per confrontarne l’andamento.

Si è potuto notare che l’andamento delle probabilità stimate divergeva sensibilmente dall’andamento di quelle effettive così, nel capitolo successivo si è voluto proporre un metodo che potesse approssimare in modo migliore le probabilità di default effettive. Nel quarto ed ultimo capitolo, utilizzando lo strumento delle medie mobili applicate alle matrici di transizione, si è cercato di migliorare la stima ottenuta precedentemente. Conclusi i calcoli abbiamo riportato su un grafico l’andamento delle probabilità effettive, di quelle stimate nel terzo capitolo e delle probabilità di default stimate utilizzando la media mobile semplice e quella ponderata, tutte relative al rating CCC.

(5)

default effettive rispetto a quello ottenuto utilizzando la metodologia impiegata nel terzo capitolo.

(6)

Capitolo 1: Il rischio di credito

Cos’è la funzione di intermediazione creditizia

La funzione di intermediazione creditizia consiste nel trasferire le risorse finanziarie dalle unità in surplus alle unità in deficit. Questa funzione si manifesta tramite la concessione del credito che va a soddisfare le esigenze di fabbisogno finanziario delle unità in deficit. La funzione di intermediazione creditizia è strettamente legata alla funzione monetaria che prevede la possibilità, da parte della banca di emettere proprie passività.

La banca attribuisce fondamentale importanza alla politica dei prestiti in quanto:

 la specializzazione in merito alla politica dei prestiti si è consolidata negli anni;

 rafforza il rapporto con la clientela comportando di conseguenza benefici reddituali e competitivi;

 la banca reperisce ed elabora dati riservati della clientela. Questo è dovuto principalmente all’esercizio della funzione monetaria.

Nel corso degli anni il contenuto dell’attività creditizia si è modificato, basti pensare al processo di liberalizzazione normativa terminata con l’entrata in vigore del Testo Unico Bancario, il quale ha ampliato la serie degli strumenti finanziari messi a disposizione per soddisfare le esigenze di fabbisogno finanziario delle unità in deficit. Oltre all’ampliamento della serie di strumenti finanziari si è visto anche un ampliamento degli operatori dal lato dell’offerta di fondi, perciò sono nate le società di marchant banking e venture capital, le società finanziarie attive nel comparto del factoring, ecc.

I processi della funzione creditizia

L’attività creditizia si compone di due macrofasi:

1. collegare le esigenze delle unità in surplus con le unità in deficit;

2. “l’attività di servizio: la raccolta e l’analisi delle informazioni sulla clientela potenziale, la valutazione del merito creditizio del richiedente credito, il controllo e il monitoraggio post-affidamento.”1

Analizzando più dettagliatamente l’attività creditizia possiamo notare che essa può essere scomposta in tre processi:

 allocazione: essa consiste nel trasferire le risorse dalle unità in surplus alle unità in deficit al fine di permettere a queste ultime di soddisfare il proprio fabbisogno finanziario. Ciò non si limita solamente ad una mera redazione degli schemi contrattuali, ma coinvolge anche una serie di servizi che hanno come obiettivo la

(7)

facilitazione della scelta del finanziamento. Come è facile intuire, questo richiede alla banca un lavoro molto articolato in quanto consiste nel compiere delle scelte riguardanti profili di rischiosità, di redditività, di liquidità e di equilibrio patrimoniale che consentano alla banca stessa di combinare nel modo migliore possibile le risorse finanziarie raccolte con quelle impiegate;

 selezione: in questo secondo processo la banca decide come distribuire le risorse raccolte in base ad un criterio di efficienza allocativa in termini di rischio/rendimento. Successivamente si passa alla selezione vera e propria. Essa è necessaria sia alla scarsità delle risorse raccolte, sia per il principio di delegated monitoring. Quest’ultimo, infatti, prevede che i soggetti in avanzo deleghino la banca per la selezione dei progetti migliori da finanziare;

 trasformazione: l’ultimo processo prevede la trasformazione:

 “delle caratteristiche economiche delle risorse intermediate, ovvero i

depositi e le obbligazioni, che rientranti tra le passività, sono “trasformati” in crediti, ossia in assets rischiosi”2;

 delle scadenza, in quanto i tempi di investimento preferiti delle unità in surplus non coincidono con i tempi di durata dei finanziamenti preferiti delle unità in deficit;

 dalle caratteristiche del rischio: per quanto riguarda questa tipologia di trasformazione, alla banca occorre fare una attenta valutazione e monitoraggio del rischio che le permetta sia di accrescere il proprio valore attraverso un’opportuna gestione dei rischi, sia di svolgere, nel modo più efficace ed efficiente possibile, il ruolo che le è stato assegnato nel sistema finanziario ed economico.

Da ciò ne deriva una diversificazione dei prodotti sotto differenti aspetti. Tra questi abbiamo: la durata, l’importo, la liquidità ed il profilo di rischio. Ciò è necessario in quanto la banca deve rispondere a differenti esigenze della clientela.

In questo paragrafo è opportuno fare un breve confronto tra il circuito di intermediazione diretto e quello indiretto. Nel primo, la funzione allocativa delle risorse avviene trovando il soddisfacimento delle passività finanziarie delle unità in deficit tra le attività delle unità in surplus. Il circuito di intermediazione indiretta, invece, è molto più complicato, in quanto la banca non deve gestire solamente il processo di trasformazione, ma anche la gestione delle informazioni che diventa di cruciale importanza qualora queste non siano di domino

(8)

pubblico. Nel circuito di intermediazione diretto, anche se in maniera molto meno incisiva, intervengono operatori che svolgono servizi finanziari indispensabili per svolgere la funzione allocativa sui mercati. Tra i servizi prestati da tali operatori, un esempio, può essere fornito dai servizi a supporto dell’emittente titoli e della negoziazione sui mercati secondari dei titoli emessi.

Il rischio di credito

Il rischio di credito non è altro che quel rischio che deriva dalla concessione di credito. Esso non rappresenta l’unico rischio al quale la banca si sottopone, ma ne è sicuramente il principale elemento distintivo.

Questo rischio è causato dalle asimmetrie informative che rendono i mercati imperfetti. Per questo motivo, la conclusione di qualsiasi contratto ne comporta l’accettazione di un rischio in quanto, quest’ultimo, è insito nella stipulazione del contratto stessa. Da ciò ne deriva che i soggetti, che compiono attività di intermediazione sui mercati, debbano sostenere dei costi dovuti, per la maggior parte, alla raccolta e l’elaborazione delle informazioni. Si crea, quindi, la necessità di misurare il rischio di credito con delle metodologie rientranti tra i criteri di valutazione degli affidamenti. Detto ciò, possiamo passare alla definizione di rischio di credito.

“Il rischio di credito è insito in qualsiasi forma di prestito (per cassa o di firma, garantito o non garantito): indica la possibilità che venga meno la capacità di rimborso della controparte debitrice per insufficiente liquidità o per insolvenza. Oppure per il manifestarsi di circostanze estranee alla situazione economico-finanziaria del debitore, tali da non consentirgli di far fronte ai propri impegni verso la banca.”3

All’interno della definizione di rischio di credito non rientra soltanto lo stato di inadempienza o di insolvenza (default), ma ci rientra anche la possibilità di un deterioramento futuro della capacità di rimborso del prestito senza che si verifichi, necessariamente, lo stato di default.

Come è facile intuire, quindi, alla banca necessita misurare accuratamente il rischio di credito affinché essa possa raggiungere un’efficienza allocativa. E’ necessario aggiungere, inoltre, che deve esistere una relazione direttamente proporzionale tra il rischio assunto dalla banca ed il tasso di interesse richiesto da questa al prenditore di fondi.

La valutazione del rischio avviene in due momenti temporali:

 prima che venga concesso il prestito: in questa fase vengono selezionate le varie domande di prestito (screening);

(9)

 durante la concessione del prestito: la banca, in questa fase, deve controllare se si verifica un peggioramento delle condizioni economico-finanziarie del cliente (monitoring).

Passiamo a vedere quali sono le componenti del rischio di credito. Esse sono:

 la probabilità di default (Probability of default, PD): questa componente, chiamata anche rating di controparte, indica la probabilità che il cliente passi allo stato di default. Solitamente è calcolata su un orizzonte temporale di un anno;

 il tasso di perdita in caso di insolvenza (Loss Given Default, LGD): essa indica la “percentuale del valore dell’esposizione creditizia che non è recuperata in seguito all’insolvenza del debitore.”4 Questa componente indica quanto è possibile

recuperare sul prestito, perciò, la presenza di garanzie influenza sulla sua stima. In particolare, gli elementi influenti sono: il tipo, il valore, il tempo e l’onerosità di escussione di questa. La LGD viene definita anche come il complemento ad uno del tasso di recupero del singolo prestito e quindi strettamente collegata alla tipologia di finanziamento concessa al cliente;

 l’esposizione al momento del default (Exposure At Default, EAD): essa indica l’ammontare del prestito al momento del default. Di questo ammontare ne sarà recuperato probabilmente il tasso di recupero. La stima di questa componente è influenzata sia dalla modalità di utilizzo e di restituzione del prestito sia dalla gestione della banca e tipo del cliente riguardo alla tempestività di riduzione del limite;

 la scadenza (Maturity, M): essa rappresenta “la data in cui il prestito deve essere rimborsato e gli interessi liquidati.”5 Nel caso in cui il prestito non debba essere

rimborsato in un'unica soluzione “la maturity è pari alla media, per una data esposizione, delle durate residue contrattuali dei pagamenti ciascuna ponderata per il relativo importo” (Banca d’Italia, Circ. 263 del 27 dicembre 2006). Si può dire che, a parità di condizioni, una maturity maggiore comporta un livello più alto di rischio.

Queste ultime tre componenti formano il rating di operazione che, unito al rating di controparte, dà origine al rating complessivo.

(10)

Utilizzando le componenti del rischio di credito precedentemente descritte possiamo andare a quantificare il rischio di credito andando a definire:

 perdita attesa (Expected Loss, EL);

 perdita inattesa (Unexpected Loss, UL).

La perdita attesa è quella perdita che si prevede di subire nel periodo di riferimento. Essa è calcolata come il prodotto tra la LGD, PD e EAD ed indica il valore atteso della distribuzione della perdita.

EL = PD * EAD * LGD

La perdita attesa rappresenta un valore medio di perdita che la banca attribuisce al l’impresa cliente in quanto avente le stesse caratteristiche economico-finanziarie di una determinata categoria di imprese clienti.

Un’eventuale perdita di importo pari alla perdita attesa non inciderà sul piano reddituale della banca. La perdita attesa non rappresenta il vero rischio, in quanto essa è “recuperata” mediante un maggior tasso di interesse applicato al cliente.

La banca deve considerare, inoltre, la perdita attesa a livello di portafoglio. In questo caso la perdita attesa viene frazionata ricorrendo alla legge dei grandi numeri, concetto appartenente al settore assicurativo. La banca dovrà, quindi, “popolare” il suo portafoglio crediti in modo tale da abbassare il valor medio della perdita attesa e non ricorrere ad una diversificazione, in quanto, questo è un aspetto che attiene maggiormente al concetto di rischio.

La perdita inattesa, invece, è quell’importo che, a posteriori, supera la perdita attesa ma che può essere ridotta tramite una diversificazione del portafoglio crediti. Essa rappresenta la varianza della distribuzione della perdita. La perdita inattesa non è contabilizzata, e deve trovare copertura nel patrimonio.

La banca, tramite appositi modelli/approcci, misura la perdita attesa ed inattesa, tra questi abbiamo:

1. L’approccio default mode, 2. L’approccio mark to market.

L’approccio default mode prevede il calcolo della perdita attesa e della perdita inattesa di ciascuna transazione ipotizzando che l’evento che genera perdita sia la sola insolvenza. Ciò fa sì che, ai fini di tale calcolo, occorra considerare una distribuzione binomiale. Essa, infatti, considera i soli due eventi estremi: la perdita completa dell’esposizione verso il cliente da parte della banca, oppure nessuna perdita a carico della banca. Sulla base di

(11)

l’ammontare del capitale esposto, la probabilità di insolvenza e il tasso di perdita. L’EAD e LGD si considerano costanti anche se, questa assunzione è da considerarsi molto forte, in quanto, solitamente non è riscontrabile nella realtà.

A fronte di una maggior semplicità del metodo, il default mode ha alcuni svantaggi:

 Non considera il deterioramento del merito creditizio;

 È accettabile per esposizioni da parte della banca nei confronti del cliente non superiori all’anno, se l’esposizione dovesse avere una durata superiore all’anno, allora occorre considerare le migrazioni da una classe di rating ad un’altra.

Per considerare, però, l’intera definizione del rischio di credito occorre passare all’approccio mark to market il quale prevede l’identificazione della perdita attesa e di quella inattesa della singola transazione sotto l’ipotesi che l’evento che genera perdite non sia solamente lo stato di default, ma anche il deterioramento del merito creditizio.

Rating e probabilità di default

Il rating è la valutazione sul merito creditizio di un soggetto, ovvero la valutazione che viene data dalla banca all’affidabilità economico-finanziaria di un cliente. Le disposizioni di vigilanza definiscono il rating come: “la valutazione, riferita ad un dato orizzonte temporale, effettuata sulla base di tutte le informazioni ragionevolmente accettabili, di natura sia quantitativa sia qualitativa, ed espressa mediante una classificazione su scala ordinale, della capacità di un soggetto affidato o da affidare di onorare le obbligazioni contrattuali”. (Banca d’Italia, Circ. 263, Titolo II, capitolo 1)6

Al soggetto richiedente fondi, quindi, sarà assegnata una specifica classe di rating a cui sarà associata una probabilità di default o rating di controparte. Questa associazione prende il nome di calibrazione della probabilità di default. Questo processo, in termini matematici, è spiegato dalla seguente funzione:

{𝐴𝐴𝐴, 𝐴𝐴, 𝐴, . . . , 𝐶} → [0,1]

Come è possibile vedere dalla formula, la funzione assegna una probabilità di default ad ogni rating.

La probabilità di default che si riferisce ad un determinato periodo temporale, solitamente coincidente con l’anno, deve caratterizzarsi per:

 l’oggettività;

 omogeneità;

 specificità;

(12)

 ed, infine, per l’obiettività;

Per far sì che questo si verifichi la banca necessita di molte informazioni. Queste ultime potranno avere sia un carattere oggettivo che soggettivo. Le informazioni raccolte dalla banca non saranno le stesse per ciascun cliente, perciò, essa deve andare a segmentare la propria clientela. Focalizzandosi maggiormente su una parte di essa, possiamo vedere che la banca, relativamente alla clientela impresa, va ad individuare delle sottocategorie in funzione:

 della dimensione del fatturato;

 dell’importo di finanziamento;

 del settore produttivo;

 se l’impresa è già sua cliente o meno.

Per ogni sottocategoria di impresa identificata, la banca va a definire le informazioni da richiedere a questa parte delle imprese clienti.

La segmentazione della clientela è riportata all’interno del framework del processo del credito. Questo fa sì che la banca, relativamente alla stessa sottocategoria della clientela, segua sempre la sessa procedura. L’esigenza di riportare la segmentazione all’interno del framework è dovuta anche all’organizzazione a livello di gruppo delle banche.

Affinché si possa comprendere l’importanza della suddivisione delle informazioni in funzione dei driver precedentemente elencati è opportuno dire che, all’aumentare delle dimensioni dell’impresa, del rischio del settore in cui essa opera e dell’importo richiesto come finanziamento, la banca tenderà a richiedere maggiori informazioni. Se, invece, l’impresa è di piccole dimensioni, richiede un finanziamento contenuto e opera in un settore produttivo poco rischioso, la banca tenderà a standardizzare e semplificare l’analisi. Tuttavia si preferisce la qualità anziché la quantità delle informazioni.

La valutazione del merito creditizio.

La valutazione del merito creditizio può avvenire con metodi diversi da quelli previsti dalle disposizioni di vigilanza prudenziale. Le regole di vigilanza definiscono questi metodi sistemi di rating. Essi sono: “l’insieme strutturato e documentato delle metodologie, dei processi organizzativi e di controllo, delle modalità di automazione delle basi dati che consente la raccolta e l’elaborazione delle informazioni rilevanti per la formulazione di valutazioni sintetiche della rischiosità di una controparte e delle singole operazioni creditizie [. . .] Attraverso il sistema di rating la banca: attribuisce al debitore il grado

(13)

interno di merito creditizio, ordinando le controparti in base alla loro rischiosità, perviene ad una stima delle componenti di rischio”.7

Nonostante ciò le nuove disposizioni tentano un avvicinamento tra sistemi regolamentari e sistemi gestionali.

La disciplina prevede due approcci per stabilire l’accantonamento patrimoniale obbligatorio per far fronte al rischio di credito:

 l’approccio standard che prevede l’utilizzo di ratings pubblicati da agenzie di rating esterne chiamate società di rating. Esse si occupano di valutare la solvibilità e solidità di una società emittente pubblicando, al riguardo, un giudizio sintetico chiamato rating (Wikipedia);

 l’approccio internal rating based: “basato sulle metodologie di valutazione di informazioni qualitative e quantitative del rischio di credito (sistemi di rating) sviluppate internamente alle banche”.8 All’interno di questo approccio possiamo

avere la versione base, nella quale la probabilità di default è stimata dalla banca mentre, tutte le altre componenti del rischio di credito sono stimate dalle autorità di vigilanza, e la versione avanzata, nella quale la banca stima internamente tutte le componenti del rischio di credito. Per utilizzare questo approccio è necessario che le autorità di vigilanza approvino i processi valutativi per il merito creditizio utilizzati dalla banca.

Sia nell’approccio standard che nelle due versioni dell’approccio IRB il patrimonio di vigilanza deve essere almeno pari all’8% delle attività ponderate per il rischio.

L’automazione dei sistemi di rating è necessaria per andare a soddisfare sia le richieste fatte dalla vigilanza, sia per una scelta della banca stessa, in quanto questo permette una standardizzazione dei processi ed una riduzione dei costi.

L’automazione delle procedure di valutazione del merito creditizio possono variare in base alle caratteristiche della clientela.

Nel caso di piccoli prestiti, come quelli concessi a PMI o a privati, le banche utilizzano frequentemente sistemi di valutazione ad alto grado di automazione, il così detto credit scoring.

L’autorità di vigilanza definisce il credit scoring come “un sistema automatizzato adottato dalle banche e dagli intermediari finanziari per valutare le richieste di finanziamento della clientela. Esso si basa su sistemi automatizzati che prevedono l’applicazione di metodi o

(14)

modelli statistici per valutare il rischio creditizio, e i cui risultati sono espressi in forma di giudizio sintetico, indicatori numerici o punteggi, associati all’interessato diretti a fornire una rappresentazione, in termini predittivi o probabilistici, del suo profilo di rischio, affidabilità o puntualità nei pagamenti” (Banca d’Italia, Circ. 263 del 27 dicembre 2006 e successivi aggiornamenti)9.

I piccoli prestiti non si prestano bene ad un’indagine molto dettagliate, in quanto il costo marginale che deriva da quest’ultima risulterebbe eccessivo rispetto al beneficio marginale in termini di minor rischio. Diverso è il caso dei prestiti di entità maggiore in quanto essi, avendo bisogno di un’indagine più dettagliata, si verificherà che il beneficio marginale, derivante dall’indagine, sarà maggiore del suo costo marginale e sarà, perciò, conveniente ricorrere a sistemi di rating più accurati.

L’adozione di un sistema di rating porta alcuni vantaggi. Tra questi abbiamo:

 una valutazione più “oggettiva”, perciò, un miglioramento qualitativo dei crediti erogati ed una riduzione del numero di fallimenti dei soggetti affidati;

 un sistema di rating comporta, anche, una riduzione dei costi di istruttoria. Questa è diretta conseguenza dell’alta automazione della valutazione del merito creditizio,

 Aumento della velocità di risposta alla domanda di credito e, quindi, una risposta migliore alle esigenze del mercato.

Approcci per la determinazione della probabilità di default Ci sono due approcci per determinare la probabilità di default:

 Con il primo approccio le probabilità di default vengono calcolate tenendo in considerazione i dati di mercato;

 Nel secondo approccio, invece, le probabilità di default vengono calcolate tenendo in considerazione i rating creditizi.

In questa trattazione ci interessa focalizzare maggiormente l’attenzione sul secondo approccio in quanto, per arrivare a determinare la probabilità di default, si è utilizzata la matrice di transizione, strumento matematico statistico utilizzato per modelli di migrazione di rating.

Dai dati che rilevano le agenzie di rating si può notare che rating migliori spesso hanno una probabilità di default pari a zero, ciò porterebbe a concludere che gli investimenti in aziende con rating migliori sono privi di rischio. Ciò non può essere possibile in quanto, se pur minimo, anche gli investimenti in aziende con rating migliori hanno una probabilità di insolvenza.

(15)

In questa trattazione, utilizzando dei dati messi a disposizione da Matlab relativi al periodo tra 1982 e il 2005, si è voluto riportare uno degli output derivanti dalla funzione transprob di Matlab con opzione duration. L’output in questione, a cui si è attribuito il nome TransTotalsMat, riporta una matrice che rappresenta le transizioni effettuate tra le varie classi di ratings nel periodo preso in analisi. Sulla diagonale principale di questa matrice si hanno solo zeri, in quanto l’output non riporta le transizioni nel rating di partenza. Si può dire, inoltre, che al numero della riga è associata una classe di rating di partenza mentre al numero di colonna è associata la classe di rating di arrivo. All’aumentare del numero associato corrisponde una classe di rating più bassa.

Si è preferito utilizzare l’opzione duration anziché l’opzione cohort in quanto, tra i vari output che la funzione avrebbe dato, c’era una matrice simile a quella riportata, nella quale veniva riportato tutte le transizioni avvenute, comprese quelle avvenute all’interno della stessa classe di rating nel periodo considerato, informazione non necessaria per gli scopi di questa trattazione.

Partendo dal fatto che nello stato di default si può transire una sola volta si può utilizzare l’ultima colonna della matrice appena riportata per individuare il numero delle imprese che, partendo con un determinato rating, sono passate direttamente allo stato di default. Possiamo dire, per esempio, che il numero di imprese, che all’inizio del periodo avevano il rating AA e sono passate direttamente allo stato di default, è pari a 2. Di questa colonna si è deciso di riportarne un grafico per poter, successivamente, evidenziare una cosa.

(16)

Come possiamo vedere dal grafico il numero di imprese che sono fallite partendo con un determinato rating è crescente al diminuire della classe di rating. Ciò ci permette di dire che, al diminuire della classe di rating, aumenta la probabilità di default dell’azienda.

AAA AA A BBB BB B CCC Ratings 0 20 40 60 80 100 120 140 160 180 200 N u m e ro A z ie n d e

(17)

Capitolo 2: Un’introduzione alle catene di Markov

Processi stocastici

Prima di addentrarci nelle varie tipologie di processi stocastici è opportuno dare la definizione di processo stocastico.

“Un processo stocastico è definito come una famiglia di variabili aleatorie {Xt}, con t ϵ 𝒯.

L’insieme 𝒯 è l’insieme degli istanti di tempo considerati nel processo stocastico.”10

Tra le varie tipologie di processi stocastici possiamo avere:

 un processo stocastico a parametro discreto se l’insieme 𝒯 è un insieme discreto,

 oppure, potremmo avere un processo stocastico a parametro continuo se 𝒯 è un intervallo non singolare dei numeri reali.

I processi stocastici, inoltre, possono essere classificati a seconda della natura delle variabili aleatorie {Xt}. Avremo, quindi:

 un processo discreto se le variabili aleatorie sono variabili discrete;

 oppure, processi continui se le variabili aleatorie sono continue.

I valori che possono essere assunti sono detti stati e, l’insieme di questi, si denota con la lettera 𝒮. Il numero degli stati di 𝒮 può essere:

 finito,

 infinito e numerabile,

 infinito e non numerabile. In questo trattazione si assume che:

 l’insieme 𝒯 degli istanti di tempo è l’insieme degli interi non negativi, ovvero 𝒯 = N = {0, 1, 2, . . .},

 il processo stocastico {Xt} è discreto,

 l’insieme S degli stati del processo è numerabile.

Ad ogni istante di tempo t ϵ 𝒯 il sistema si troverà, quindi, in un determinato stato appartenente ad un insieme numerabile di stati esaustivi11 e tra loro mutualmente esclusivi12.

10Cambini R. (2009) – Catene di Markov a stati finiti approccio teorico e computazionale. Facoltà di Economia, Università di Pisa, versione preliminare.

11Due eventi (E1, E2) ⊂ 𝒮 sono detti incompatibile o mutualmente esclusivi se E1 ∩ E2 = 0, ovvero quando il verificarsi di E1 esclude il verificarsi di E2 e viceversa. Giusti C. (2012/2013) – Inferenza

statistica. Facoltà di economia, Università di Pisa.

12Dati n eventi E1, E2, …, En essi sono detti esaustivi se ⋃𝑛 𝐸i= 𝒮

(18)

Un esempio di processo stocastico discreto può essere fornito dall’osservazione di una coda che si forma ad uno sportello ad ogni minuto. Al minuto n-esimo ci sarà un certo

numero di persone, aleatorio, che indichiamo con Nn. Al variare di n abbiamo un esempio

di processo stocastico discreto. Le catene di Markov

Le catene di Markov sono particolari processi stocastici {Xt} che verificano particolari

proprietà.

Proprietà di Markov

Un processo stocastico verifica la proprietà di Markov quando per ogni istante di tempo t ϵ 𝒯, per ogni coppia di stati i, j ϵ 𝒮 e per ogni sequenza di stati k0, . . . , kt-1 ϵ 𝒮, risulta:

𝒫{𝑋t+1= 𝑗|𝑋0= 𝑘0, . . . , 𝑋t-1= 𝑖, 𝑋t= 𝑖} = 𝒫{𝑋t+1= 𝑗|𝑋t= 𝑖} [1]

La probabilità condizionata13 𝒫{𝑋t+1= 𝑗|𝑋t= 𝑖} è detta probabilità di transizione a tempo t

dallo stato i allo stato j.

Questa proprietà ci dice che la probabilità condizionata di un “evento” futuro dati lo stato attuale e tutti gli “eventi” passati dipende solamente dallo stato attuale del processo e non dai precedenti. In particolare è come se il processo avesse una “perdita di memoria” riguardo al suo passato.

Probabilità di transizione stazionarie

Le probabilità di transizione sono dette stazionarie se, per ogni coppia di stati i, j 𝜖 𝒮, si ha: 𝒫{𝑋t+1= 𝑗|𝑋t= 𝑖} = 𝒫{𝑋1= 𝑗|𝑋0= 𝑖} ∀𝑡 ≥ 0 [2]

Queste probabilità sono indicate con pij= 𝒫{𝑋1= 𝑗|𝑋0= 𝑖}.

In pratica la stazionarietà delle probabilità di transizione comporta che queste ultime non cambiano nel tempo.

Definiamo, più precisamente, una catena di Markov.

Un processo stocastico discreto {Xt}, t ∈ 𝒯 = {0, 1, 2, . . .}, avente un insieme di stati 𝒮

numerabile, è detto Catena di Markov se verifica le seguenti proprietà:

i. proprietà di Markov;

ii. proprietà di transizione stazionarie.

(19)

Nel caso in cui la catena di Markov ammetta un numero finito di stati allora si dice che la catena di Markov è a stati finiti. Le probabilità di transizione stazionarie relative ad essa possono essere rappresentate mediante la forma matriciale.

Si consideri una catena di Markov a stati finiti. Si definisce matrice di transizione la seguente matrice P:

Ρ = (𝑝ij) ∈ [0, 1]N*N 𝑖, 𝑗 ∈ 𝒮 [3]

La matrice di transizione P verifica la seguente proprietà:

P𝐮 = 𝐮 dove u = [1, 1, . . . , 1, 1]T

Le matrici non negative tali che soddisfino l’equazione precedente sono dette matrici stocastiche.

Per studiare efficacemente le catene di Markov vengono utilizzati i grafi. Questi non sono altro che un insieme di nodi ed archi: ad ogni nodo corrisponde uno stato della catena di Markov, mentre i valori delle probabilità di transizione pij > 0 corrispondono ad un arco

orientato dal nodo i al nodo j.

Rappresentiamo, qui, di seguito, una matrice di transizione:

Partenza/Arrivo S1 S2 S3 S4

S1 m11 m12 m13 m14

S2 m21 m22 m23 m24

S3 m31 m32 m33 m34

S4 m41 m42 m43 m44

La tabella a doppia entrata rappresenta una matrice di transizione. Nella prima colonna della tabella ci sono gli stati che può assumere la variabile aleatoria al tempo di partenza, mentre nella prima riga della tabella ci sono gli stati di arrivo che la variabile aleatoria può assumere alla fine del periodo considerato.

m11 indica la probabilità, partendo dallo stato S1, di rimanere nello stato S1 alla fine del

periodo preso in analisi.

m21 indica, invece, la probabilità che si ha, partendo dallo stato S2, di transire allo stato S1

(20)

Probabilità di transizione in n passi

Nelle catene di Markov il concetto di probabilità di transizione stazionaria può essere ulteriormente esteso.

Si consideri una catena di Markov. Per ogni coppia di stati i, j ∈ 𝒮 e per ogni intero n ≥ 0 risulta:

𝒫 {𝑋t+n= 𝑗|𝑋t = i} = 𝑃{𝑋n= 𝑗|𝑋0= 𝑖} ∀𝑡 ≥ 0 [4]

Dimostriamo quanto abbiamo scritto precedentemente.

Per n = 0 otteniamo la probabilità che la variabile casuale assuma quel determinato valore, mentre per n = 1 il risultato coincide con la stazionarietà delle probabilità di transizione della catena di Markov. Dimostriamo, adesso, il risultato per n > 1.

Per il teorema delle probabilità totali14 e per la definizione di probabilità condizionata risulta:

𝒫{𝑋t+n= 𝑗|𝑋t= 𝑖} = ∑ 𝒫{𝑋t+n= 𝑗 ∩ 𝑋t+n-1= 𝑘|𝑋t = 𝑖} 𝑘∈𝒮

= ∑ 𝒫{𝑋t+n= 𝑗|𝑋t+n-1= 𝑘 ∩ 𝑋t= 𝑖}𝒫{𝑋t+n-1= 𝑘|𝑋t= 𝑖} 𝑘𝜖𝒮

Per la proprietà di Markov e la stazionarietà delle probabilità di transizione si ha inoltre:

𝒫{𝑋t+n= 𝑗|𝑋t+n-1= 𝑘 ∩ 𝑋t= 𝑖} = 𝒫{𝑋t+n = j|𝑋t+n-1= 𝑘} = 𝒫{𝑋n= 𝑗|𝑋n-1= 𝑘} = 𝒫{𝑋n= 𝑗|𝑋n-1= 𝑘 ∩ 𝑋0= 𝑖} da cui otteniamo: 𝒫{𝑋t+n= 𝑗|𝑋t = 𝑖} = ∑ 𝒫{𝑋n= 𝑗|𝑋n-1= 𝑘 ∩ 𝑋0= 𝑖} 𝑘∈𝒮 𝒫{𝑋n-1= 𝑘|𝑋0= 𝑖}

14Si consideri un evento A ∈ Ω ed n eventi disgiunti Bi, i = 1, . . ., n, tali che Ω = ⋃𝑛 𝐵i

𝑖=1 . Allora, essendo A = ⋃ {𝐴, 𝐵𝑛𝑖=1 i}, risulta:

𝒫{𝐴} = ∑ 𝒫{𝐴 ∩ 𝐵i} = ∑ 𝒫{𝐴|𝐵i}𝒫{𝐵i}

𝑛 𝑛

(21)

= ∑ 𝒫{𝑋n= 𝑗 ∩ 𝑋n-1= 𝑘|𝑋0= 𝑖} 𝑘∈𝒮

= 𝒫{𝑋n= 𝑗|𝑋0= 𝑖}

Le precedenti probabilità condizionate sono chiamate probabilità di transizione stazionarie in n passi e si indicano con:

𝑝(n)

ij= 𝒫{𝑋n= 𝑗|𝑋0= 𝑖}, 𝑛 ∈ {0, 1, 2, . . . }

Questa rappresenta la probabilità condizionata di passare in n passi dallo stato i allo stato j. Ovviamente risulta 𝑝(1)

ij= 𝒫{𝑋1= 𝑗|𝑋0= 𝑖} = 𝑝ij. Avremo, inoltre, che se i = j, allora

p(0)ij= 𝒫{𝑋0= 𝑗|𝑋0= 𝑖} = 1 . Se, invece, i è diverso da j allora avremo che =

𝒫{𝑋0= 𝑗|𝑋0= 𝑖} = 0.

Poiché, tali valori sono delle probabilità corrette per definizione si ha che:

0 ≤ 𝑝(n)

ij≤ 1 ∀𝑖, 𝑗 𝜖 𝒮 ∀𝑛 ≥ 0

∑ 𝑝(n)

ij

𝑗∈𝒮 = ∑𝑗∈𝒮𝒫{𝑋n= 𝑗|𝑋0= 𝑖} = 1 ∀𝑖 ∈ 𝒮 ∀𝑛 ≥ 0

Le probabilità di transizione stazionarie in n passi delle catene di Markov a stati finiti possono essere rappresentate tramite una forma matriciale.

Si consideri una catena di Markov a stati finiti. Si definisce matrice di transizione in n passi la seguente matrice P(n):

𝑃(n)= (𝑝(n)

ij) 𝜖 [0, 1]N*N i,j ϵ𝒮 [5]

Ovviamente, per quanto detto in precedenza, risulta P(0) = I e P(1) = P. Le equazioni di Chapman-Kolmogorov

Uno strumento fondamentale per studiare le catene di Markov è rappresentato dalle equazioni di Chapman-Kolmogorov. La mancanza di memoria delle catene di Markov fa sì che la probabilità di transizione in n + m passi dipenda dalla probabilità condizionata di arrivare dallo stato di partenza ad un certo stato k in n passi e dalla probabilità di passare allo stato k allo stato finale in m passi.

(22)

Teorema (Equazioni di Chapman-Kolmogorov) Si consideri una catena di Markov. Risulta:

𝑝n+m

ij= ∑ 𝑝nik𝑝mkj ∀𝑖, 𝑗 𝜖 𝒮 ∀𝑛, 𝑚 ≥ 1 [6]

𝑘𝜖𝒮

Per dimostrare questo teorema occorre rifarsi al teorema della probabilità totale. Infatti, da quest’ultimo teorema risulta:

𝑝n+m ij= 𝒫{𝑋𝑛 + 𝑚 = 𝑗 |𝑋0 = 𝑖} = ∑ 𝒫{𝑋n+m= 𝑗 ∩ 𝑋n= 𝑘|𝑋0= 𝑖} 𝑘 𝜖 𝒮 = ∑ 𝒫{𝑋n+m= 𝑗|𝑋n= 𝑘 ∩ 𝑋0= 𝑖} 𝑘 𝜖 𝒮 𝒫{𝑋n= 𝑘|𝑋0= 𝑖}

Per la proprietà di Markov e la stazionarietà delle probabilità di transizione risulta quindi:

𝒫{𝑋n+m= 𝑗|𝑋n= 𝑘 ∩ 𝑋0= 𝑖} = 𝒫{𝑋n+m= 𝑗|𝑋n= 𝑘} = 𝒫{𝑋m= 𝑗|𝑋0= 𝑘} da cui si ha: 𝑝n+m ij= ∑ 𝒫{𝑋m = 𝑗|𝑋0= 𝑘} 𝑘 𝜖 𝒮 𝒫{𝑋n= 𝑘|𝑋0= 𝑖} = ∑ 𝑝nik𝑝mkj 𝑘 𝜖 𝒮

Il teorema visto precedentemente mostra come le probabilità di transizione in n passi siano rappresentate dalla seguente sommatoria:

𝑝n

ij= ∑ 𝑝ik1∗ 𝑝k1k2∗ 𝑝k2k3∗ . . .∗ 𝑝kn-2kn-1∗ 𝑝kn-1j 𝑘1,...,𝑘𝑛−1 𝜖 𝒮

[7]

Le equazioni di Chapman-Kolmogorov, se applicate a catene di Markov a stati finiti, si possono esprimere anche in forma matriciale.

(23)

Data una catena di Markov a stati finiti risulta:

𝑃(n+m)= 𝑃(n)𝑃(m) ∀𝑛, 𝑚 ≥ 1 [8]

Da questa formula si può concludere che in una catena di Markov a stati finiti la matrice di transizione in n passi non è altro che la n-esima potenza della matrice di transizione.

Data una catena di Markov a stati finiti si ottiene:

𝑃(n)= 𝑃n [9]

Diamo, di seguito, una breve dimostrazione della formula appena riportata. Per n = 0 ed n = 1 il risultato è banale, mentre per n ≥ 2 le equazioni di Chapman Kolmogorov risulta:

𝑃(n)= 𝑃((n-1)+1)= 𝑃(n - 1)𝑃(1)= 𝑃(n - 1)𝑃 =

= 𝑃((n-2)+1)𝑃 = 𝑃(n - 2)𝑃(1)𝑃 = 𝑃(n - 2)𝑃2=

= 𝑃(n - 3)+1)𝑃2= 𝑃(n - 3)𝑃(1)P2= 𝑃(n - 3)P3 = . . . = Pn

Utilizzando la formula 9 si può verificare che tutte le matrici di transizione in n passi P(n), con n ≥ 0, sono matrici stocastiche. Per n = 0 e per n = 1, il risultato è semplice, in quanto, nel primo caso, si ottiene la matrice identica, mentre per il secondo caso sì ottiene la matrice di transizione. Per n ≥ 2 sì ha:

𝑃(n)𝑢 = 𝑃n𝑢 = 𝑃n-1(𝑃𝑢) = 𝑃n-1𝑢 = 𝑃n-2(𝑃𝑢) = 𝑃n-2𝑢 = . . . = 𝑃𝑢 = 𝑢 [10]

Classificazione degli stadi di una Catena di Markov

In questo paragrafo andiamo ad analizzare le caratteristiche e le proprietà degli stati del processo. Le prime principali proprietà che legano gli stati di una catena di Markov sono date dalla loro possibilità di “comunicare”.

Si consideri una catena di Markov e due stati i, j 𝜖 𝒮.

Lo stato j è detto accessibile dallo stato i se ∃𝑛 ≥ 0 tale che 𝑝(n)

ij> 0, in tal caso

useremo la seguente notazione:

(24)

Gli stati i e j sono detti comunicanti se lo stato j è accessibile dallo stato i ed a sua volta lo stato i è accessibile dallo stato j:

𝑖 → 𝑗 𝑒 𝑗 → 𝑖

in altre parole, i e j sono comunicanti se ∃𝑛, 𝑚 ≥ 0 tali che 𝑝(n)

ij> 0 e 𝑝(m)ji> 0.

 Lo stato i è detto assorbente se pii=1;

 La catena di Markov è detta irriducibile se tutti gli stati del processo comunicano tra loro.

Consideriamo gli stati i, j, h ∈ 𝒮.

i. Ogni stato comunica con se stesso,

ii. Se lo stato i comunica con lo stato j, allora anche lo stato j comunica con i,

iii. Se lo stato i comunica con lo stato j e lo stato j comunica con lo stato h allora anche lo stato i comunica con lo stato h.

La relazione che lega due stati comunicanti soddisfa le proprietà riflessiva, simmetrica e transitiva. Essa è una relazione di equivalenza. Gli stati di una catena di Markov possono essere suddivisi in classi di equivalenza disgiunte tali che tutti gli stati di una certa classe possano comunicare tra loro.

Gli stati, inoltre, possono essere differenziati tra di loro. Si consideri una catena di Markov ed un suo stato i ∈ 𝒮.

i. Lo stato i è detto transitorio j se esiste uno stato 𝑗 ∈ 𝒮, 𝑗 ≠ i, tale per cui j è accessibile da i mentre i non è accessibile da j, ovvero se:

∃𝑗 ∈ 𝒮, 𝑗 ≠ 𝑖, tale che 𝑖 → 𝑗 𝑒 𝑗 ↛ 𝑖 ii. Lo stato i è detto ricorrente se non è transitorio, ovvero se:

∀𝑗 ∈ 𝒮 risulta: {𝑖 → 𝑗 ⟹ 𝑗 → 𝑖}

Un caso particolare dello stato ricorrente è lo stato assorbente i (pii = 1).

(25)

In conclusione di questo paragrafo possiamo elencare alcune proprietà delle catene di Markov:

1. In una catena di Markov a stati finiti non tutti gli stati possono essere transitori. Se così non fosse, si avrebbe che, dopo un certo numero finito di transizioni il sistema potrebbe abbandonare tutti i suoi stati,

2. Una catena di Markov irriducibile è composta da un’unica classe di equivalenza di stati comunicanti,

3. Una condizione sufficiente, ma non necessaria, affinché una catena a stati finiti sia irriducibile è che esista un istante 𝜂 > 0 tale che 𝑝(η)

ij >0 ∀ 𝑖, 𝑗. Tutti gli stati di una

catena di Markov a stati finiti irriducibile sono ricorrenti, (la catena ha una sola classe di equivalenza ed i suoi stati non possono essere tutti transitori).

Media delle prime n matrici di transizione in t passi

Oltre hai concetti già introdotti è opportuno aggiungere la definizione di media delle prime n matrici di transizione in t passi.

Si consideri una catena di Markov. Si definisce media delle prime n probabilità di transizione in t passi, con n ≥ 1, la seguente probabilità:

𝑚(n) ij= 1 𝑛 ∑ 𝑝(t)ij 𝑛 𝑡=1 ∈ [0,1]∀𝑖, 𝑗 ∈ 𝒮 [11]

Da questa definizione e dalla nonnegatività delle probabilità di transizione in t passi si deduce la seguente proprietà:

Si consideri una catena di Markov. Per ogni n ≥ 1 e per ogni i,j ∈ 𝒮 risulta: 𝑚(n)

ij> 0 ⇔ ∃𝑡 ∈ {1, . . . , 𝑛} tale che 𝑝(t)ij> 0

𝑚(n)

ij= 0 ⇔ 𝑝(t)ij= 0 ∀𝑡 = 1, . . . , 𝑛

Questa proprietà mostra che m(n)ij > 0 se e solo se è possibile transire dallo stato i allo stato

j in non più di n passi.

Per la media delle prime n matrici di transizione in t passi possiamo definire anche una matrice associata.

Si consideri una catena di Markov a stati finiti. Si definisce media delle prime n matrici di transizione in t passi, con n ≥ 1, la matrice M(n) = (m(n)

(26)

𝑀(n)= 1

𝑛 ∑ 𝑃(t)

𝑛

𝑡=1

[12]

Si osservi, inoltre, che dalla 9 deriva direttamente che:

𝑀(n)= 1

𝑛 ∑ 𝑃t

𝑛

𝑡=1

[13]

Con l’espressione 9 e 10 si può verificare che tutte le matrici M(n), con n ≥ 1, sono matrici

stocastiche. Per n = 1 la verifica è immediata dato che M(1) = P. Sia ora n ≥ 2, si può osservare che tutti gli elementi di M(n) sono non negativi, poiché per ogni t ≥ 1 risulta P(t)u

= u, da ciò deriva che:

M(n)u = (1 n ∑ P(t) n t=1 ) u = (1 n ∑ 𝑃(t)𝑢 n t=1 ) = 1 n ∑ u n t=1 = u [14]

Tra le matrici M(n) assume particolare utilità quella che ha n = N. Il teorema seguente

mostra come estendere, al caso di catene di Markov a stati finiti, il risultato ottenuto precedentemente.

Si consideri una catena di Markov a stati finiti e sia M(N) la corrispondente media delle prime n = N matrici di transizione in t passi. Per ogni i, j ∈ 𝒮 risulta:

m(N)ij > 0 ⟺ ∃𝑡 ≥ 1 tale che 𝑝(t)ij> 0

m(N)ij =0 ⟺ 𝑝(t)ij= 0 ∀𝑡 ≥ 1

In questa trattazione si è ritenuto opportuno dare una dimostrazione pratica del calcolo della media delle prime n matrici di transizione in t passi. Per fare ciò si è creata una

function dal nome DistProbMat che prendesse come input i dati15 messi a disposizione da

Matlab e restituisse come output la matrice media delle prime n matrici di transizione in t passi. Per arrivare a quest’ultima si è reso necessario, per prima cosa, calcolare la matrice di transizione. Questa è stata ottenuta della function transprob predisposta da Matlab, infatti essa rientra tra gli output forniti da questa funzione.

(27)

La function transprob permette di calcolare la matrice di transizione in due modi diversi:

 Utilizzando l’algoritmo coorte, che stima la probabilità di transizione da un rating all’altro mediante la suddivisione del periodo considerato in intervalli di uguale ampiezza. Se un rating di una società cambia due volte nello stesso intervallo, questo non verrà preso in considerazione. Ad influenzare il risultato sarà solamente il rating assegnato all’inizio del periodo e quello assegnato a fine del periodo considerato,

 Utilizzando l’algoritmo duration, invece, la probabilità di transizione viene calcolata prendendo in considerazione ogni variazione del rating, perciò, se il rating di una società dovesse cambiare in breve tempo, questo, influenzerà la probabilità di migrare da un rating all’altro.

La matrice di transizione calcolata all’interno della funzione DistProbMat viene calcolata dalla funzione transprob con l’algoritmo duration. Per ciascuna riga, della matrice di transizione appena calcolata, è associata una classe di rating di partenza mentre al numero di colonna della stessa è associata la classe di rating di arrivo. All’aumentare del numero associato corrisponde una classe di rating più bassa.

Una volta calcolata la matrice di transizione viene implementata, all’interno della funzione DistProbMat, la formula per calcolare la matrice media delle prime n matrici di transizione in t passi. In particolare viene calcolata una matrice di transizione in tre passi.

Di seguito vengono riportati gli output TransMat e MatMedia ottenuti dalla funcion DistProbMat. I valori espressi nelle matrici che seguono sono espressi in termini percentuali.

(28)

Distribuzione delle probabilità a tempo t

Dalle equazioni di Chapman-Kolmogorv possiamo determinare la probabilità di essere in un determinato stato dopo un certo numero di transizioni del sistema.

Si consideri una catena di Markov. Si denota con q(t)

i = 𝒫{𝑋t= 𝑖} la probabilità di esere

nello stato i al temo t ∈ 𝒯; in particolare si denota con q(0)

i = 𝒫{𝑋0= 𝑖} di essere nello

stato i al memento iniziale.

Si può dimostrare che, per ogni stato i che appartiene ad ∈ 𝒮:

𝑞(t) i= 𝒫{𝑋t= 𝑖} = ∑ 𝒫{𝑋0= 𝑘}𝒫{𝑋t= 𝑖|𝑋0= 𝑘} = ∑ 𝑞( 𝑘∈𝒮 0) k 𝑘∈𝒮 𝑝(t) ki

Si consideri una catena di Markov a stati finiti. Le distribuzioni di probabilità a tempo t ≥ 0 si possono esprimere in forma vettoriale tramite i vettori q(t) = [qi(t)] e q(0) =[qi(0)], i ∈ 𝒮.

Le distribuzioni di probabilità per catene di Markov a stati finiti, quindi, possono essere calcolate nel seguente modo:

[q(t)]T = [q(0)]TP(t) = [q(0)]TPt [15]

qt essendo dei vettori che indicano delle distribuzioni di probabilità corretti, risulta che:

[𝑞i(t)]T𝑢 = ∑ 𝑞i( 𝑘∈𝒮

t) =∑ 𝒫{𝑋

t= 𝑖} = 1. [16] 𝑘∈𝒮

Per quanto riguarda le distribuzioni che possono essere individuate tramite dei vettori abbiamo voluto darne un’applicazione pratica utilizzando dei dati di esempio messi a disposizione da Matlab.

Utilizzando la funzione transprob messa a disposizione da Matlab abbiamo ricavato, dai dati messi a disposizione dallo stesso programma, la matrice di transizione e, da questa, utilizzando la funzione transprobtothresholds abbiamo ricavato i valori critici per ottenere la funzione di probabilità normale standardizzata.

Di seguito viene riportato la matrice di transizione con la relativa matrice indicante i valori critici della normale standardizzata.

(29)

La prima delle due matrici indica la probabilità, in termini percentuali, di passare da una classe di rating ad un'altra, mentre la seconda matrice indica i valori critici. Sia nella prima che nella seconda matrice si può dire che al numero della riga è associata una classe di rating di partenza mentre al numero di colonna è associata la classe di rating di arrivo. All’aumentare del numero associato corrisponde una classe di rating più bassa.

Nella seconda matrice ogni riga indica i valori critici che suddividono una funzione di probabilità normale standard in modo tale che, all’intervallo di valori delimitato da due valori critici della stessa riga, venga assegnata la probabilità di rimanere o passare in una classe di rating. La prima colonna della seconda matrice è composta interamente da valori inf. Quest’ultimo equivale a scrivere 100%. La differenza tra il valore inf di posto 1,1 in matrice, e la probabilità del valore contenuto nel posto 1,2 in matrice, indica la probabilità che l’azienda rimanga in AAA. La differenza, invece, tra la probabilità del valore inf, con posizione 2,1, e la probabilità del valore, con posizione 2,2, dà la probabilità di arrivare, nell’arco di tempo considerato, nel rating AAA partendo dal rating AA. Discorso analogo, vale per le altre classi di rating.

Infine, l’ultima colonna della seconda matrice indica quei valore critici al disotto dei quali sì ha lo stato di default per ciascuna classe di rating. Alla stessa conclusione, ma in termini di probabilità, possiamo arrivare se consideriamo i valori dell’ultima colonna della prima matrice. L’ultima riga non si considera, perché relativa allo stato di default. Essa non è significativa perché l’azienda, una volta giunta nello stato di default, non può più transire in nessun altra classe di rating.

(30)

La figura mostra la distribuzione normale standard del rating A. Per fare questo grafico abbiamo considerato la terza riga della matrice ValCrit. Come possiamo vedere dall’immagine, le due righe verticali poste ai lati della scritta A delimitano l’area sottostante la curva che indica la probabilità di rimanere, nell’intervallo di tempo considerato, nel rating A. La prima riga verticale a partire dalla sinistra dell’immagine delimita, invece, l’area della funzione di probabilità standardizzata indicante la probabilità che, un’azienda con rating A, arrivi nello stato di default nel periodo considerato.

-6 -4 -2 0 2 4 6

Credit Quality Thresholds

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 P ro b a b ili ty D e n s it y F u n c ti o n

Distribuzione di probabilità standardizzata

A D

(31)

Capitolo 3: Un’applicazione pratica delle catene di Markov

Introduzione

all’applicazione pratica

In questo capitolo vengono trattate le catene di Markov con un approccio più pratico rispetto al capitolo precedente.

Prima di andare a commentare il lavoro svolto, si vuole descrivere brevemente la “materia prima”, ovvero i dati messi a disposizione da Matlab che sono stati utilizzati per affrontare questo capitolo con un taglio più applicativo.

“Il set di dati di esempio utilizzato in questa sezione viene simulato avvalendosi di una singola matrice di transizione. Nessun tentativo è stato fatto per abbinare le tendenze storiche nei tassi di transizione.”16

Detto ciò, si passa alla descrizione della function creata su Matlab chiamata Generale3. Da questa function vogliamo ottenere dei risultati che mettono in evidenza aspetti particolari e che chiameremo, da qui in poi, risultati finali. Questi ultimi sono:

1. una matrice nella quale sono riportate le transizioni avvenute tra i diversi rating nel periodo tra la fine dell’anno n e la fine dell’anno n+1;

2. una matrice di transizione che evidenzi le probabilità di passare o di rimanere, qualora l’azienda rimanesse nella classe di rating di partenza, nelle diverse categorie di investment grade, speculative grade e default;

3. riporti una matrice con le probabilità di default effettive ed una con i valori delle probabilità di default stimati utilizzando la [9], inoltre, la function deve riportare un grafico che evidenzi l’andamento di questi dati.

Per ottenere questi output si è reso necessario ottenere dei risultati intermedi in modo tale che essi possano servire sia per una maggior comprensione ai fini del risultato finale, sia per monitorare il procedimento che condurrà, poi, agli output elencati in precedenza. Questa function prende in input due variabili:

 la tabella “data” che contiene 4315 righe e 3 colonne. Per ogni riga della tabella viene riportato l’ID di un’azienda, la data nella quale quell’azienda ha assunto un determinato rating ed, infine, il rating assunto dall’azienda. Si vuol porre l’attenzione, inoltre, sul fatto che i dati contenuti nella tabella sono disposti in modo tale che sia riportato, in ordine cronologico, le diverse variazioni avvenute tra

(32)

un rating e l’altro, della stessa azienda. I dati contenuti in questa tabella fanno riferimento all’intervallo di tempo tra il 1982 ed il 2005;

 l’anno di interesse, ovvero l’anno che sarà tenuto in considerazione durante lo svolgimento dell’intera function. Utilizzando la tabella “data”, l’anno dovrà essere compreso tra il 1982 ed il 2005.

In questa trattazione abbiamo voluto considerare, come anno di riferimento, il 1985, perché permette di svolgere dei calcoli necessari per questa trattazione.

Calcolo del numero di transizioni avvenute in un periodo considerato

Per ottenere il primo risultato finale relativo al periodo 31/12/1985-31/12/1986 si è reso necessario individuare il numero di imprese che, alla fine del 1985, rientravano in una determinata classe di rating.

Per fare ciò abbiamo formato una tabella al cui interno sono riportati i dati delle aziende relativi alle variazioni di rating avvenute precedentemente al 1986. Questa tabella è composta da 4 colonne:

 nella prima è riportato un numero progressivo;

 nella seconda è riportato il codice identificativo dell’azienda. Esso può essere ripetuto potrebbe essere ripetuto in quanto l’azienda potrebbe aver avuto più variazioni di rating prima della fine del 1985;

 la terza colonna contiene la data nella quale quell’azienda ha avuto una variazione di rating;

 la quarta colonna, infine, contiene il nuovo rating assunto dall’azienda

Questo primo risultato intermedio, in termini di output della function Generale3, prende il nome di TAB17. Quest’ultima, per una migliore esposizione, è stata scomposta in sotto-tabelle.

(33)
(34)
(35)
(36)

Come secondo risultato intermedio si è voluto creare una tabella che contenesse solamente l’ultima variazione di rating avuta dall’azienda prima del 1986. Questo, infatti, si presume essere il rating iniziale avuto dall’azienda prima della fine del 1985.

Quest’ultima, in termini di output della function creata, corrisponde al nome NuovaTAB. Senza alcuna modifica del risultato appena ottenuto si è ritenuto opportuno, per una migliore esposizione, riportare in 3 tabelle le prime 100 righe della tabella contenuta nell’output NuovaTAB. Questo è stato realizzato utilizzando la function FormaTab.

(37)
(38)
(39)
(40)

Come possiamo vedere la tabella sopra è composta in modo del tutto analogo alla precedente, ovvero:

 nella prima è riportato un numero progressivo;

 la seconda riporta un codice identificativo di un’azienda;

 la terza riporta la data nella quale l’azienda ha assunto quel rating determinato rating;

 infine, la quarta colonna riporta il rating assunto dall’azienda.

La tabella appena ottenuta si è utilizzata per giungere al terzo risultato intermedio, ovvero ad una tabella che riporta i totali effettivi delle aziende facenti parte di ciascuna classe di rating alla fine del 1985. Quest’ultimo è utile ai fini del calcolo del primo risultato finale, ovvero trovare le transizioni avvenute tra i diversi rating nel periodo di tempo considerato.

Come possiamo vedere, la tabella sopra riporta i totali effettivi delle aziende appartenenti a ciascuna classe di rating relativamente alla fine dell’anno 1985. Si è parlato di totali effettivi, in quanto al suo interno non rientrano le eventuali ripetizioni dello stesso ID identificativo dell’azienda. Se così fosse, l’azienda che ha avuto una o più variazioni di rating prima del 1986, verrebbe considerata più volte.

Si giunge, quindi, al quinto risultato intermedio: la matrice di transizione che ha, come nome di variabile data in output alla function Generale3, transMatCompleta.

(41)

La matrice di transizione indica la probabilità di passare da una classe di rating ad un’altra e, nel caso il rating di partenza coincida con quello di arrivo18, indica la probabilità di

rimanere nella stessa classe. La matrice di transizione è compresa tra la seconda e la nona colonna in quanto, la prima, riporta i totali effettivi delle aziende appartenenti ad un determinato rating. Per esempio, considerando le colonne relative alla matrice di transizione, il valore di posto (2, 2) indica la probabilità di rimanere nella classe di rating AA, mentre il valore di posto (2, 3) indica la probabilità che ha un’azienda di classe AA di essere declassata al rating A.

Utilizzando congiuntamente gli ultimi due risultati intermedi giungiamo al primo risultato finale, ovvero una matrice che indica le transizioni avvenute nell’intervallo di tempo tra la fine del 1985 e la fine del 1986. Per ottenerla si è creata una matrice diagonale con i numeri riportati nel terzo risultato intermedio e si è moltiplicata con la matrice di transizione.

La tabella riportata sopra, che ha come nome variabile output TransTotali, contiene: nella prima colonna, il totale effettivo delle aziende appartenenti ad una classe di rating mentre, quelle successive alla prima riportano, per ciascuna classe di rating, il numero di aziende

(42)

che hanno assunto quel determinato rating alla fine del 1986. Svolgendo un’analisi della tabella per righe anziché per colonne si può notare che ciascuna riga riporta, come primo elemento, il totale effettivo delle aziende appartenenti ad un determinato rating, mentre gli elementi restanti di ciascuna riga indicano il numero delle aziende transite in una classe di rating oppure il numero delle aziende che sono rimaste nella stessa classe di rating, qualora la classe di rating della riga coincida con la classe di rating della colonna.

Si può notare, infatti, che delle 188 aziende che iniziano il periodo preso in analisi: 181 rimangono in classe AAA, mentre 7 di queste, alla fine del periodo, vengono declassate al rating AA. Stesso discorso vale per tutte le altre classi di rating.

Per una maggior comprensione del primo risultato finale si è voluto riportare, di seguito, una figura che indicasse il numero di aziende per rating che, inizialmente appartenevano alla classe BB e che, alla fine del periodo, sono transite in un'altra classe di rating oppure sono rimaste nella classe di partenza. La figura mostra che delle 249 aziende che, alla fine del 1985, appartengono alla classe di rating BB: 226 aziende sono rimaste nella stessa classe di partenza, 12 aziende sono state declassate al rating B, 4 sono stata declassata al rating CCC, un’azienda è fallita, mentre 6 è stata promossa in classe BBB.

AAA AA A BBB BB B CCC D Ratings 0 50 100 150 200 250 N u m e ro A z ie n d e

(43)

La matrice di transizione IG-SG

Senza ulteriori risultati intermedi giungiamo, subito, al secondo risultato finale. Questo secondo risultato finale vede l’aggregazione delle prime 4 classi di rating (AAA, AA, A, BBB) nella classe più ampia investiment grade, le successive 3 (BB, B, CCC) nella classe più ampia speculative grade ed, infine, la classe di default non viene inserita in nessun’altra classe. Nella classe investment grade rientrano quelle classi di rating che hanno una probabilità di default molto bassa, mentre nella classe speculative grade rientrano quelle classi di rating che hanno una maggior probabilità di default. I titoli che hanno un rating appartenente a quest’ultima classe vengono spesso chiamati titoli spazzatura proprio per la loro maggior probabilità di default.

La matrice di transizione IG-SG indica le probabilità di transire o rimanere, qualora la classe di arrivo fosse la stessa di quella di partenza, nelle 2 classi più ampie e le probabilità di fallimento di ognuna delle classi.

Per costruire questa matrice si è dovuto ricorrere a due funzioni già predisposte dal programma Matlab: transprobgrouptotals e transprobbytotals. La prima di queste function aggrega più classi di rating in un'unica classe più ampia. Questa si è utilizzata per aggregare i primi quattro rating (AAA, AA, A e BBB) nella classe più amia denominata investment grade e per far rientrare nella classe speculative grade, i successivi tre rating (BB, B, CCC). L’output ottenuto da questa function è un dato strutturato.

La function transprobbytotals, invece, si è utilizzata per ottenere la matrice di transizione inserendo, come input, i dati in formato struttura derivanti dall’output della precedente function. Si giunge, così, ad avere una matrice di transizione 3x3 che, come nome output della function Generale3, ha TransMatIGSG. Questo risultato finale rappresenta il primo output della function transprobbytotals.

Riportiamo, di seguito, TransMatIGSG che indica le probabilità di passare, o di rimanere, in una delle tre classi considerate in questo paragrafo: investiment grade, speculative grade e stato di default.

(44)

L’elemento di posto (1,1) dell’output TransMatIGSG indica la probabilità, in termini percentuali, di rimanere nella classe investiment grade partendo da essa. Ciò significa che, per essere all’interno di tale classe, l’azienda parte con un rating appartenente alla classe più ampia di investment grade, deve giungere, alla fine del periodo, con un rating appartenente a questa classe più ampia. Ciò non comporta che il rating dell’azienda non possa subire declassamenti o miglioramenti del proprio rating ma, per rimanere nella classe dell’investment grade, è necessario che l’azienda abbia, alla fine del periodo, un rating che rientri in tale classe più ampia.

L’elemento di posto (1,2), invece, indica la probabilità in termini percentuali di passare dalla classe investment grade alla classe speculative grade. Ciò significa che l’azienda, che inizialmente aveva un rating appartenente alla classe più ampia dell’investment grade, ha sicuramente avuto un declassamento di rating, in quanto passata ad un rating più basso appartenente alla classe più ampia dello speculative grade.

Infine, l’elemento di posto (1,3) indica la probabilità di default in termini percentuali di un’azienda che inizialmente parte dalla classe investment grade. Questa, come possiamo vedere dall’immagine riportata sopra, è pari a zero. Ciò non è molto realistico in quanto porta a concludere che un’azienda appartenente alla classe di investment grade non possa mai fallire. In realtà, un’azienda appartenente a questa classe, si pensa che abbia ugualmente una probabilità di passare ad uno stato di default, nonostante questa sia molto bassa.

Discorso analogo vale per quegli elementi posti sulla seconda riga della matrice che ha come nome output TransMatIGSG.

L’ultima riga della matrice, invece, è dedicata allo stato di default. Essa riporta, nell’ultima colonna il valore 1. Questo perché il default è uno stato assorbente. Ciò significa che un azienda che si trova in questo stato non può più transire in nessun altro stato nei periodi

Riferimenti

Documenti correlati

La lunghezza del file non `e nota a priori e la sua correttezza non `e garantita: eventuali linee che non rispettino i criteri sopra indicati devono essere ignorate. Il programma

whose name is distinct from all other existing files, and opens the file for binary writing and reading (as if the mode string "wb+" were used in an fopen() call). If

[r]

© 2000 Pier Luca Montessoro (si veda la nota di copyright alla slide n. 2) 2 Questo insieme di trasparenze (detto nel seguito slide) è protetto dalle leggi sul copyright e

Si scrivano sotto l’ultima componente di xv e zv con 1 cifra prima della virgola e 15 dopo la virgola, in formato decimale, come pure la loro differenza in modulo err con 1 cifra

Si osserva che, pur essendo tutti gli autovalori di B inclusi nell’intervallo [10 −6 , 10 −2 ], ed essendo massimo il rango della matrice (pari alla dimensione della matrice),

14. Cosa si è osservato nell’esempio delle variabili PLIC, TD ecc. per le regioni italiane, quando si è svolta la regressione ed in particolare la riduzione del numero di fattori?..

Universit` a degli Studi di Roma Tor Vergata.. Corso di Laurea