• Non ci sono risultati.

Descrizione dei modelli utilizzati per l’analisi

CAPITOLO 5 APPLICAZIONI EMPIRICHE

5.3 L’applicazione dei GLM al caso dell’assicurazione motociclistica svedese

5.3.2 Descrizione dei modelli utilizzati per l’analisi

L’analisi proposta in questo capitolo sarà concentrata sulla tariffazione a priori, mediante l’applicazione dei modelli lineari generalizzati, per mezzo dei quali sarà possibile determinare il premio equo per le polizze del campione di riferimento.

Si ricorda che il premio equo corrisponde al valore atteso del risarcimento globale aleatorio per l’assicuratore:

Quindi, per la sua determinazione, le compagnie assicurative devono stimare il valore atteso del risarcimento globale a loro carico, determinato dal prodotto tra valore atteso dei risarcimenti per i singoli sinistri e numero atteso di sinistri:

( ) = ( ) ( )

Si procederà pertanto a stimare separatamente la frequenza dei sinistri attesa e il danno atteso per singola classe tariffaria, così da poter successivamente determinare, per ciascuna di esse, il premio equo, mediante il prodotto delle due stime.

Ricordiamo che nei GLM, le variabili risposta sono supposte stocasticamente indipendenti, con distribuzioni appartenenti ad una medesima famiglia esponenziale lineare. Il valore atteso delle variabili risposta è legato alle determinazioni delle variabili esplicative ′ , da una funzione di collegamento , invertibile.

Avremo pertanto:

( ) = ′ , ( ) = = ( ), = 1, … ,

in cui = ′ = + + ⋯ + è il previsore lineare; = ( , , , … , )′ è il vettore dei parametri che verranno stimati con la regressione e ′ = (1, , … , ) è il vettore delle determinazioni delle variabili esplicative.

Nella prassi assicurativa, il modello tariffario generalmente utilizzato è il modello moltiplicativo; la funzione di collegamento che permette di raggiungere la costruzione di tale modello è il logaritmo. Infatti se è funzione di collegamento logaritmica, cioè ( ) = ln( ) si avrà = = ∏ , raggiungendo così la determinazione del modello tariffario moltiplicativo: gli effetti additivi del previsore lineare si trasformano in effetti moltiplicativi sul premio equo. Inoltre il logaritmo consente di ottenere una valore atteso sempre positivo.

Per poter procedere con le analisi tramite i modelli lineari generalizzati è fondamentale fissare una classe tariffaria di riferimento. Come descritto al Paragrafo 4.2.2, una variabile di classificazione con ℓ livelli, può essere codificata con ℓ variabili indicatrici. Supponendo che nel modello sia presente l’intercetta ( ), allora le colonne della matrice di regressione , relative a tali variabili indicatrici e all’intercetta, sono linearmente dipendenti. Infatti la prima colonna della matrice è pari alla somma delle colonne corrispondenti ai livelli della variabile di classificazione . Dunque, per poter descrivere saranno sufficienti ℓ − 1 variabili indicatrici, poiché la rimanente potrà essere ottenuta per completamento ad uno. L’inserimento della variabile nel modello comporterà di conseguenza, l’introduzione di ℓ − 1 parametri di regressione.

Per ogni fattore di rischio è stata pertanto fissata la modalità di riferimento, scegliendo quella con la maggiore esposizione. Nel caso della zona geografica è stato fissato il livello 4, per il rapporto potenza-peso il livello 3, per gli anni del veicolo il livello 3. La classe descritta dal vettore (4, 3, 3) è pertanto la classe tariffaria di riferimento. Fissando la classe è possibile confrontare direttamente il numero di sinistri e il danno medio atteso delle varie classi tariffarie con quella maggiormente rappresentata.

Passiamo ora alla stima del previsore lineare. Nel caso esaminato, le variabili esplicative sono tutte di classificazione, quindi il previsore lineare per ciascuna osservazione sarà:

 = se l’osservazione appartiene alla classe di riferimento;  = + ( )+ ⋯ + ( ) se s variabili indicatrici sono unitarie.

Per poter poi calcolare il valore atteso delle variabili risposta, che ricordiamo è dato da ( ) = = ( ) è necessario invertire la funzione di collegamento. Essendo la funzione di collegamento logaritmica si ha:

 = se l’osservazione appartiene alla classe di riferimento;

 = ( )… ( ) se s variabili indicatrici, riferite a s variabili di classificazione , sono unitarie.

In questo modo si ottiene un modello tariffario moltiplicativo in cui è il numero di sinistri o il danno medio atteso per sinistro, per gli assicurati della classe tariffaria di riferimento e ( ) è la relatività moltiplicativa, associata al livello della variabile tariffaria .

Sulla base di quanto appena descritto, vediamo ora nello specifico i due modelli applicati per la stima dei sinistri e dei danni nelle classi.

Il GLM impiegato per la stima del numero di sinistri in ciascuna classe tariffaria , coincide con il modello descritto al Paragrafo 4.5.4. Si stimerà pertanto il numero di sinistri attesi per ciascuna classe tariffaria tramite un modello in cui le variabili risposta , cioè il numero aleatorio di sinistri che colpiranno il rischio assicurato, sono considerate stocasticamente indipendenti, con distribuzione di Poisson.

Il valore atteso di tali variabili è = ( ) = ( ) = , vale a dire che il valore atteso del numero di sinistri nella classe corrisponde al prodotto tra l’esposizione totale della classe e il numero atteso annuo di sinistri per ciascun assicurato in un anno. Nel caso di distribuzione di Poisson la varianza coincide con il valore atteso34.

34 Si veda la Tabella 6 riportata al Paragrafo 4.2.1 che riassume le principali caratteristiche della

I previsori lineari delle classi tariffarie sono indicati da = ln + ′ ; in cui ln è il termine offset introdotto al fine di tener conto dell’esposizione, poiché nei dati non sono presenti unicamente esposizioni unitarie, bensì anche esposizioni inferiori o superiori all’anno.

La funzione di collegamento è = , ossia la funzione di collegamento canonico per la distribuzione di Poisson.

Invece per la stima del danno medio per sinistro nelle classi tariffarie, il GLM avrà la struttura prevista dal modello, delineato al Paragrafo 4.6.4. Anche in questo caso le variabili risposta , che indicano i danni medi per sinistro per le diverse classi tariffarie, sono supposte stocasticamente indipendenti. Le variabili risposta avranno distribuzione gamma e il peso introdotto per la loro stima sarà il numero totale di sinistri , che ha colpito la classe.

In tale modello il valore atteso del danno medio per sinistro sarà dato da ( ) = = ( ), con varianza ( ) = . Il parametro di dispersione è stimato per mezzo del metodo di massima verosimiglianza.

I previsori lineari di ciascuna classe tariffaria saranno = ′ ; la funzione di collegamento è = . È stata scelta la funzione logaritmo e non la funzione di collegamento canonica per la distribuzione gamma, che è = −1/ , in quanto quest’ultima richiederebbe di porre dei vincoli sui parametri di regressione per far sì che il previsore lineare sia negativo e di conseguenza il valore atteso sia positivo. Si preferisce pertanto fissare una funzione di collegamento logaritmica che permette di ottenere valori positivi per il valore atteso, senza dover porre vincoli ai parametri. Inoltre, come detto in precedenza, la scelta della funzione di collegamento logaritmica dipende dal fatto che spesso, nella pratica assicurativa, sono adottati modelli tariffari di tipo moltiplicativo e il logaritmo permette la costruzione di questo tipo di modello.