Stima di modelli di sopravvivenza parametrici uscite per morte e per altra causa

(1)

2

STIMA DI MODELLI DI SOPRAVVIVENZA PARAMETRICI USCITE PER MORTE E PER ALTRA CAUSA

Supponiamo di avere osservato n individui e di disporre di dati individuali esatti, riassunti per ogni individuo i dal vettore delle età

(

^y_i^, ^z_i^,

θ

_i^,

φ

_i^,

)

= 1, . . . , essendo

yi l’età esatta di ingresso in osservazione zi l’età esatta di uscita pianificata

θ

i l’età esatta di uscita per morte (

θ

_i = 0 se l’individuo i non è uscito per morte)

φ

i l’età esatta di uscita per altra causa (

φ

_i = 0 se l’individuo i non è uscito per altra causa) Obiettivo: stimare la funzione di sopravvivenza di un modello di sopravvivenza

parametrico

(2)

3

Modello di sopravvivenza a due cause di eliminazione: morte ed altra causa

Sia

Tx durata di permanenza nella collettività per un individuo presente all’età x

(

⁽ ⁾^, ⁽ ⁾

)

min _x^d _x^w

x T T

T = essendo

) (d

Tx durata di permanenza nella collettività finché non si ha l’uscita per morte, per un individuo presente nella collettività all’età x

) (w

Tx durata di permanenza nella collettività finché non si ha l’uscita per altra causa, per un individuo presente nella collettività all’età x

Siano

) (

)

( ₀⁽ ⁾

)

( t P T t

S ^d = ^d > funzione di sopravvivenza (parametrica) relativa al n.a. T₀⁽^d⁾ )

( )

( ₀⁽ ⁾

)

( t P T t

S ^w = ^w > funzione di sopravvivenza (parametrica) relativa al n.a. T₀⁽^w⁾

(3)

4

Ipotesi: uscite non informative

( )

^t ^a ^d

( )

^t

d) ( )

(

µ

= t ≥ 0

( )

^t ^a ^w

( )

^t

w) ( )

(

µ

= t ≥ 0

essendo

( ) ( )

t

t T

t t

T P t

x

d x d

x t

d

∆

>

∆ +

= ≤

+ ∆ →

) ( )

(

0 )

( lim

µ

( ) ( )

t

t T

t t

T P t

x

w x w

x t

w

∆

>

∆ +

= ≤

+ ∆ →

) ( )

(

0 )

( lim

µ

le intensità marginali di eliminazione e

( ) ( )

t

t T C

t t

T t P

x

a ^x ^x

t d

∆

>

=

∆ +

= ≤

+ ∆ →

1 lim ,

0 )

µ

(

( ) ( )

t

t T C

t t

T t P

x

a ^x ^x

t w

∆

>

=

∆ +

= ≤

+ ∆ →

2 lim ,

0 )

µ

(

le intensità di uscita per le varie cause, dove C =1 denota l’evento “uscita per morte” e

= 2

C denota l’evento uscita per altra causa

(4)

5

In ipotesi di uscite non informative sussiste la relazione di Karup

) ( ) ( )

( w

x t d x t x

t p ^τ = p′ p′

essendo

( )

) (

) exp (

) (

0 ) ( )

(

x S

t x du S

u x

p d

t d d d

x t

= +







−  +

′ =

µ

( )

) (

) exp (

) (

0

) ( )

(

x S

t x du S

u x

p w

t w w w

x t

= +







−  +

′ =

µ

(5)

6

Stima con il metodo della massima verosimiglianza

Per scrivere la verosimiglianza delle osservazioni

(

^y_i^, ^z_i^,

θ

_i^,

φ

_i^,

)

= 1, . . . , definiamo, per ogni = 1, . . . , , i n.a.

)

T(i durata aleatoria di osservazione dell’individuo i nella collettività







=

altrimenti 0

causa altra

per esce individuo

l' se 2

morte per

esce individuo

l' se 1

)

( i

i

C ⁱ

Nota: T⁽ⁱ⁾ ha determinazioni

]

0, zi − yi

]

Indicato con ^{( )} la durata di permanenza nella collettività per l’i-esimo individuo, si ha

( ) = ^{( )}, −

(6)

7

Nell’ipotesi che per ogni individuo i le durate aleatorie di permanenza nella collettività, all’età minima possibile per l’ingresso in assicurazione, siano ugualmente distribuite, si ha

( ) ≤ =

0 ≤ 0

( ) ≤ 0 < < −

1 ≥ −

dove ^{( )} ≤ = ^{( )}.

Si definiscono

{

i i zi

}

S = l'individuo èpresentenellacollettività all'età survival

{

i i i

}

D = ^l'îndividuo êsce^per^morteâll'êtà

θ

death

{

i i i

}

W = ^l'îndividuo êsce^perâltra^causa âll'êtà

φ

withdrawal

(7)

8

Se l’individuo i è presente nella collettività all’età di uscita pianificata:

i i i

y z

T⁽ ⁾ = −

) (

) ( )

( ) ) (

( ( )

) ( )

( ) ) (

( )

) ( (

w i i w

d i i w d

y y z d y y y z

y z i

i i

y S

z S

y S

z p S

p p

y z T

P

i i i i

i i i

i

i = ′ ⋅ ′ = ⋅

=

−

= ₋ ^τ ₋ ₋

Se l’individuo i esce per morte all’età esatta

θ

_i^:

i i

i y

T⁽ ⁾ =

θ

−

( ) ( )

^d

( )

_i

i w w i i

d d i i

d y y

i i C

T S y

S y

S p S

y f

i i

i

µ θ θ θ µ θ

θ

_θ ⁽^τ⁾ ⁽ ⁾ ₍⁽ ₎⁾ ₍⁽ ₎⁾ ⁽ ⁾

, ( )

) ( )

( ) 1 (

, = ⋅ = ⋅ ⋅

− ₋

Se l’individuo i esce per altra causa all’età esatta

φ

_i^:

i i

i y

T⁽ ⁾ =

φ

−

( ) ( )

^w

( )

_i

i w

i d

i d i

w y y

i i C

T S y

S y

S p S

y f

i i

i

µ φ φ φ µ φ

φ

_φ ⁽^τ⁾ ⁽ ⁾ ₍⁽ ₎⁾ ₍⁽ ₎⁾ ⁽ ⁾

, ( )

) ( )

( ) 2 (

, = ⋅ = ⋅ ⋅

− ₋

(8)

9

In ipotesi di indipendenza stocastica dei n.a. T⁽ⁱ⁾ la verosimiglianza delle osservazioni è

( ) ( )

∏ − ⋅ ∏ −

∏ = − ⋅

= ∈ i∈D T C i i i∈W T C i i S

i i i i

y f

y z T

P

L ( ⁽ ⁾ ) _,

θ

,1 _,

φ

,2

( ) ( )

∏ ⋅ ⋅ ∏ ⋅

∏ ⋅

= ∈ − ∈ −

∈ −

D

i i W w i

y y i

d y y

S

i z_i y_i p⁽y^τ_i⁾ _θ_i _i p⁽^τ_i⁾

µ

⁽ ⁾

θ

_φ_i _i p⁽^τ_i⁾

µ

⁽ ⁾

φ

∏ ⋅ ⋅

= i∈S w i

i w

i d

y S

z S

y S

z S

) (

) ( )

( ) (

) (

) ( )

( ) (

( )

^⋅

∏ ⋅ ⋅

⋅i∈D d i

i w

i d

y S

S y

S

θ θ µ

( )

θ

) (

) ( )

( ) (

) (

) ( )

( ) (

∏ ⋅ ⋅

( )

⋅i∈W w i

i w w i i

d d i

y S

S y S

S

φ φ µ

( )

φ

) (

) ( )

( ) (

) (

) ( )

( ) (

(9)

10

Poiché

( )

⁽ ⁾

)

( ⁽ ⁾ ⁽ ⁾

)

( d i

d i d i

f

S

θ

⋅

µ θ

=

θ

⁽ ⁾⁽ ⁾ ⁽ ⁾

( )

⁽w⁾⁽ i⁾ w i

w i

f

S

φ

⋅

µ φ

=

φ

si ha

( )

⋅ ∏ ^⋅

∏ ⋅

= ∈ ∈ i∈W d i

i d D

i d i

i d

i d S

i d i

i d

y S

S y

S S y

S

z L S

) (

) ( )

( ) ( )

( ) (

) (

) ) (

( )

( ) ( )

( )

(

θ µ θ φ

( )

∏ ⋅

⋅ ∈ ∈ i∈W w i

i w

i w D

i w i

i w S

i w i

i w

y S

S y

S S y

S

z

S

θ φ µ

( )

φ

) (

) ( )

( ) ( )

( ) (

) (

) ( )

( ) ( )

( ) (

∏ ⋅

= ∈ ∈ i∈W d i

i d D

i d i

i d S

i d i

i d

y S

S y

S f y

S

z S

) (

) ( )

( ) ( )

( ) (

) (

) ( )

( ) ( )

( )

(

θ φ

⋅ ∏

∈

∈ i W w i

i w D

i w i

i w S

i w i

i w

y S

f y

S S y

S

z S

) (

) ( )

( ) ( )

( ) (

) (

) ( )

( ) ( )

( )

(

θ φ

(10)

11

Quindi

) ( )

(d w

L L

L = ⋅

con

⋅ ∏

= ∏

∈

∈ i W d i

i d D

i d i

i d S

i d i

i d d

y S

S y

S f y

S

z L S

) (

) ( )

( ) ( )

( ) (

) (

) ( )

( ) ( )

( ) ) (

(

θ φ

e

⋅ ∏

= ∏

∈

∈ i W w i

w i D

i w i

w i S

i w i

w i w

y S

f y

S S y

S

z L S

) (

) ( )

( ) ( )

( ) (

) (

) ( )

( ) ( )

( ) ) (

(

θ φ

Quindi per stimare la funzione di sopravvivenza S⁽^d⁾(t) si porrà

)

maxL(^d

mentre per stimare la funzione di sopravvivenza S⁽^w⁾(t) si porrà

)

maxL(^w

(11)

12

Stima di massima verosimiglianza della funzione di sopravvivenza S⁽^d⁾(t)

⋅ ∏

= ∏

∈

∈ i D d i

i d W

i d i

i d S

i d i

i d d

y S

f y

S S y

S

z L S

) (

) ( )

( ) ( )

( ) (

) (

) ( )

( ) ( )

( ) ) (

(

φ θ

dove

) ( )

( ⁽ ⁾

)

( S t

t d t d

f ^d = − ^d

Si nota che le informazioni sulle uscite per altra causa sono trattate come le informazioni sulla sopravvivenza all’età di uscita pianificata

Se il modello di sopravvivenza parametrico per la durata aleatoria di vita T₀⁽^d⁾ è assegnato mediante l’intensità istantanea di mortalità

µ

⁽^{d )}

( )

^t la verosimiglianza può essere scritta nel modo seguente

( ) ( )

∏

( ) ( )























− 

∏ ⋅









− 

∏ ⋅









− 

= ∈ ∈ i∈D d i

y d W

i y

d S

i

z y

d

d ⁱ

i i

i

dt t dt

t dt

t

L⁽ ⁾ ^exp

µ

⁽ ⁾ ^exp ^φ

µ

⁽ ⁾ ^exp ^θ

µ

⁽ ⁾

µ

⁽ ⁾

θ

(12)

13

Con riferimento all’i-esimo individuo osservato, indichiamo con t_i la determinazione del n.a. T⁽ⁱ⁾, si ha







∈

−

∈

−

∈

−

=

D i y

W i y

S i y

z t

i i

i i i

se se se

θ

φ

Consideriamo inoltre l’indicatore di evento





∈

∪

= ∈

D i

W S

d_i i

se 1

se

0

la verosimiglianza L⁽^d⁾ relativa agli n individui osservati può allora essere scritta come segue

( ) ( ( ) )

∏ 









  +









−  +

= = n i

d i i t d

i d

d ⁱ ⁱ

t y ds

s y L

1

) ( 0

) ( )

( exp

µ µ

(13)

14

Indicata con

( )

 +

= ^t ^d

y t y s ds

H

0 )

) (

(

µ

la funzione di rischio integrata, la verosimiglianza L^(d⁾ diventa

( ) ( ⁽ ⁾ )

∏ 

 − +

= = n i

d i i d i

y

d ⁱ

i t y t

H L

1

) ( )

( exp ( )

µ

e quindi si ottiene la seguente espressione per la log-verosimiglianza

( )

 +

+

−

= = =

n

i d i i

i n

i y i

d H t d y t

L i

1

) ( 1

)

( ( ) log

log

µ

Per ottenere quindi la stima di massima verosimiglianza di un modello di sopravvivenza parametrico, disponendo di dati individuali esatti, è sufficiente specificare la struttura della intensità istantanea di mortalità

µ

⁽^{d )}

( )

^t e della relativa funzione di rischio integrato H_y(t)

(14)

15

S.J. Richards (2012), “A handbook of parametric survival models for actuarial use”, Scandinavian Actuarial Journal

V. Table 1. Some actuarial mortality laws and their corresponding integrated hazard functions.