2
STIMA DI MODELLI DI SOPRAVVIVENZA PARAMETRICI USCITE PER MORTE E PER ALTRA CAUSA
Supponiamo di avere osservato n individui e di disporre di dati individuali esatti, riassunti per ogni individuo i dal vettore delle età
(
yi, zi,θ
i,φ
i,)
= 1, . . . , essendoyi l’età esatta di ingresso in osservazione zi l’età esatta di uscita pianificata
θ
i l’età esatta di uscita per morte (θ
i = 0 se l’individuo i non è uscito per morte)φ
i l’età esatta di uscita per altra causa (φ
i = 0 se l’individuo i non è uscito per altra causa) Obiettivo: stimare la funzione di sopravvivenza di un modello di sopravvivenzaparametrico
3
Modello di sopravvivenza a due cause di eliminazione: morte ed altra causa
Sia
Tx durata di permanenza nella collettività per un individuo presente all’età x
(
( ), ( ))
min xd xw
x T T
T = essendo
) (d
Tx durata di permanenza nella collettività finché non si ha l’uscita per morte, per un individuo presente nella collettività all’età x
) (w
Tx durata di permanenza nella collettività finché non si ha l’uscita per altra causa, per un individuo presente nella collettività all’età x
Siano
) (
)
( 0( )
)
( t P T t
S d = d > funzione di sopravvivenza (parametrica) relativa al n.a. T0(d) )
( )
( 0( )
)
( t P T t
S w = w > funzione di sopravvivenza (parametrica) relativa al n.a. T0(w)
4
Ipotesi: uscite non informative
( )
t a d( )
td) ( )
(
µ
µ
= t ≥ 0( )
t a w( )
tw) ( )
(
µ
µ
= t ≥ 0essendo
( ) ( )
t
t T
t t
T P t
x
d x d
x t
d
∆
>
∆ +
= ≤
+ ∆ →
) ( )
(
0 )
( lim
µ
( ) ( )
t
t T
t t
T P t
x
w x w
x t
w
∆
>
∆ +
= ≤
+ ∆ →
) ( )
(
0 )
( lim
µ
le intensità marginali di eliminazione e
( ) ( )
t
t T C
t t
T t P
x
a x x
t d
∆
>
=
∆ +
= ≤
+ ∆ →
1 lim ,
0 )
µ
(
( ) ( )
t
t T C
t t
T t P
x
a x x
t w
∆
>
=
∆ +
= ≤
+ ∆ →
2 lim ,
0 )
µ
(le intensità di uscita per le varie cause, dove C =1 denota l’evento “uscita per morte” e
= 2
C denota l’evento uscita per altra causa
5
In ipotesi di uscite non informative sussiste la relazione di Karup
) ( ) ( )
( w
x t d x t x
t p τ = p′ p′
essendo
( )
) (
) exp (
) (
) (
0 ) ( )
(
x S
t x du S
u x
p d
t d d d
x t
= +
− +
′ =
µ
( )
) (
) exp (
) (
) (
0
) ( )
(
x S
t x du S
u x
p w
t w w w
x t
= +
− +
′ =
µ
6
Stima con il metodo della massima verosimiglianza
Per scrivere la verosimiglianza delle osservazioni
(
yi, zi,θ
i,φ
i,)
= 1, . . . , definiamo, per ogni = 1, . . . , , i n.a.)
T(i durata aleatoria di osservazione dell’individuo i nella collettività
=
altrimenti 0
causa altra
per esce individuo
l' se 2
morte per
esce individuo
l' se 1
)
( i
i
C i
Nota: T(i) ha determinazioni
]
0, zi − yi]
Indicato con ( ) la durata di permanenza nella collettività per l’i-esimo individuo, si ha
( ) = ( ), −
7
Nell’ipotesi che per ogni individuo i le durate aleatorie di permanenza nella collettività, all’età minima possibile per l’ingresso in assicurazione, siano ugualmente distribuite, si ha
( ) ≤ =
0 ≤ 0
( ) ≤ 0 < < −
1 ≥ −
dove ( ) ≤ = ( ).
Si definiscono
{
i i zi}
S = l'individuo èpresentenellacollettività all'età survival
{
i i i}
D = l'individuo esceper morteall'età
θ
death{
i i i}
W = l'individuo esceper altracausa all'età
φ
withdrawal8
Se l’individuo i è presente nella collettività all’età di uscita pianificata:
i i i
y z
T( ) = −
) (
) ( )
( ) ) (
( ( )
) ( )
( ) ) (
( )
( )
) ( (
w i i w
d i i w d
y y z d y y y z
y z i
i i
y S
z S
y S
z p S
p p
y z T
P
i i i i
i i i
i
i = ′ ⋅ ′ = ⋅
=
−
= − τ − −
Se l’individuo i esce per morte all’età esatta
θ
i:i i
i y
T( ) =
θ
−( ) ( )
d( )
ii w w i i
d d i i
d y y
i i C
T S y
S y
S p S
y f
i i
i
µ θ θ θ µ θ
θ
θ (τ) ( ) (( )) (( )) ( ), ( )
) ( )
( ) 1 (
, = ⋅ = ⋅ ⋅
− −
Se l’individuo i esce per altra causa all’età esatta
φ
i:i i
i y
T( ) =
φ
−( ) ( )
w( )
ii w
i w
i d
i d i
w y y
i i C
T S y
S y
S p S
y f
i i
i
µ φ φ φ µ φ
φ
φ (τ) ( ) (( )) (( )) ( ), ( )
) ( )
( ) 2 (
, = ⋅ = ⋅ ⋅
− −
9
In ipotesi di indipendenza stocastica dei n.a. T(i) la verosimiglianza delle osservazioni è
( ) ( )
∏ − ⋅ ∏ −
∏ = − ⋅
= ∈ i∈D T C i i i∈W T C i i S
i i i i
y f
y f
y z T
P
L ( ( ) ) ,
θ
,1 ,φ
,2( ) ( )
∏ ⋅ ⋅ ∏ ⋅
∏ ⋅
= ∈ − ∈ −
∈ −
D
i i W w i
y y i
d y y
S
i zi yi p(yτi) θi i p(τi)
µ
( )θ
φi i p(τi)µ
( )φ
∏ ⋅ ⋅
= i∈S w i
i w
i d
i d
y S
z S
y S
z S
) (
) ( )
( ) (
) (
) ( )
( ) (
( )
⋅∏ ⋅ ⋅
⋅i∈D d i
i w
i w
i d
i d
y S
S y
S
S
θ θ µ
( )θ
) (
) ( )
( ) (
) (
) ( )
( ) (
∏ ⋅ ⋅
( )
⋅i∈W w i
i w w i i
d d i
y S
S y S
S
φ φ µ
( )φ
) (
) ( )
( ) (
) (
) ( )
( ) (
10
Poiché
( )
( ))
( ( ) ( )
)
( d i
d i d i
f
S
θ
⋅µ θ
=θ
( )( ) ( )( )
(w)( i) w iw i
f
S
φ
⋅µ φ
=φ
si ha
( )
⋅ ∏ ⋅∏ ⋅
∏ ⋅
= ∈ ∈ i∈W d i
i d D
i d i
i d
i d S
i d i
i d
y S
S y
S S y
S
z L S
) (
) ( )
( ) ( )
( ) (
) (
) ) (
( )
( ) ( )
( )
(
θ µ θ φ
( )
∏ ⋅
∏ ⋅
∏ ⋅
⋅ ∈ ∈ i∈W w i
i w
i w D
i w i
i w S
i w i
i w
y S
S y
S S y
S
z
S
θ φ µ
( )φ
) (
) ( )
( ) ( )
( ) (
) (
) ( )
( ) ( )
( ) (
∏ ⋅
∏ ⋅
∏ ⋅
= ∈ ∈ i∈W d i
i d D
i d i
i d S
i d i
i d
y S
S y
S f y
S
z S
) (
) ( )
( ) ( )
( ) (
) (
) ( )
( ) ( )
( )
(
θ φ
⋅ ∏
⋅ ∏
⋅ ∏
∈
∈
∈ i W w i
i w D
i w i
i w S
i w i
i w
y S
f y
S S y
S
z S
) (
) ( )
( ) ( )
( ) (
) (
) ( )
( ) ( )
( )
(
θ φ
11
Quindi
) ( )
(d w
L L
L = ⋅
con
⋅ ∏
⋅ ∏
= ∏
∈
∈
∈ i W d i
i d D
i d i
i d S
i d i
i d d
y S
S y
S f y
S
z L S
) (
) ( )
( ) ( )
( ) (
) (
) ( )
( ) ( )
( ) ) (
(
θ φ
e
⋅ ∏
⋅ ∏
= ∏
∈
∈
∈ i W w i
w i D
i w i
w i S
i w i
w i w
y S
f y
S S y
S
z L S
) (
) ( )
( ) ( )
( ) (
) (
) ( )
( ) ( )
( ) ) (
(
θ φ
Quindi per stimare la funzione di sopravvivenza S(d)(t) si porrà
)
maxL(d
mentre per stimare la funzione di sopravvivenza S(w)(t) si porrà
)
maxL(w
12
Stima di massima verosimiglianza della funzione di sopravvivenza S(d)(t)
⋅ ∏
⋅ ∏
= ∏
∈
∈
∈ i D d i
i d W
i d i
i d S
i d i
i d d
y S
f y
S S y
S
z L S
) (
) ( )
( ) ( )
( ) (
) (
) ( )
( ) ( )
( ) ) (
(
φ θ
dove
) ( )
( ( )
)
( S t
t d t d
f d = − d
Si nota che le informazioni sulle uscite per altra causa sono trattate come le informazioni sulla sopravvivenza all’età di uscita pianificata
Se il modello di sopravvivenza parametrico per la durata aleatoria di vita T0(d) è assegnato mediante l’intensità istantanea di mortalità
µ
(d )( )
t la verosimiglianza può essere scritta nel modo seguente( ) ( )
∏( ) ( )
−
∏ ⋅
−
∏ ⋅
−
= ∈ ∈ i∈D d i
y d W
i y
d S
i
z y
d
d i
i i
i i
i
dt t dt
t dt
t
L( ) exp
µ
( ) exp φµ
( ) exp θµ
( )µ
( )θ
13
Con riferimento all’i-esimo individuo osservato, indichiamo con ti la determinazione del n.a. T(i), si ha
∈
−
∈
−
∈
−
=
D i y
W i y
S i y
z t
i i
i i
i i i
se se se
θ
φ
Consideriamo inoltre l’indicatore di evento
∈
∪
= ∈
D i
W S
di i
se 1
se
0
la verosimiglianza L(d) relativa agli n individui osservati può allora essere scritta come segue
( ) ( ( ) )
∏
+
− +
= = n i
d i i t d
i d
d i i
t y ds
s y L
1
) ( 0
) ( )
( exp
µ µ
14
Indicata con
( )
+
= t d
y t y s ds
H
0 )
) (
(
µ
la funzione di rischio integrata, la verosimiglianza L(d) diventa
( ) ( ( ) )
∏
− +
= = n i
d i i d i
y
d i
i t y t
H L
1
) ( )
( exp ( )
µ
e quindi si ottiene la seguente espressione per la log-verosimiglianza
( )
( )
+
+
−
= = =
n
i d i i
i n
i y i
d H t d y t
L i
1
) ( 1
)
( ( ) log
log
µ
Per ottenere quindi la stima di massima verosimiglianza di un modello di sopravvivenza parametrico, disponendo di dati individuali esatti, è sufficiente specificare la struttura della intensità istantanea di mortalità
µ
(d )( )
t e della relativa funzione di rischio integrato Hy(t)15
S.J. Richards (2012), “A handbook of parametric survival models for actuarial use”, Scandinavian Actuarial Journal
V. Table 1. Some actuarial mortality laws and their corresponding integrated hazard functions.