Processi gaussiani di Markov - I processi gaussiani di Markov

3.3 I processi gaussiani di Markov

3.3.2 Processi gaussiani di Markov

Supponiamo che{X(t)}t∈T sia un processo gaussiano centrato, a variabili in

L2_(Ω,_{F, P). Indichiamo anche in questo caso con ρ la funzione}

ρ : T _{× T → [0, 1]} (t1, t2)7→

cov_{X(t1), X(t2)}

pVarX(t1)Var{X(t2)}

Dalla proposizione 3.3.2 e dalla definizione di processo di Markov segue subito che {X(t)}t∈T `e di Markov se e solo se, per ogni t1 ≤ t2 ≤ t3 ∈ T ,

ρ(t1, t3) = ρ(t1, t2)ρ(t2, t3). (3.10)

Supponiamo che il processo sia stazionario, con funzione di covarianza Γ, allora

ρ(t1, t2) =

Γ(_|t1− t2|)

Γ(0) ,

`e una funzione del valore assoluto della differenza|t1−t2|. Nel caso di processi

gaussiani stazionari, vale la seguente caratterizzazione.

Proposizione 3.3.3. Supponiamo che _{X(t)}t∈T sia un processo gaussiano

stazionario, con funzione di covarianza Γ. Condizione necessaria e sufficiente affinch´e X(t) sia di Markov `e che:

• se T = Z, per ogni t ∈ T :

Γ(|t|) = Γ(0)ρ(1)|t|_.

• se T = R, nel caso la funzione di covarianza non sia identicamente nulla, esiste λ≥ 0 tale che, per ogni t ∈ T

Γ(|t|) = Γ(0)e−λt_.

Dimostrazione. Nel caso T = Z, se vale

Γ(t) = Γ(0)ρ(1)|t|

è verificata la condizione (3.10) e dunque il processo è di Markov. Viceversa verifichiamo per induzione su _{|t| che (3.10) implichi una simile parametriz-} zazione della funzione di covarianza. Se _{|t| = 0 o |t| = 1 la tesi è verificata}

banalmente; supponiamo che sia verificata per _{|t| = k, dimostriamola per} |t| = k + 1. Per (3.10) abbiamo che

Γ(k + 1) = Γ(0)ρ(k + 1) = Γ(0)ρ(1)k+1.

Consideriamo ora il caso reale; in questo caso la dimostrazione segue dal lemma 3.3.2, che verr`a dimostrato subito sotto.

Lemma 3.3.2. Sia u una funzione

u : R+_{→ R} tale che u(t)≤ 1 per ogni t ∈ R+ _e

u(t1+ t2) = u(t1)u(t2) (3.11)

per ogni t1, t2 ∈ R. Allora o u = 0 oppure esiste λ ∈ R+ tale che u = e−λt.

Dimostrazione. Supponiamo che esista t ∈ R+ _{tale che u(t) = 0. Allora per}

ogni z > t

u(z) = u(t)u(z− t) = 0.

Inoltre per ogni n _{∈ N vale u(t) = u}n_(t2−n_{), dunque per ogni n}_{∈ N}

u(t2−n) = 0.

Poich´e la successione t2−n_{`e infinitesima, dato t > 0 esiste n}

t ∈ N tale che

t2−nt _{< t,}

dunque per quanto detto sopra u(t) = 0 per ogni t > 0.

Supponiamo viceversa che u(t) > 0 per ogni t > 0. Esiste λ _{∈ R}+ _{tale che}

e−λ = u(1). Consideriamo la funzione

v(t) = u(t)eλt_:

essa verifica ancora (3.11), inoltre l’ipotesi di limitatezza di u implica che v(t)_{≤ e}λt

e v(1) = 1. Consideriamo a, b _{∈ N, da (3.11) applicata a v, segue immedia-} tamente che v(a b) = v(1) a b,

dunque se q _{∈ Q, v(q) = 1. Supponiamo che esista w ∈ R}+_{tale che v(w)} _{6= 1.}

Se v(w) > 1 la funzione v non `e limitata, perch´e v(nw) = v(w)n_.

Se invece fosse v(w) < 1, allora scelto un razionale q > w, avremmo che v(q_{− w) =} v(q)

v(w) > 1,

per cui ci si riconduce al caso precedente. Quindi, l’ipotesi che v(w) _{6= 1} implica che v non sia limitata.

Dal momento che Q `e denso in R, fissati ǫ > 0 e t > 0 esiste tǫ ∈ R+ con

tǫ< ǫ e t− tǫ ∈ Q. Dunque si ha:

v(t) = v(t− tǫ)v(tǫ) = 1· v(tǫ) = v(tǫ).

Perciò se v non è limitata, non è limitata in alcun intorno contenente l’origine, il che è assurdo, perché

v(t) _{≤ e}λt_.

Capitolo 4

Ricerca della trasformazione

per la gaussianit`a

In questo capitolo cominciamo l’analisi statistica del modello proposto da [7] sulla base dei dati a nostra disposizione. Supponiamo che {X(t)}t∈R+ sia

il processo che modellizza il decadimento del numero di linfociti CD4+ per mm3 _{di sangue nei soggetti sieronegativi. Gli autori di [7] ipotizzano che}

questo processo sia log-gaussiano e stazionario, ossia che il processo {log(X(t))}t∈R+

sia un processo gaussiano stazionario. Il primo passo per verificare il modello è sottoporre a test questa ipotesi. Non indagheremo la stazionarietà del processo: assumendo la stazionarietà come ipotesi di partenza, intendiamo verificare se log X(t) sia gaussiano o meno.

Ogni soggetto del nostro campione è stato richiamato a 45 visite, con un intervallo di sei mesi tra una visita e la successiva. Dall’ipotesi di staziona- rietà del processo segue che, se dividiamo le misure a nostra disposizione in base al numero delle visite, otteniamo 45 campioni a variabili indipendenti e identicamente distribuite, con legge uguale a quella di X(t). Sottoponiamo ogni campione a quattro test di gaussianità: i test di Anderson-Darling, di Cramer-Von Mises, di Pearson e di Kolmogorv-Smirnov. Per approfondimen- ti relativi a questi test, vedi [44], [46]. Nella tabella (4.1) sono riportati i p-values del primo campione (i risultati ottenuti per gli altri campioni sono analoghi).

Al livello di significativit`a 0.1, tutti i test condotti respingono l’ipotesi di gaussianit`a.

Tabella 4.1: P-values dei test di gaussianit`a sul primo campione

Anderson-Darling Cramer-von Mises Pearson Kolmogorv-Smirnov

6.08 E-07 1.61E-05 0.07161 0.0007277

Christopher Cox, in un’e-mail, ci ha suggerito che la trasformazione da apportare al processo X(t) pu`o non essere logaritmica e va stimata spe- rimentalmente a partire dal campione. Fra le possibili trasformazioni, Cox propone la radice quadrata o la radice cubica. Anche con queste trasformazioni, tuttavia, i test condotti sul nostro campione hanno respinto l’ipotesi di gaussianit`a.

In questo capitolo, presentiamo il metodo utilizzato più frequentemente in letteratura per la ricerca della trasformazione (metodo di Box Cox), e ne proponiamo uno alternativo, basato sui p-values del test di Kolmogorov- Smirnov. Nel caso in esame, i due metodi portano a risultati equivalenti. Entrambi i metodi si basano sull’ipotesi che esista un’opportuna trasformazione T tale che il processo T (X(t)) sia gaussiano (in realtà ci sarà bisogno di opportune modifiche alla gaussianità): nel paragrafo 4.1 studieremo i rapporti esistenti fra il processo X(t) e il processo T (X(t)) per un’opportuna classe parametrizzata di trasformazioni.

4.1 Le distribuzioni Box Cox

Lo scopo del capitolo `e determinare una trasformazione T tale che il processo trasformato

{T (X(t))}t∈T

sia gaussiano. In questa sezione introdurremo la famiglia di trasformazioni di Box Cox (il metodo di Box Cox, trattato in 4.2, sar`a uno dei due metodi utilizzati per la scelta della trasformazione) e studieremo i rapporti esistenti fra il processo _{X(t)}t∈T e il processo trasformato {f(X(t))}t∈T.

Consideriamo, al variare di λ _{∈ R, la famiglia di funzioni definite su R}+

fλ(x) =

_xλ₋₁

λ se λ6= 0

Esse si dicono trasformazioni di Box Cox, o trasformazioni di potenze. Vo- gliamo analizzare la distribuzione di una variabile aleatoria reale X, quasi certamente positiva, tale che fλ(X) sia una normale (o quantomeno una nor-

male troncata, che sar`a definita in seguito, dato che per λ _{6= 0 la normalit`a} non sarebbe possibile, essendo le immagini delle funzioni fλ se λ 6= 0 infe-

riormente o superiormente limitate).

Separiamo il caso λ = 0 dagli altri; in tal caso non si parla di distribuzioni di Box Cox ma di log-gaussiane.

Nel documento Analisi statistica di un modello gaussiano per lo studio dell'infezione da HIV (pagine 46-51)