• Non ci sono risultati.

2.3 Scelta del modello

N/A
N/A
Protected

Academic year: 2021

Condividi "2.3 Scelta del modello "

Copied!
13
0
0

Testo completo

(1)

CAPITOLO II

MODELLI AUTOREGRESSIVI

In questo studio si intende prendere in considerazione l’impiego di modelli autoregressivi per caratterizzare le curve tempo-attività ottenute da immagini PET. Attraverso la loro modellizzazione, si è effettuato contemporaneamente il filtraggio e la stima dei parametri cinetici del modello compartimentale utilizzato nello studio.

Per tale studio sono stati presi in considerazione i seguenti modelli:

Modelli autoregressivi Modelli a media mobile

Tale unione genera il cosiddetto “modello misto” che prende il nome di modello ARMA (autoregressivo e a media mobile), ed infine il modello ARMAX.

2.1 Modelli autoregressivi

Nel modello autoregressivo, il valore assunto al tempo i-esimo dalla variabile x è esprimibile come combinazione lineare dei valori assunti in un numero finito di intervalli precedenti e di un rumore additivo, indicato con ε. In un modello autoregressivo di ordine p la variabile è espressa come combinazione dei valori assunti in p intervalli precedenti.

Nel caso di modello MA il filtro è un filtro FIR a soli zeri; nel modello AR è un filtro IIR a soli poli; nel modello ARMA è un filtro genericamente con poli e zeri. È ovvio che il modello che provvisto di un maggior grado di libertà è il modello ARMA; d’altra parte esso, avendo bisogno di identificare separatamente sia una parte FIR, sia una parte IIR, pone maggiori problemi di identificazione.

Normalmente i modelli più usati sono MA e AR, con una prevalenza del modello AR. Tale modello, infatti, come si vedrà tra breve, comporta la soluzione di un sistema di equazioni lineari, al contrario del modello MA che richiede la soluzione di equazioni non lineari.

Si supponga che:

(2)

= 1

dove

= 1 +

è un polinomio con zeri di modulo necessariamente minore di 1.

Allora y(k) = H(z)e(k) soddisfa l’equazione ricorsiva

+ − 1 + ⋯ + − =

Y (k) è detto processo Auto-Regressivo di ordine n, AR(n).

Per il modello MA invece si proponga:

=

= 1 +

Allora y(k) = H(z)e(k) soddisfa l’equazione ricorsiva

= + − 1 + ⋯ + −

Y (k) è detto processo a Media Mobile di ordine m, MA(m).

Il modello ARMA è dato dalla combinazione di AR e MA, quindi si ha

=

ed y(k) = H(z)e(k) soddisfa l’equazione ricorsiva

+ − 1 + ⋯ + − = + − 1 + ⋯ + −

Y (k) è detto processo Autoregressivo a media mobile di ordine n,m, ARMA(n,m).

2.2 Modelli ARX ARMAX

(3)

Il nome ARMAX deriva dal fatto che y è spiegata da una parte autoregressiva (AR), da una parte (MA) che è una media mobile (MA), mentre la presenza della variabile esogena u è segnalata dalla lettera X nella sigla.

La rappresentazione generale di questi modelli è la seguente:

= − 1 + ⋯ + + − 1 + ⋯ + + + − 1 + ⋯ +

Il modello è fissato una volta individuato il vettore dei parametri:

= [ … ]

Quindi in forma matriciale il modello può essere rappresentato:

= # − 1 +

dove

= 1 − − $ $… −

# = − $ … − %

= 1 − − $ $… −

con A(z), B(z), C(z) come funzioni di trasferimento di sistemi dinamici lineari a tempo discreto.

Il modello può essere rappresentato:

(4)

Se si considera y(t+k) si può derivare un predittore a k passi, cioè una relazione ricorsiva, che sulla base dei dati precedenti fornisca la predizione dell’uscita dell’istante preso in considerazione più k.

Come si può evincere, se nel modello u(t) è nullo otteniamo l’equivalente del modello ARMA:

+ − 1 + … . + − = + − 1 + … . + −

Di conseguenza il modello ARMAX è più preciso dell’ARMA, infatti quest’ultimo non è affidabile come predittore a breve termine. Gli ARMAX si possono considerare come un raffinamento, in quanto riducono l'intensità di rumore (varianza) dell'ARMA introducendo una variabile esogena nel modello ed eliminando quindi la componente d'errore dovuta al fatto di aver ignorato il ruolo giocato da quella variabile.

Le considerazioni prese in esame valgono anche nel caso degli ARX, infatti rispetto agli AR, si ha l’aggiunta di una variabile esogena u, per cui si avrà:

+ − 1 + ⋯ + − = 1 − 1 + ⋯ + +

2.3 Scelta del modello

I parametri del modello si possono ottenere direttamente dai dati applicando la procedura dell’identificazione parametrica. L’identificazione dei sistemi è il campo della modellizzazione dei sistemi dinamici dai dati sperimentali.Un sistema dinamico può essere descritto come in figura:

(5)

Lo scopo è di ottenere il modello (equazione differenziale o alle differenze, in genere lineare) che descrive i dati nel modo migliore possibile, con opportuna scelta dei suoi parametri.

Il procedimento di identificazione dei modelli si articola in diverse fasi:

scelta della famiglia di modelli;

individuazione dell'ordine del modello (livello di complessità );

identificazione dei parametri (individuazione del modello migliore nell'ambito della famiglia prescelta di ordine prefissato);

validazione (critica ed eventuale convalida dei risultati).

All'interno dei modelli ARMAX, che costituiscono il caso più generale, si può scegliere una famiglia di modelli. Si può decidere ad esempio di utilizzare un ARX o un AR o un ARMA. La scelta della famiglia dei modelli si basa su un'analisi statistica preliminare dei dati disponibili (ad esempio, sulla base dell'andamento della funzione di autocorrelazione si può dedurre la presenza di termini AR o MA) e sulle informazioni a priori riguardo la natura del processo per decidere se introdurre uno o più ingressi, che influenzano in modo determinante la dinamica del processo.

Inoltre la scelta della famiglia di modelli deve tener conto dello scopo cui è destinato il modello e non può comunque prescindere dai programmi di calcolo e dai mezzi di elaborazione disponibili.

Il livello di complessità del modello viene identificato con il numero di parametri che lo definiscono. Nella scelta dell'ordine più opportuno bisogna pervenire ad un compromesso tra due esigenze antitetiche: accuratezza e parsimonia del modello. Infatti la varianza dell'errore di previsione diminuirà certamente al crescere dell'ordine; un modello complesso, però, comporta alcuni inconvenienti. Risulta poco maneggevole e di difficile interpretazione. Quando il numero di parametri in gioco è eccessivo le stime di alcuni di essi risultano spesso molto incerte. Inoltre c'è il pericolo che il modello sia troppo aderente ai dati utilizzati nell'identificazione (sovra-aderenza);

infatti essendo i dati corrotti da rumore, può darsi che il modello interpreti non solo la dinamica del

(6)

processo, ma anche il rumore. Da ciò si capisce come sia opportuno testare la bontà o meno del modello su dati diversi da quelli utilizzati nell'identificazione.

In una famiglia di modelli un particolare modello è migliore di un altro se meglio interpreta i dati rilevati sperimentalmente; per il confronto delle prestazioni si può prendere in considerazione l'errore di previsione ad un passo al tempo t:

' ( = ( − ) (

dove ) ( è la previsione a un passo fornita dal modello.

L'identificazione a minimizzazione dell'errore di previsione consiste nel minimizzare la cifra di merito:

* + = '$ ( ,

-

dove N è il numero di dati utilizzati.

Alcuni algoritmi di identificazione forniscono, oltre ai valori dei parametri stimati, anche una misura della loro incertezza che consente di discutere l'affidabilità dei valori ottenuti ed eventualmente decidere di provare con un modello più o meno parsimonioso.

Un altro modo che può essere utilizzato per l’individuazione del modello ottimo è il criterio di Akaike, con il quale viene definita una funzione da minimizzare:

. / = −2,2 2 3 + /

dove /, sta per l’ordine del modello, 3 i parametri stimati, 2 3 la funzione di verosomiglianza.

L'idea che sta alla base del criterio di informazione di Akaike è di minimizzare l'informazione aggiunta alla serie temporale dal modello AR, in quanto ogni informazione aggiunta è una falsa informazione. Derivando la funzione L rispetto a ϕ ed eguagliando a zero, si ottiene il vettore dei parametri stimato a massima verosimiglianza. Il termine 2 * L(Φ) tende a decrescere rapidamente con l'ordine del modello, mentre l'altro termine 2 * M a crescere; riportando in ordinate il valore di AIC(M) in funzione di M, si ottiene un punto di minimo che rappresenta proprio l'ordine ottimo del modello.

(7)

Per la validazione finale del modello, utilizzando una serie diversa da quella di taratura, si testa se l'errore di previsione '̂ ( è la realizzazione di un rumore bianco a valor atteso nullo. Infatti se l'errore di previsione risulta bianco significa che si è sfruttata al meglio tutta l'informazione disponibile; il modello ha espresso in sé tutta la dinamica propria del processo, non permanendo alcuna dinamica residua nell'errore.

2.4 TAC e modelli autoregressivi

Nel seguito verranno definite le funzioni spline esponenziali per descrivere il comportamento della PET dinamicae la loro relazione con i modelli autoregressivi.

L'interpolazione spline è un particolare metodo di interpolazione basato sulle funzioni spline. A differenza dell'interpolazione polinomiale, che utilizza un unico polinomio per approssimare la funzione su tutto l'intervallo di definizione, l'interpolazione spline è ottenuta suddividendo l'intervallo in più sotto-intervalli e scegliendo per ciascuno di essi un polinomio di grado d. Verrà poi imposto che due polinomi successi vi si uniscano osservando la continuità delle prime d-1 derivate. La funzione che si ottiene con un procedimento di questo genere si chiama funzione spline.

Nella figura successiva è rappresentata la relazione tra le spline esponenziali tipiche f(τ) della PET dinamica e la funzione di trasferimento H(s) e l’operatore differenziale 25,ϓ.

(8)

L’operatore è definito nel dominio di Laplace:

25,ϓ 7 = ∏- 7 − 9

: 7 − ϓ e l’operatore corrispondente in un sistema differenziale lineare:

25,ϓ 7 ; 7 = < 7

=-> ? + - =- > ? + . . + @> ? = =:A ? + : =: A ? + . . + @A ?

dove =-= B B?⁄ è l’ordine della derivata ennesima, α e ϓ corrispondono alle radici del polinomio 7-+ - 7- +. . + @ e 7:+ : 7: +. . + @ rispettivamente.

Dalla figura si evince che è necessario identificare l’operatore differenziale, presente nella parte sinistra.

Il modello cinetico preso in considerazione è un modello compartimentale che descrive la velocità del metabolismo del glucosio. Il sistema prende l’attività del plasma come input e produce l’output che corrisponde al segnale PET. Il sistema è descritto :

DE ( = D ( + # ( ( = D ( + = (

dove D ( è un vettore colonna con n variabili di stato, e DE ( è la sua derivata prima, A è una matrice di transizione quadrata, B è la matrice di input, ( è il vettore di input, ( è il vettore di osservazione.

Il segnale PET è composto dall’attività totale del tessuto F G ( e vascolare HI ( ; quindi scrivendo C e D come 1 − JK 1L e 0 JK rispettivamente, con JK la frazione volumetrica del sangue, si ottiene, usando la trasformata di Laplace:

NF G 7 = 7 OPQ 7 NRSG 7 = $ 7 OHI 7

con OPQ l’attività plasmatica.

Un’analisi simile può essere effettuata per l’attività plasmatica e del corpo intero, OPQ 7 =

TOHI 7 e OHI 7 = UO V 7 .

(9)

Quindi l’effetto totale può essere inteso come una cascata di sistemi che trasformano l’iniezione ( nel segnale PET, come rappresentato nella figura successiva. Possiamo interpretare N 7 =

FWF 7 X 7 , con FWF 7 = [ $ 7 + 7 T 7 ] 7 , e utilizzando l’operatore differenziale 25,ϓ 7 = FWF 7 .

Di conseguenza le curve ottenute possono essere descritte con i modelli autoregressivi. Il passo seguente sarà scegliere il modello che meglio filtra le curve rumorose.

2.5 Stima parametri cinetici con modello ARMAX

Come descritto in precedenza,, l’obiettivo di questo lavoro è la caratterizzazione delle curve tempo- attività utilizzando i modelli auto regressivi. Infatti oltre al filtraggio, con i parametri modello ARMAX, stimati dalle TAC - ottenute dalle immagini PET e usando il criterio di predizione dell’errore - si possono individuare le soluzioni del modello compartimentale e quindi individuare le costanti cinetiche.

In figura è rappresentato l’approccio utilizzato per ottenere le costanti cinetiche. Questo sistema di identificazione ci permette una fusione tra il modello e i dati.

(10)

Il modello compartimentale delle costanti cinetiche può essere rappresentato come un modello tempo continuo:

DE ( = D ( + # ( ( = D ( + (

dove x(t) è un vettore colonna che rappresenta la concentrazione del radiotracciante nel plasma o di un altro tessuto. Le componenti A, B e C dipendono dalla configurazione del modello compartimentale preso in considerazione. y(t) è la curva misurata attraverso le immagini PET, C è un vettore colonna mentre e(t) è il rumore.

Dal sistema tempo continuo si può ottenere il sistema a tempo discreto lineare, impiegando un tempo di campionamento T:

D + 1 = ;D + <

= D +

con

; = YL , < = YL − 1 #

Una volta ottenuto il sistema tempo discreto si procede ad analizzare la relazione con il modello ARMAX. Infatti le equazioni precedenti possono essere trasformate nella forma canonica di osservazione usando la matrice di trasformazione P e preservando la relazione ingresso-uscita.

D) + 1 = ;ZD) + <Z

= [D) +

(11)

\ ;\ = ;Z , \ < = <Z , D) = \ D

dove P è una matrice non singolare. Da qui si deduce che i parametri della forma canonica sono identici ad un processo ARMAX

= − 1 + ⋯ + + − 1 + ⋯ + + + − 1 + ⋯ +

Quindi per individuare le costanti del modello, A e B, possiamo utilizzare la stima di ;Z, <Z e [ appena definita.

[ = log`;Zab #Z = ;Z − . log ;Za <Z

Ottenuti i parametri del modello ARMAX, si va ad individuare i parametri cinetici del modello tempo continuo di partenza. Per effettuare ciò si deve convertire il modello ARMAX nella forma canonica di osservazione di ordine c = S = I = d come segue

D) + 1 = ;ZD) + <Z + eZ

= [D) + dove

;Z = f− 1 0

… … 1

g 0 0h <Z = f…

g

h eZ = f…

g

h [ = [1 … 0]

.

Fatto ciò, si torni al modello tempo continuo iniziale, utilizzando le formule inverse e ottenendo:

\ \ = [ \ # = #Z \ = [

con A, B e C che contengono gli elementi da stimare. Per la stima basta risolvere il sistema di equazione che si ottiene dalla forma matriciale appena presentata.

Si prenda in considerazione il modello compartimentale utilizzato nella simulazioni:

(12)

= i− $T U

TUj # = k 0 l = [1 1]

Utilizzando un modello ARMAX del secondo ordine, con S = I = d = 2, della forma:

+ − 1 + $ − 2 = − 1 + $ − 2 + + − 1 + $ − 2

Una volta stimati i parametri [ , $, , $, , $], si può ottenere il modello spazio-tempo in forma canonica di osservazione e quindi le matrici:

;Z = i− 1

$ 0j <Z = i

$j eZ = k $l per poi calcolare le matrici A,B e C del modello continuo:

[ = k7 77T 7$Ul #Z = k7m

7nl [ = [1 0]

Ottenendo il sistema di otto equazioni in otto incognite e quindi risolvibile:

$o − To + UoT− o 7 − o$7T = 0

$o$To$ + UoU− o 7$− o$7U = 0

To − UoT− oT7 − oU7T = 0

To$UoU− oT7$− oU7U = 0

− o 7m− o$7n = 0 oT7m+ oU7n = 0 o + oT− 1 = 0

o$+ oU = 0 dove

\ = ko o$ oT oUl

In conclusione con questo approccio, ottenute le curve tempo-attività dalle immagini PET, si possono stimare i parametri del modello ARMAX scelto, e risolvendo un semplice sistema di

(13)

equazioni lineari si possono stimare i parametri cinetici del modello compartimentale preso in considerazione.

Riferimenti

Documenti correlati

N.B.: Il sopralluogo dovrà essere effettuato dal legale rappresentante o direttore tecnico dell’impresa munito di valido documento

N.B.: Il sopralluogo dovrà essere effettuato dal legale rappresentante o direttore tecnico dell’impresa munito di valido documento

 secondo il MODELLO LINEARE una popolazione di individui, isolata, senza vincoli esterni (cibo illimitato, no predatori).. aumenta esponenzialmente secondo la formula x n = (1+a) n

Rappresentiamo graficamente quanto appena detto... Nel 1883 Joseph Bertrand costru`ı un altro modello, differente da quello di Cournot, in cui due imprese decidono, indipendentemente

Le seguenti sono occorrenze valide dell’associazione Sostiene esame di {(Mario Rossi, Neuroscienze), (Mario Rossi, Neuroscienze), (Franco Verdi, Neuroscienze), (Franco

Nell’esempio: Il sito di costruzione si inserisce in un contesto residenziale caratterizzato da costruzioni di piccola taglia circondate da orti e giardini intervallate a

Fissato A, esiste quindi un unico valore di Z 0 che corrisponde ad un isobaro stabile (vedi fig. La figura 3.3 a) mostra che, poichè due nuclei contigui sulla stessa

 La disputa intellettuale e politica per stabilire quale dei 2 modelli istituzionali sia più adatto a garantire i valori tipici della socialità europea, alla