I modelli MA - Dagli ARMA ai modelli ARCH e GARCH

Capitolo 2 Dagli ARMA ai modelli ARCH e GARCH

2.2 I modelli MA

La classe dei modelli ARMA comprende sia i processi AR che i processi MA: applicando

il lag operator a 𝑌_𝑡 otteniamo un modello AR, se lo applichiamo al White Noise otteniamo un MA.

Un processo MA(q), dove q rappresenta l’ordine del Moving Average, possiamo definirlo come una sorta di media mobile degli 𝜀_𝑡:

𝑀𝐴 (𝑞): 𝑌_𝑡 = 𝜃 ( 𝐿 )𝜀_𝑡= 𝜀_𝑡+ 𝜃₁𝜀_𝑡−1𝜃₂𝜀_𝑡−2… 𝜃_𝑞𝜀_𝑡−𝑞

Essendo 𝜀_𝑡 ∼ 𝑁( 0, 𝜎2_{), possiamo notare come il processo sia a media 0, infatti:}

𝐸[ 𝑌_𝑡] = 𝐸 [ ∑ 𝜃_𝑖 𝑞 𝑖=0 𝜀_𝑡−𝑖 ] = ∑ 𝜃_𝑖 𝑞 𝑖=0 𝐸(𝜀_𝑡−𝑖) = 0

Inoltre, considerando che il momento primo è pari a 0, la varianza corrisponde al

45 𝛶(0) = 𝑉𝑎𝑟 ( 𝑌𝑡 ) = 𝐸 ( 𝑌𝑡2 ) = 𝐸 [ ( ∑ 𝜃𝑖 𝑞 𝑖=0 𝜀𝑡−𝑖 ) 2 ] = ∑ 𝜃_𝑖2 𝑞 𝑖=0 𝜀_𝑡−𝑖2 + ∑ ∑ 𝜃𝑖𝜃𝑗𝜀𝑡−𝑖𝜀𝑡−𝑗 𝑗≠𝑖 𝑞 𝑖=0

Dalla proprietà del White Noise, il valore atteso della seconda sommatoria è 0, per cui:

𝐸 ( 𝑌_𝑡2 ) = 𝐸 [∑ 𝜃_𝑖2 𝑞 𝑖=0 𝜀_𝑡−𝑖2 ] = ∑ 𝜃_𝑖2 𝑞 𝑖=0 𝐸( 𝜀_𝑡−𝑖2 ) = ∑ 𝜃_𝑖2 𝑞 𝑖=0 𝜎2 = 𝜎2 ∑ 𝜃_𝑖2 𝑞 𝑖=0

Per quanto riguarda l’autocovarianza, invece:

𝛶(𝑘) = 𝐸(𝑌_𝑡𝑌_𝑡−𝑘) = 𝐸 [ (∑ 𝜃_𝑖 𝑞 𝑖=0 𝜀_𝑡−𝑖) (∑ 𝜃_𝑗 𝑞 𝑗=0 𝜀_{𝑡−𝑗+𝑘}) ]

Dal momento che, per le proprietà del White Noise, 𝐸( 𝜀_𝑡−𝑖𝜀_{𝑡−𝑗+𝑘} ) = 𝜎2 per 𝑗 = 𝑖 + 𝑘 mentre è 0 negli altri casi, l’espressione dell’autocovarianza diventa:

𝛶(𝑘) = 𝐸(𝑌_𝑡𝑌_𝑡−𝑘) = 𝜎2_{∑ 𝜃} 𝑗 𝑞−𝑘 𝑗=0 𝜃_𝑗+𝑘 ∀k ≤ q = 0 ∀k > q

Per quanto riguarda l’autocorrelazione:

𝜌(𝑘) = ∑ 𝜃𝑗

𝑞−𝑘

𝑗=0 𝜃𝑗+𝑘

1 + ∑𝑞_𝑗=1𝜃_𝑗2 ∀k ≤ q = 0 ∀k > q

Nei processi MA(q) abbiamo delle formule chiuse, ovvero conoscendo i vari θ possiamo calcolare direttamente le autocorrelazioni, autocovarianze ecc…

Un fatto di notevole rilevanza è che si può rappresentare qualsiasi processo con q

correlazioni diverse da 0 con un processo MA(q) e questo sta a significare che tali processi

sono molto generali e possiamo rappresentare un processo molto ampio di processi

stazionari30.

Quello che c’è da prendere in considerazione è che qualsiasi processo stazionario q- correlato ha una rappresentazione MA(q), ma tale rappresentazione non è unica: in realtà

ve ne sono 2𝑞 possibili rappresentazioni. Tuttavia, è possibile identificare il concetto di invertibilità che ci consente di ottenere un solo modello MA(q) (c’è infatti da considerare che, sebbene un processo MA(q) sia un processo sempre stazionario, non sempre risulta

invertibile).

Per andare a verificare tale proprietà prendiamo come riferimento un MA(1).

Figura 2.2

Processo MA(1) con differenti θ. Fonte: elaborazione personale

30_{Il teorema di Wold afferma, infatti, che qualsiasi processo a media 0 e stazionario in covarianza può}

essere rappresentato attraverso una parte deterministica (e quindi prevedibile, 𝑘𝑗) e una stocastica (non prevedibile, ∑∞𝑗=0𝜃𝑗𝜀𝑡−𝑗 ):

𝑌𝑡= ∑ 𝜃𝑗𝜀𝑡−𝑗 ∞ 𝑗=0

Innanzitutto, c’è da notare dalla tabella riportata in figura 2.2 come, all’aumentare dei θ, la varianza aumenti.

In un processo MA (1) la funzione di autocorrelazione sarà data dalla seguente formula:

𝜌(1) =𝛶(1) 𝛶(0)=

𝜃 1 + 𝜃2

Figura 2.3:

Autocorrelazione di un MA(1). Fonte: elaborazione personale

Come accennato in precedenza, qualsiasi processo avente q correlazioni diverse da 0 può

essere rappresentato con 2𝑞 processi MA(q); quindi, nel caso preso in esame, ci saranno 21 processi che ci danno la stessa autocorrelazione.

Come è possibile notare dalla figura 2.3, ad esempio per 𝜌 = 0.4 vi sono due possibili θ

che ci danno la stessa autocorrelazione: 𝜃 = 0.5 e 𝜃 = 2.

Tra tutti i possibili MA bisogna scegliere quello che risulta invertibile; possiamo scrivere

il processo MA (1) utilizzando il lag operator:

Possiamo portare il lag polinomial a sinistra ottenendo un AR (∞):

𝑌_𝑡( 1 + 𝜃𝐿 )−1= 𝜀_𝑡 Dove:

( 1 + 𝜃𝐿 )−1_{= ( 1 − 𝜃𝐿 + 𝜃}2_𝐿2 _{− 𝜃}3_𝐿3_{… ) = ∑(−𝜃𝐿)}𝑖 ∞

𝑖=0

Quello che si può notare è che si avrà un polinomio di ordine infinito applicato a 𝑌_𝑡. Questo modello di ordine infinito dipende dai valori passati di 𝑌𝑡 ed è quindi un modello

autoregressivo e per essere convergente (non esplodere) | 𝜃 | < 1.

Infatti, prendendo sempre potenze più grandi, se 𝜃 fosse maggiore di 1 allora la serie non

convergerebbe. Visto che abbiamo preso in considerazione MA(1), in questo caso basta

escludere 𝜃 = 2.

La condizione di invertibilità è molto importante per il MA in quanto consente di ricavare

gli 𝜀_𝑡 che, a differenza di 𝑌_𝑡 , non sono osservati.

Prendendo come riferimento 𝜃 = 0.4, possiamo andare a costruire un MA(1),

rappresentandolo nella figura 2.4.

Figura 2.4

Come possiamo notare, l’autocorrelazione risulta nulla per ritardi superiori a 1; se avessimo preso in considerazione un MA(2), invece, avremmo avuto autocorrelazione

nulla per ritardi superiori a 2 e così via.

2.3 I modelli AR

Un’altra classe di modelli che è possibile costruire con il lag operator è quella dei modelli AR (Autoregressivi).

Questi processi rappresentano la variabile 𝑌_𝑡 come funzione lineare dei propri valori passati più il White Noise e quindi introducono una dipendenza temporale nella dinamica

della variabile: quello che succederà domani dipende dal quello che è successo oggi più

un certo errore.

Il modello AR somiglia molto a un modello di regressione in cui i regressori (variabili

esplicative) non sono altro che i valori passati della variabile dipendente:

𝐴𝑅(𝑝) → 𝑌_𝑡 = 𝜙₁𝑌_𝑡−1+ 𝜙₂𝑌_𝑡−2+ ⋯ 𝜙_𝑝𝑌_𝑡−𝑝+ 𝜀_𝑡

A differenza dei processi MA, nei processi AR quello che bisogna verificare è la

stazionarietà.

Prendendo in esame un modello AR(1), possiamo fare esattamente come abbiamo fatto

nel caso del MA invertendo il lag polinomial e trasformando l’AR(1) in un MA ( ∞ ):

𝐴𝑅(1) → (1 − 𝜙𝐿)𝑌_𝑡 = 𝜀_𝑡 𝑀𝐴(∞) → 𝑌_𝑡 = (1 − 𝜙𝐿)−1𝜀_𝑡 = ∑(𝜙𝐿)𝑖 ∞ 𝑖=0 𝜀_𝑡= ∑ 𝜙𝑖 ∞ 𝑖=0 𝜀_𝑡−1

Conviene molto ricorrere a questa rappresentazione di un AR(1) come MA(∞) in quanto

si hanno formule chiuse per i calcoli di media, varianza, covarianza e autocorrelazione:

in questo modo, infatti, vediamo che è un processo a media 0 con autocovarianza pari a:

𝛶(𝑘) = 𝐸[(𝑌_𝑡− 𝐸(𝑌_𝑡)][𝑌𝑡−𝑘− 𝐸(𝑌𝑡−𝑘)] = 𝐸(𝑌𝑡𝑌𝑡−𝑘) = 𝜙𝑘

𝜎2 1 − 𝜙2

La varianza, invece, risulta pari a:

𝛶(0) = 𝐸[(𝑌𝑡− 𝐸(𝑌𝑡)][𝑌𝑡− 𝐸(𝑌𝑡)] = 𝐸(𝑌𝑡𝑌𝑡) =

𝜎2 1 − 𝜙2

La funzione di autocorrelazione:

𝜌(𝑘) = 𝜙|𝑘|_∀k

Quindi l’autocorrelazione di un AR(1) al lag 1 sarà 𝜙1_{, al lag 2 sarà 𝜙}2_{; tutto ciò sta a}

significare che i processi AR hanno una memoria esponenziale.

La stazionarietà del modello AR(1) è verificata per |𝜙| < 1; nel caso di |𝜙| = 1, invece,

si ha la presenza di una radice unitaria che lo rende non stazionario.

In generale, in un processo AR(p), la presenza di una radice unitaria può essere verificata

controllando se la somma dei coefficienti ϕ è uguale a 1; se la somma è superiore a 1,

invece, il polinomio non è invertibile.

Il fatto che il processo sia invertibile è importante per diversi motivi: per i modelli MA, l’invertibilità del lag polinomial è importante sia per la stima che per la previsione. Per i modelli AR, invece, il polinomio risulta invertibile solo se il processo è stazionario.

Per essere stazionario un processo deve avere, come già accennato, varianze e

autocovarianze finite. I processi MA sono sempre stazionari, in quanto non sono altro che

una somma ponderata di processi White Noise stazionari.

Dai grafici successivi possiamo notare un esempio di AR(1) stazionario e uno non

stazionario.

In particolar modo, dalla funzione di autocorrelazione della figura 2.5 si può notare come,

nei processi autoregressivi, l’autocorrelazione sia di minore utilità per individuare l’ordine del processo.

Quello che ci è più utile in questa tipologia di modelli, al fine di individuarne l’ordine, è la partial correlation che ci dice la correlazione diretta tra 𝑌_𝑡 e 𝑌_𝑡−𝑘 e, quindi, senza passare per i valori intermedi. In sintesi, l’autocorrelazione dà informazioni sulla

correlazione totale, quella parziale ci dà solo quella diretta non tenendo conto degli effetti

intermedi.

Figura 2.5

AR(1) con ϕ=0.7. Fonte: elaborazione personale.

La figura 2.6, invece, prende come riferimento 𝜙 = 1; si può facilmente notare dal grafico

come il processo non sia stazionario. Dalla funzione di autocorrelazione possiamo infatti

osservare come il processo abbia una memoria pressoché infinita: è un random walk31_.

31_{Il Random Walk è un processo non stazionario in cui la varianza non condizionale di 𝑌}

𝑡 è infinita. Il suo valore atteso non è altro che la sua posizione iniziale e, quindi, la migliore previsione che possiamo fare del prezzo di un titolo all’istante successivo non è altro che il prezzo precedente. Secondo tale teoria i prezzi non seguono nessun trend e i movimenti dei prezzi passati non possono essere usati per effettuare previsioni future. Sono stati effettuati numerosi studi e ricerche tra cui quelle di William Sharpe e Eugene Fama che evidenziano come la storia dei prezzi di un titolo non costituiscano un buon indicatore per i suoi prezzi futuri (il movimento dei prezzi sarebbe, quindi, imprevedibile).

Figura 2.6

Modello AR con ϕ=1. Fonte: elaborazione personale.

2.4 ARMA

Dalla partial autocorrelation e dalla autocorrelation siamo in grado in linea generale di farci un’idea del modello da utilizzare: un AR(p) o un MA(q).

Tuttavia, può capitare che sia utile combinare il modello Autoregressivo con il modello

Moving Average per avere più flessibilità ottenendo un modello ARMA(p,q).

𝜙(𝐿)𝑌_𝑡= 𝜃(𝐿)𝜀_𝑡

Ad esempio, se i dati sono molto persistenti e calcolando la partial autocorrelation

notiamo che ha 15 lag diversi da 0, dovremmo utilizzare un AR(15) e stimare 15

parametri, ma ognuno di questi avrà un errore di stima.

Una cosa più semplice è quindi utilizzare solo due parametri 𝜃 e 𝜙 attraverso il modello

Essendo una combinazione tra AR e MA, il modello ARMA avrà due decadimenti esponenziali (figura 2.7) uno per l’autocorrelation e uno per la partial autocorrelation in quanto può essere scritto sia come un AR(∞) che un MA(∞).

Nella 2.7 abbiamo il caso di un modello molto semplice come l’ARMA(1,1), che nonostante la semplicità, risulta molto efficace poiché, avendo anche meno parametri da

stimare, ha anche meno errori di stima da portare avanti.

Figura 2.7

Modello ARMA(1,1) con ϕ = 0.7 e θ = 0.6

Infatti, utilizzando il lag polynomial possiamo scrivere l’ARMA(1,1) come:

(1 − 𝜙𝐿)𝑌𝑡 = (1 + 𝜃𝐿)𝜀𝑡

Che si può riscrivere come un AR(∞), una volta verificate le condizioni di stazionarietà: (1 + 𝜃𝐿)−1_{(1 − 𝜙𝐿)𝑌}

𝑡= 𝜀𝑡

(1 + 𝜙𝐿)−1(1 − 𝜃𝐿)𝜀𝑡= 𝑌𝑡

2.5 ARIMA e ARFIMA

Nel paragrafo 2.2 si è fatto riferimento alle condizioni di invertibilità del MA(1),

constatando che il polinomio di ritardo del primo ordine (1 − 𝜃𝐿) era invertibile per |𝜃| <

1. C’è inoltre da considerare che, le condizioni che garantiscono l’invertibilità di un

MA(1), sono le stesse che garantiscono la stazionarietà di un AR(1).

Considerando un polinomio di secondo ordine 1 − 𝜃1𝐿 − 𝜃2𝐿2, in generale esistono due

valori 𝛼1, 𝛼2 per cui possiamo riscriverlo come:

1 − 𝜃₁𝐿 − 𝜃₂𝐿2 _{= (1 − 𝛼}

1𝐿)(1 − 𝛼2𝐿)

Ciò che rende invertibile il polinomio di secondo ordine, sono |𝛼₁| < 1 e |𝛼2| < 1 ovvero

le condizioni che rendono i polinomi di primo ordine (1 − 𝛼₁𝐿) e (1 − 𝛼₂𝐿) invertibili. Possiamo inoltre verificare le condizioni di invertibilità attraverso quella che viene definita l’equazione caratteristica:

(1 − 𝛼1𝑧)(1 − 𝛼2𝑧) = 0

Tale equazione ammette due soluzioni 𝑧1 e 𝑧2 che sono chiamate radici caratteristiche.

I requisiti |𝛼₁| < 1, |𝛼₂| < 1 corrispondono a |𝑧₁| > 1, |𝑧₂| > 1. Se anche soltanto una delle radici caratteristiche |𝑧_𝑖| è ≤ 1, il polinomio non è invertibile. Se una delle soluzioni verifica l’uguaglianza, si è in presenza di una radice unitaria.

Tuttavia, si può verificare la presenza o meno di una radice unitaria facendo riferimento

alla somma dei coefficienti del polinomio (𝜃): se ∑𝑝_𝑗=1𝜃_𝑗 = 1, allora siamo in presenza di una radice unitaria.

Abbiamo visto nel caso dell’AR(1) che la presenza di una radice unitaria rende il modello non stazionario (fig. 2.6).

Infatti, per essere stazionario un processo deve avere varianze e autocovarianze finite e

indipendenti nel tempo, mentre nel caso del random walk la varianza unconditional è

infinita.

Nei casi in cui vi è la presenza di una radice unitaria, e quindi non solo nel modello AR

ma in qualsiasi altro processo facente parte degli ARMA (tranne ovviamente il MA che

è stazionario per definizione essendo una media ponderata di processi White Noise), è possibile rendere un processo stazionario con l’operatore differenza prima (𝑌_𝑡− 𝑌_𝑡−1). Se, una volta applicato tale operatore, la serie risulta stazionaria, il modello viene

chiamato ARIMA (Autoregressive Integrated Moving Average) con parametri (p,1,q)

dove 1 sta a significare integrato di ordine 1. Se un processo è integrato di ordine 1, allora

vuol dire che deve essere differenziato una volta perché risulti stazionario.

La differenza tra una serie stazionaria I(0) e una serie stazionaria in differenza prima I(1),

è che la serie I(0) avrà una tendenza a convergere verso la media (il processo della mean

reversion che si era accennato nell’introduzione di questo capitolo), mentre la serie I(1) avrà ampie oscillazioni. Una serie I(0), infatti, ha una varianza finita e una memoria

limitata degli shock passati, mentre la serie I(1) ha una memoria infinita.

Ovviamente tale fatto, come è già stato detto, può essere verificato dalla funzione di

autocorrelazione poiché, nel caso della serie I(0) l’autocorrelazione diminuisce molto

rapidamente al crescere del ritardo mentre nella serie I(1) avrà un decadimento molto

lento.

In generale, un processo ARIMA(p,d,q) sta a significare che il processo è integrato di

ordine d. Se 0 < d < 1 allora l’ordine di differenziazione è un numero frazionato e si è a

metà tra una serie stazionaria e una non del tutto stazionaria e prende il nome di

2.6 Procedura Box-Jenkins

In linea generale non esistono ragioni economiche per privilegiare un modello rispetto ad

un altro, ma spesso sono i dati stessi che determinano il modello più appropriato.

Tuttavia, non risulta molto semplice scegliere un modello prendendo in considerazione

soltanto la funzione di autocorrelazione e la correlazione parziale.

Quello che si utilizza solitamente è la procedura di Box e Jenkins che consente, a partire dall’osservazione dei dati, di trovare il modello ARMA più appropriato.

La procedura si articola in tre step step:

- Identification: si controlla che i dati siano stazionari e, se non lo sono, si rendono

stazionari con le differenze prime. Fatto ciò, si calcolano le funzioni di

autocorrelazione e di correlazioni parziale per avere un’idea dell’ordine del

modello.

- Estimation: si stimano i parametri con il Maximum Likelihood o con il metodo

OLS (Ordinary Least Square)32.

- Diagnostic Checking: si cerca di capire se il modello è appropriato o meno ai dati

attraverso delle misure di fit di bontà della stima. Queste misure dipendono dalla

varianza dei residui del modello rispetto ai dati che abbiamo a disposizione;

inoltre si aggiunge una penalizzazione per il numero di parametri che si usa.

Solitamente i criteri di selezione usati sono il Criterio di Informazione di Akaike

(AIC) e il Criterio di Informazione Bayesiano (BIC).

32_{OLS (o metodo dei minimi quadrati) è una tecnica di ottimizzazione che permette di scegliere i}

parametri in modo da minimizzare la somma dei residui al quadrato. Tale strategia è molto conveniente per i modelli AR mentre risulta più complessa per i modelli MA e ARMA dal momento che gli ε non sono osservati direttamente. Infatti, in questo caso dovremmo ricostruire gli ε (prima verificando l’invertibilità del MA) in funzione delle variabili osservate ottenendo una funzione non lineare del parametro. Quindi è bene ricorrere a un altro approccio per la stima dei parametri ovvero il Maximum Likelihood (o massima verosimiglianza) che sarà spiegato meglio nel paragrafo 2.11 dal momento che sarà utilizzato per la stima dei parametri dei modelli GARCH.

𝐴𝐼𝐶 = −2(𝑙𝑜𝑔𝐿) + 2(𝑁𝑢𝑚𝑒𝑟𝑜𝑃𝑎𝑟𝑎𝑚𝑒𝑡𝑟𝑖)

𝐵𝐼𝐶 = −2(𝑙𝑜𝑔𝐿) + 𝑁𝑢𝑚𝑒𝑟𝑜𝑃𝑎𝑟𝑎𝑚𝑒𝑡𝑟𝑖 ∗ log (𝑇)

Dove logL corrisponde alla logLikelihood e T è il numero di osservazioni.

Per finire si controllano i residui del modello che si è stimato e, se il modello è buono, ci

si aspetta che i residui siano White Noise.

Se i tre step sono superati, allora si può utilizzare il modello anche per effettuare una

possibile previsione, altrimenti si ripetono le varie fasi finché non si trova un modello

appropriato.

2.7 Previsione ottimale

Una volta che si è stimato il modello, possiamo utilizzarlo per effettuare una previsione.

Per individuare il previsore ottimale, ovvero il migliore stimatore che ci consente di avere

una miglior stima sul futuro, bisogna stabilire un criterio di ottimalità da utilizzare (Loss

Function).

In genere, il criterio che si usa è il Mean Squared Error (MSE):

𝑀𝑆𝐸(𝑌̂𝑡) = 𝐸(𝑌𝑡− 𝑌̂𝑡)2

Quello che si fa è confrontare il nostro previsore 𝑌̂_𝑡 con la realizzazione che si è poi verificata; questa differenza tra la realizzazione e previsione, elevata al quadrato, ci dà

una misura di quanto sbagliamo in media.

Quando si usa tale criterio come Loss Function, il valore atteso condizionato è la funzione

che minimizza il MSE. Per dimostrare la validità di tale affermazione, dobbiamo andare

a ricercare la migliore funzione dei valori passati che minimizza il MSE. Per fare ciò, all’interno del quadrato, sommiamo e sottraiamo il valore atteso condizionato:

𝐸(𝑌𝑡+𝑘− 𝑓(𝑥))2 = 𝐸 (𝑌𝑡+𝑘− 𝑌̃𝑡+𝑘|𝑡+ 𝑌̃𝑡+𝑘|𝑡− 𝑓(𝑥)) 2

= 𝐸(𝑌_𝑡+𝑘− 𝑌̃_{𝑡+𝑘|𝑡})2 + 2𝐸 [(𝑌_𝑡+𝑘− 𝑌̃_{𝑡+𝑘|𝑡}) (𝑌̃_{𝑡+𝑘|𝑡}− 𝑓(𝑌_𝑡))] + 𝐸 (𝑌̃_{𝑡+𝑘|𝑡}− 𝑓(𝑌_𝑡))2 Il doppio prodotto è 0, poiché, per la legge delle aspettative iterate, il valore atteso del

valore atteso condizionato non è altro che il valore atteso non condizionato (e quindi

risulterebbe (𝑌_𝑡+𝑘− 𝑌_𝑡+𝑘) (𝑌̃𝑡+𝑘|𝑡− 𝑓(𝑌𝑡)) = 0 ). Quindi: 𝐸(𝑌_𝑡+𝑘− 𝑓(𝑌_𝑡))2 _{= 𝐸(𝑌} 𝑡+𝑘− 𝑌̃𝑡+𝑘|𝑡) 2 + 𝐸 (𝑌̃_{𝑡+𝑘|𝑡}− 𝑓(𝑌_𝑡))2 Essendo una somma di due quantità positive, l’espressione risulta minima se:

𝑓(𝑌_𝑡) = 𝑌̃𝑡+𝑘|𝑡

Per fare un esempio, prendiamo come riferimento un modello AR(1):

𝑌_𝑡= 𝜙𝑌_𝑡−1+ 𝜀_𝑡 Al tempo t+1 avremo:

𝑌_𝑡+1 = 𝜙𝑌_𝑡+ 𝜀_𝑡+1

Considerando che il valore atteso di 𝜀_𝑡+1 è 0, il valore atteso condizionato di 𝑌_𝑡+1 sarà: 𝐸_𝑡(𝑌𝑡+1) = 𝜙𝑌𝑡

Se vogliamo calcolare il valore atteso condizionato al tempo 2, dobbiamo riscriverlo in

funzione delle osservazioni passate:

𝑌_𝑡+2= 𝜙𝑌_𝑡+1+ 𝜀_𝑡+2 = 𝜙(𝜙𝑌𝑡+ 𝜀𝑡+1) + 𝜀𝑡+2

= 𝜙2𝑌_𝑡+ 𝜙𝜀_𝑡+1+ 𝜀_𝑡+2 𝐸𝑡(𝑌𝑡+2) = 𝜙2𝑌𝑡

Proseguendo in avanti fino al tempo 𝑡 + 𝑘:

Quindi, mentre il valore atteso non condizionato è 0 e può essere visto semplicemente

ricorrendo a un MA(∞), il valore atteso condizionato dipende da t: conoscere il punto di

partenza ci consente di effettuare una previsione migliore.

Tuttavia, poiché sappiamo che |ϕ| < 1, più ci si sposta in avanti nel tempo e più la

previsione si avvicina alla media non condizionata: per una previsione nel breve periodo

è molto utile sapere il punto di partenza, ma se ci si sposta nel lungo periodo, sapere dove

siamo oggi ha poca utilità.

Per quanto riguarda la varianza condizionata, invece:

𝑉𝑎𝑟𝑡(𝑌𝑡+1) = 𝑉𝑎𝑟𝑡(𝜙𝑌𝑡+ 𝜀𝑡+1) = 𝜎2

𝑉𝑎𝑟_𝑡(𝑌𝑡+2) = 𝑉𝑎𝑟𝑡(𝜙2𝑌𝑡+ 𝜙𝜀𝑡+1+ 𝜀𝑡+2 ) = 𝜎2(1 + 𝜙2)

…

𝑉𝑎𝑟𝑡(𝑌𝑡+𝑘) = 𝑉𝑎𝑟𝑡(𝜙𝑘𝑌𝑡+ 𝜙𝑘−1𝜀𝑡+1… + 𝜀𝑡+𝑘 ) = 𝜎2(1 + 𝜙2+ 𝜙4… + 𝜙2(𝑘−1))

Come possiamo notare dalle formule riportate della varianza condizionata, il processo

AR e in generale i processi ARMA, non sono in grado di descrivere la volatilità dei

mercati in quanto, la varianza condizionata degli ARMA, non dipende da t ma solo da

quanto ci spostiamo in avanti per la previsione; tale risultato è facilmente intuibile visto

che la varianza in realtà dipende solo dal White Noise che è caratterizzato da

omoschedasticità (la varianza del White Noise è infatti 𝜎2_{ovvero una costante).}

In particolare, la varianza condizionata non dipende mai dal punto di partenza ma soltanto

da quanto ci portiamo avanti nella previsione.

Le serie storiche, invece, sono caratterizzate da quella caratteristica già evidenziata nel

primo capitolo ovvero il volatility clustering secondo cui shock elevati tendono ad essere

seguiti da shock elevati mentre shock contenuti sono seguiti sa shock contenuti.

Per questo motivo si sono sviluppati altri modelli per cercare di introdurre dinamica in

Nel documento Volatilità e modelli GARCH: applicazioni su MATLAB (pagine 44-60)