4.4 Previsione
4.4.1 Generalità sulla previsione
La previsione è un concetto assai importante in moltissime materie, anche differenti tra loro. Gli addetti di marketing possono gestire le 4P a seconda di come si preveda
l’evoluzione del fatturato della propria azienda. La previsione della curva di domanda può facilitare l’estrazione del surplus del consumatore da parte del venditore. Ogni giorno al telegiornale si sentono le stime di crescita dei Paesi dell’Eurozona oppure la previsione degli impatti che avranno le prossime manovre annunciate dai vari Governi. In questa sezione, lo scopo è introdurre il concetto di forecasting.
Si supponga di voler prevedere il valore che la serie storica yt assumerà al tempo
successivo, ossia yt+1. Si definisca, inoltre, con Itl’insieme informativo a disposizione al
tempo t. Per insieme informativo si può intendere la conoscenza di yt e di tutti i valori
antecedenti, come yt−1, yt−2e così via.
Definizione 4.5. Si denomina previsione a un passo avanti ft,1la previsione di yt+1realiz-
zata al tempo t.
Definizione 4.6. Si definisce errore di previsione la differenza tra il valore previsto e il valore effettivamente realizzato
t+1= yt+1− ft,1.
Si consideri il seguente modello di regressione:
yt = β0+ β1zt+ ut, (4.10) con β0e β1noti. Al tempo t + 1, il modello evolve come segue:
yt+1= β0+ β1zt+1+ ut+1. (4.11) Ipotizzando che zt+1 sia noto al tempo t e cheE(ut+1|It) =0, si può sviluppare la
seguente relazione:
E(yt+1|It) = β0+ β1zt+1, (4.12)
in cui il set informativo Itcontiene zt+1, yte tutti i valori cronologicamente anteriori. Il
secondo membro dell’equazione è ft,1, ossia la previsione di yt+1 formulata al tempo
t. Questa tipologia di previsione è denominata previsione condizionale in quanto è condizionata alla conoscenza di zt+1, (WOOLDRIDGE2015, p. 587).
Sfortunatamente, è assai raro disporre di tale informazione. Solamente nel caso in cui tra le variabili esplicative rientrassero componenti di trend e di stagionalità, sarebbe possi- bile disporre di previsioni riconducibili a tale casistica. L’equazione del trend lineare, ad esempio, è deterministica: una volta stimato il coefficiente angolare, è possibile proiettare nel futuro i valori.
Un altro problema intrinseco del Modello (4.10) con riferimento al forecasting si ha in merito all’uguaglianzaE(ut+1|It) =0. Come suggerito inWOOLDRIDGE(2015, p. 587),
ciò implica che utnon sia autocorrelato, una proprietà non sempre vera.
Si ipotizzi ora che il set informativo It non contenga zt+1. Questo implica che la
Relazione (4.12) debba essere trasformata in modo da inglobare una ulteriore previsione di zt+1, ora ignota:
E(yt+1|It) = β0+ β1E(zt+1|It). (4.13)
Questa tipologia di previsione si definisce non condizionale.8
A fini di previsione, potrebbe essere molto interessante analizzare anche i model- li aventi nella specificazione variabili ritardate (modelli c.d. dinamici). In effetti, ciò
8Senz’ombra di dubbio è una nomenclatura infelice, in quanto anch’essa è condizionale all’informazione
evita la previsione del secondo membro dell’Equazione (4.13) in quanto esso è, almeno limitatamente alla previsione a un passo, noto.
Si ipotizzi il seguente modello:
yt = α0+ α1yt−1+ α2xt−1+ ut, E(ut|It−1) =0 (4.14)
in cui It−1contiene i valori di yt−1, xt−1e i precedenti. Dato che la previsione a un passo
è data da ft,1 = α0+ α1yt+ α2xt, è sufficiente inserire i valori già noti di yt e xt per
completare la previsione.
In generale, indicato con n il numero di osservazioni nel campione, la previsione per yn+1è data da:
ˆfn,1 = ˆα0+ ˆα1yn+ ˆα2xn. (4.15)
L’errore di previsione, che sarà noto solo al tempo n + 1, è dato dalla differenza: ˆn+1= yn+1− ˆfn. (4.16)
Il valore ˆn+1appena menzionato fa riferimento alla c.d. stima puntuale. Nondimeno,
spesso, nell’ambito della previsione di un fenomeno, è più utile fornire una previsione c.d. intervallare, concetto molto simile all’intervallo di confidenza.
Si definiscano con se( ˆfn) gli errori standard della previsione e con σ2 la varianza
dell’errore. SecondoWOOLDRIDGE(2015, p. 588), si può affermare che se(ˆn+1) =
h
se( ˆfn)2+ σ2i1/2 (4.17) e che l’intervallo di previsione approssimativamente al 95% è pari a
ˆfn± 1,96 · se( ˆn+1). (4.18)
4.4.1.1 Previsione statica e dinamica
Nell’ambito della previsione, è importante distinguere due concetti: • previsione statica;
• previsione dinamica.
Tenendo in considerazione quanto visto con riferimento al periodo in e out-of-sample nella Sottosezione4.1.1, nella previsione statica le osservazioni del periodo out-of-sample sono disponibili e rientrano nel set informativo I, il quale viene aggiornato aggiungendo mano a mano le informazioni campionarie yt+1, yt+2 e così via. In altri termini, la
previsione dell’osservazione al tempo successivo si compie con l’ausilio della conoscenza dell’osservazione attuale, (PALOMBA2018, p. 18).
Quest’ultima è la differenza fondamentale con la previsione dinamica. Nell’approccio dinamico, il set informativo non si aggiorna con le osservazioni yt+1, yt+2e così via, bensì
vengono utilizzate al loro posto le previsioni ricavate, (PALOMBA2018, p. 18). Esempio 4.1. Si consideri il seguente modelloAR(1)stazionario:
xt = 0,8xt−1+ εt. (4.19)
Si ipotizzi che l’osservazione xt sia disponibile e sia pari a xt = 100. Si ipotizzi, inoltre,
che xt+1=85. Con riferimento alla previsione statica,
ft,1= 0,8xt= 0,8· 100 = 80
ft+1,2= 0,8xt+1= 0,8· 85 = 68.
Invece, per quanto concerne la previsione dinamica, l’informazione in merito al valore di xt+1non viene sfruttata
ft,1= 0,8xt= 0,8· 100 = 80,
ft,2 = 0,8· ft,1= 0,8· 80 = 64.
Dato che solo al tempo t l’insieme informativo Itè il medesimo tra previsione statica e
dinamica, la previsione al primo passo in avanti costituisce l’unico valore comune. Mano a mano che le previsioni si proiettano nel futuro, la differenza tra le due metodologie si enfatizza: concettualmente, si attendono previsioni peggiori dall’approccio dinamico.
4.4.1.2 Indici di bontà previsiva.
In questa breve sezione si presentano alcune misure di bontà previsiva.
Si supponga di avere a disposizione n + m osservazioni, rispettivamente afferenti al periodo in-sample e out-of-sample.
Root mean square error Il root mean square error (RMSE) è lo scarto quadratico medio campionario degli errori di previsione:
RMSE = v u u t 1 m m X i=1 ˆ2n+i. (4.20)
Nel caso in cui si dovessero confrontare più previsioni alternative, si opterebbe per quella aventeRMSEminore.
Mean absolute error Una seconda misura molto utilizzata è il mean absolute error (MAE), il quale, come intuibile dalla denominazione, è la media degli errori di previsione in valore assoluto: MAE= 1 m m X i=1 |ˆn+i|. (4.21)
Nuovamente, si preferisce la previsione avente ilMAEinferiore.
Mean absolute percentage error Il mean absolute percentage error (MAPE) è un terzo indice
utilizzato nella valutazione della previsione effettuata:
MAPE= 100% m m X i=1 ˆn+i yn+i. (4.22)
Dato che vi è yn+ial denominatore, l’indice è calcolabile esclusivamente in assenza di
valori nulli. Il giudizio è analogo alMAE.
Theil Inequality Coefficient Infine, si presenta il c.d. Theil Inequality Coefficient (ICT):
ICT= q 1 m Pm i=1 ˆ2n+i q 1 m Pm
i=1 ˆyn+i+
q 1 m Pm i=1yn+i , (4.23)
dove ˆyt è la generica previsione di yt.
Il coefficiente di disuguaglianza di Theil ha un campo di variazione tra zero e uno: più si avvicina a zero, più la previsione approssima bene i valori effettivi yt; più si avvicina
all’unità, più si evince una indipendenza lineare tra la curva effettiva e prevista, (SARTORE
2015). Nondimeno, per valori intermedi, sussistono delle criticità in merito alla capacità dell’indice nell’ordinare correttamente la previsioni sulla base della distanza dai valori osservati, (GALLOe PACINI2005, p. 247).