• Non ci sono risultati.

Applicazione di modelli di autoregressione

CASE STUDY

gura 4.8 Tabella dati per il grafico Waterfall

4.4 ANALISI DELL’ANDAMENTO DELLE VENDITE

4.4.3 Applicazione di modelli di autoregressione

Adesso consideriamo le previsioni fatte tramite una autoregressione, un modello particolare di regressione che mette in relazione una variabile temporale con i suoi valori passati. Se si vuole prevedere il futuro di una serie temporale un buon punto di partenza è l’immediato passato. Un modello del genere è detto autoregressione del primo ordine perche si basa sui propri ritardi e nello specifico su un solo ritardo usando la seguente formula:

- 98 -

° Yt è il valore di Y nel periodo t, per noi nello specifico è il fatturato;

° y1, y2,…,yT =s ono tutte le osservazioni in serie storica della variabile Y;

° ut è detto white noise; significa che la y dipende da una base w e da un coefficiente w!

applicato a yt-1.Ma questa formula non ricostruisce perfettamente la y perché rimane

una componente ut che non si può determinare in nessun modo ed è appunto il white

noise. Se fosse possibile prevederlo avremmo anche l’esatto valore della y predetta. ° bisogna infine tenere a mente che vanno considerate solo le osservazioni consecutive

ed equidistanti nel tempo.

Bisogna inoltre specificare la differenza fra un valore predetto o una previsione: un valore predetto si riferisce al valore di Y predetto (o stimato) usando una regressione per un’osservazione nel campione. Una previsione si riferisce al valore di Y previsto per un’osservazione al di fuori del campione utilizzato. I valori predetti sono in sample mentre le previsioni sono out of sample.63

Esistono auto regressioni di ordine superiore al primo: il numero dei ritardi usati come regressori è chiamato ordine dell’autoregressione. Il primo modello che applichiamo usa Y(t-1)

per prevedere Y(t) ma così ignora l’informazione potenzialmente utile proveniente da un

passato più remoto. Un modo per incorporare questa informazione è quello di includere ritardi addizionali nel modello di primo ordine.64 Un modello auto regressivo di ordine superiore al primo prende la notazione di modello di ordine p. Tale modello usa p ritardi della Y come regressori. Ovviamente il modello AR(1) è un caso particolare di quello di ordine p. La formula generica è:

v% = w + w!*%@!+ w$*%@$+ … + wM*%@M+ g%

Adesso la domanda che ne segue è: quanti ritardi è opportuno inserire nel modello? Nello specifico scegliere un ordine p di un’autoregressione richiede di bilanciare il beneficio dell’includere più ritardi con il costo della maggiore incertezza della stima. Da una parte se l’ordine di un’autoregressione stimata è troppo basso si ometteranno informazioni

63

J. H. STOCK, M. W. WATSON, Introduzione all'Econometria, Pearson, 2016, pp.405 64 J. H. STOCK, M. W. WATSON, Introduzione all'Econometria, Pearson, 2016, pp.404-408

potenzialmente important coefficienti del necessario

Noi abbiamo usato un’auto caso la formula che è stata

Il procedimento per tratta vendite al secondo mese, e vendite con il valore del precedente. Abbiamo incor invece di dipendere dal te continua ad apparire com modello stiamo usando solo

A questo punto abbiamo la rimane lo stesso di quello nostra variabile target che figura 4.24:

65 J. H. STOCK, M. W. WATSON

Figura 4.23: Pro

tanti, ma dall’altra se è troppo alto ci si ritrov rio.65

autoregressione di ordine 1, di ordine 4 e infine di o ata usata è:

4dmUc4% = w + w! V4dmUc4 %@!

attare i dati è stato semplicemente quello di far s se, e così via come da figura 4.23. In questo modo del mese, lo facciamo con il ritardo, ovvero con ncorporato la variabile tempo nel comportamento al tempo dipendono dalle vendite di per sé e la v come valore nascosto nel fatturato del mese pre

solo 23 mesi perché il primo è il punto di partenza.

o la tabella pronta da inserire sulla tela di Orange ello usato in precedenza per la Regressione Linea che sarà il ritardo (y1). Gli output che otteniamo si

SON, Introduzione all'Econometria, Pearson, 2016, pp.415

: Procedimento per ottenere i dati da usare in un modello auto

- 99 - itroverà a stimare più

di ordine 12. Nel primo

far scorrere i dati delle do invece di predire le con il valore del mese nto passato. Le vendite la variabile temporale precedente. In questo za. ge Canvas e lo schema Lineare. Impostiamo la o si possono vedere in 15 autoregressivo

- 100 -

Figura 4.24:Output dell'analisi dei dati tramite l’Autoregressione di ordine 1

Perciò per ottenere le vendite di un determinato mese si può usare la seguente formula:

4dmUc4%= 32662,7737154 + 110,3250988 *!

Dove y1 è il ritardo, ovvero il fatturato del mese precedente.

R2 è 0,155 perciò questo modello risulta essere peggiore rispetto a quello della regressione

lineare, perché riesce a spiegare il 15,5% della variazione delle vendite. Il restante 84,5% non può essere spiegato.

Concettualmente in questo modo prevediamo il valore del mese usando quello precedente ma, come già spiegato, si ignora in tal modo l’informazione potenzialmente utile proveniente da un passato più remoto. Un modo per incorporare questa informazione è quello di includere dei ritardi addizionali al modello AR(1), ovvero considerare la regressione di Tt su più valori

ritardatari. Se volessimo fare per esempio delle considerazioni sul trimestre allora bisognerebbe usare un’autoregressione di ordine 4 (abbreviato anche come AR(4)): significa che 4 termini sono collegati al valore corrente. Questo incorpora in sé il valore di 4 ritardi perciò significa che il ciclo è trimestrale.

La formula dell’autoregressione di ordine 4 è la seguente:

da inserire in Orange, usia target che sarà il quarto rita

Per ottenere le vendite di u

4dmUc4% = 27343,7081

+ 96 R2 è più alto: 0,374 perciò due perché riesce a spiegar

Figura 4.26: O

L’ultimo modello autoregre significa che ogni mese è

Figura 4.25: Procedimento pe modello au Il procedimento dei dati è dell’autoregressio riportato su 4 ri vedere dalla figura

In questo modo mese è auto re mesi precedenti.

Di nuovo abbiam usiamo sempre lo stesso schema di widget e impo

ritardo (y4). Gli output che otteniamo si possono ve

di un determinato mese si può usare la seguente for

7081388 − 0,2821282 *!− 0,1735067 *$+

96,2006531 *y

rciò questo modello risulta essere il migliore fin or egare il 37,4% della variazione delle vendite.

: Output dell'analisi dei dati tramite l’Autoregressione di ordi

egressivo che applichiamo alla nostra serie storica è e è peculiare e quindi che il ciclo è annuale. Il pr

to per ottenere i dati da usare in un autoregressivo

- 101 - nto per il trattamento è il medesimo essione di ordine 1, ma 4 ritardi, come si può figura 4.25.

odo il dato del quinto regresso sui quattro nti.

iamo la tabella pronta impostiamo la variabile o vedere in figura 4.26.

e formula:

+ 0,6120789 *x

n ora, rispetto agli altri

i ordine 4

a è quello di ordine 12: procedimento per la

- 102 -

preparazione dei dati è lo stesso di quello visto in precedenza semplicemente spostato fino al dodicesimo mese. Una volta preparati i dati li inseriamo nel widget File su Orange e impostiamo come target l’ultima variabile y12. Lo schema di collegamento dei widgets rimane

lo stesso e gli output che restituiscono sono visualizzabili in figura 4.27:

Figura 4.27: Output dell'analisi dei dati tramite l’Autoregressione di ordine 12

R2 è negativo: - 32,565. Questo significa che stiamo peggiorando l’analisi e che il modello è

totalmente sbagliato.