Migliaia di litri

(1)

Strumenti di analisi preliminare

(2)

Dati cross section e serie storiche

Dati cross section (trasversali): tutte le osservazioni si riferiscono al medesimo periodo/istante di tempo

prezzo ($US), miglia per gallone, nazione di origine di 45 auto

Serie storiche: dati ordinati rispetto al tempo

produzione mensile di birra in Australia da gennaio 1990 a dicembre

1994

(3)

Dati cross-section: esempi di dati su 45 auto

Marca Nazione mpg Prezzo

Chevrolet Caprice USA 18 14525

Chevrolet Lumina USA 18 13995

Dodge Gran Caravan USA 18 15395

Ford Aerostar USA 18 12267

Ford Mustang USA 18 12164

Mazda MPV JAP 19 14944

Nissan Van JAP 19 14799

Chevrolet Camaro USA 19 11545

Acura Legend JAP 20 24760

Ford LTD Crown Victoria USA 20 17257

Mitsubishi Wagon JAP 20 14929

Nissan Axxess JAP 20 13949

Mitsubishi Sigma JAP 21 17879

Nissan Stanza JAP 21 11650

Buick Century USA 21 13150

Mazda 929 JAP 21 23300

Oldsmobile Cutkas Ciera USA 21 13150

Oldsmobile Cutlass Supreme USA 21 14495

Chrysler Le Baron Coupé USA 22 12495

Chrysler New Yorker USA 22 16342

Eagle Premier USA 22 15350

Ford Taurus USA 22 13195

Nissan Maxima JAP 22 17899

Buick Skylark USA 23 10565

Oldsmobile Calais USA 23 9995

Ford Thunderbird USA 23 14980

Toyota Cressida JAP 23 21498

Buick Le Sabre USA 23 16145

Nissan 240SX JAP 24 13249

Ford Tempo USA 24 9483

Subaru Loyale JAP 25 9599

Chrysler Le Baron USA 25 10945

Mitsubishi Galant JAP 25 10989

Plymouth Laser USA 26 10855

Chevrolet Beretta USA 26 10320

Dodge Daytona USA 27 9745

Honda Prelude JAP 27 13975

Subaru XT JAP 28 13071

Ford Probe USA 30 11470

MazdaProtege JAP 32 6599

Eagle Summit USA 33 8895

mpg:

miglia per

gallone

(4)

Serie storiche: vendite di birra in Australia Serie storiche: vendite di birra in Australia

Anno Mese Quantità Anno Mese Quantità 1991 Gennaio 164.000 1993 Gennaio 139.000

Febbraio 148.000 Febbraio 143.000 Marzo 152.000 Marzo 150.000 Aprile 144.000 Aprile 154.000 Maggio 155.000 Maggio 137.000 Giugno 125.000 Giugno 129.000 Luglio 153.000 Luglio 128.000 Agosto 146.000 Agosto 140.000 Settembre 138.000 Settembre 143.000 Ottobre 190.000 Ottobre 151.000 Novembre 192.000 Novembre 177.000 Dicembre 192.000 Dicembre 184.000 1992 Gennaio 147.000 1994 Gennaio 151.000 Febbraio 133.000 Febbraio 134.000 Marzo 163.000 Marzo 164.000 Aprile 150.000 Aprile 126.000 Maggio 129.000 Maggio 131.000 Giugno 131.000 Giugno 125.000 Luglio 145.000 Luglio 127.000 Agosto 137.000 Agosto 143.000 Settembre 138.000 Settembre 143.000 Ottobre 168.000 Ottobre 160.000 Novembre 176.000 Novembre 180.000 Dicembre 188.000 Dicembre 182.000

Migliaia di litri

(5)

Serie storiche: vendite di birra in Australia Serie storiche: vendite di birra in Australia

120.000 130.000 140.000 150.000 160.000 170.000 180.000 190.000 200.000

1991 1992 1993 1994

Migliaia di litri

Timeplot: serve per evidenziare andamenti sistematici rispetto al

tempo

(6)

Tipi di serie storica

Continua: il fenomeno è rilevato per intervalli infinitesimi di tempo

Discreta: il fenomeno è rilevato solo ad intervalli di tempo

Stock (di livelli): grandezza riferita ad un istante di tempo (es, popolazione residente al 31.12.2001) che cambia consistenza per una serie di flussi.

Flusso: grandezza riferita ad un intervallo di tempo (es.

numero di nati in un mese)

(7)

Serie storiche: grafici e tipi di pattern sistematico

Pattern orizzontale

Pattern stagionale

Pattern ciclico

Pattern tendenziale (trend)

(8)

Serie storiche: grafici e tipi di pattern Serie storiche: grafici e tipi di pattern

Pattern orizzontale. In questo caso la serie oscilla intorno ad un valore costante (media della serie). Tale serie è detta stazionaria in media.

0 10 20 30

0 5 10

Sample Number

Sample Mean

Mean=3.633

Media di campioni successivi di ovetti di cioccolato di peso medio 3.633 g.

(9)

Serie storiche: grafici e tipi di pattern

Pattern stagionale. Questo esiste quando la serie è influenzata da fattori stagionali (es. serie mensile, semestrale, trimestrale, ecc.). Prodotti come gelati, bibite analcoliche, consumo di elettricità sono soggette al fenomeno stagionale. Le serie influenzate dalla stagionalità sono dette anche serie periodiche poiché il ciclo stagionale si ripete in un periodo fisso.

0 2 0 0 4 0 0 6 0 0 8 0 0 1 0 0 0 1 2 0 0 1 4 0 0

1 4 7 10 13 16 19 22 25 28 31 34

Nr. bottiglie

Vendita mensile di bottiglie di acqua

(10)

Serie storiche: vendite di birra in Australia

1991 1992 1993 1994

2 7 12

120000 130000 140000 150000 160000 170000 180000 190000

Mese

Ml itr i

Grafico stagionale (seasonal plot): è adatto ad individuare la

presenza di stagionalità (vendite di birra in Australia)

(11)

Serie storiche: grafici e tipi di pattern

Pattern ciclico.

Questo tipo di andamento è presente quando la serie presenta aumenti e diminuzioni che non sono di periodo fisso e che di norma superano il periodo annuale.

Questa è la principale differenza fra le fluttuazioni cicliche e quelle stagionali.

Nelle serie economiche il pattern ciclico è determinato dalle

espansioni e contrazioni dell’economia dovuti a fenomeni

congiunturali.

(12)

Numeri indice della produzione industriale in Italia Dati annuali (1995=100)

20 30 40 50 60 70 80 90 100 110 120

gen-60 gen-63 gen-66 gen-69 gen-72 gen-75 gen-78 gen-81 gen-84 gen-87 gen-90 gen-93 gen-96 gen-99

(13)

Serie storiche: grafici e tipi di pattern

Trend o tendenza di fondo.

E’ caratterizzato da un andamento crescente o decrescente di lungo periodo.

La serie della popolazione residente in Italia (all’inizio dell’anno) è un esempio di andamento tendenziale o trend di tipo crescente.

40 42 44 46 48 50 52 54 56 58

gen-48 gen-50 gen-52 gen-54 gen-56 gen-58 gen-60 gen-62 gen-64 gen-66 gen-68 gen-70 gen-72 gen-74 gen-76 gen-78 gen-80

(14)

Sintesi numeriche

Alcune statistiche univariate adatte sia a dati trasversali sia a serie storiche

Indici di posizione

^Media

^Mediana

^Percentili

Indici di dispersione o variabilità

MAD: mean absolute deviation

MSD: mean squared deviation

^S

²

^{: varianza}

S : standard deviation

(15)

Sintesi numeriche: indici di variabilità

( )

1 n

y y

S

n

1 i

2 2 i

−

= ∑

=

n y y

MAD

n

1 i

∑

i

=

−

=

( )

2 n

1 i

2 i

1 S n

y y

S =

−

= ∑

=

( )

n y y

MSD

n

1 i

2

∑

i

=

−

=

Quale unità di misura hanno questi indici ?

(16)

Serie storiche: autocovarianza e autocorrelazione

Autocovarianza e autocorrelazione sono le corrispondenti della varianza e della correlazione, per una serie storica univariata

Servono per controllare la memoria della serie misurando quanto i

valori al tempo t dipendono linearmente da quelli al tempo t-k (k è

detto lag)

( )( )

( )

∑

= +

= −

−

=

_n

1 t

2 t

n

1 k t

k t t

k

y y

r

( )( )

n

y y

c

n

1 k t

k t t

k

∑

+

=

−

=

Autocovarianza di periodo k

Autocorrelazione di periodo k

(17)

2 7 12 17 -1.0

-0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0

Autocorrelation

1 2 3 4 5 6 7

8 9 10 11 12 13 14

15 16 17 18 0.47

0.08 -0.08 -0.18 -0.31 -0.48 -0.33

-0.14 -0.10 -0.03 0.34 0.58 0.35 0.06

-0.08 -0.14 -0.17 -0.32 3.21

0.45 -0.44 -1.04 -1.70 -2.49 -1.55

-0.62 -0.42 -0.13 1.49 2.41 1.29 0.21

-0.30 -0.50 -0.62 -1.14 10.99

11.31 11.63 13.44 18.59 31.35 37.72

38.86 39.42 39.48 46.90 68.74 76.81 77.05

77.55 78.97 81.24 89.37

Lag Corr T LBQ Lag Corr T LBQ Lag Corr T LBQ

Autocorrelation Function for Mlitri

Questo grafico è detto correlogramma

Serie storiche: funzione di autocorrelazione (r

_k versus

k)

(18)

Goodness of fit e goodness of forecast

Goodness of fit: come il modello riesce a riprodurre i dati storici (ovvero quelli noti ed usati per la stima del modello) Æ confronto fra stime e valori osservati

Goodness of forecast: come il modello riesce a riprodurre i dati futuri Æ confronto fra previsioni e valori futuri

Come si fa a misurare la goodness of forecast se si hanno n dati?

si può valutare solo quando si avranno i dati ai tempi t=n+1, n+2, ecc.

si può costruire il modello su t=1,…m dati, con m<n; prevedere poi le (n-m) osservazioni successive e verificare su queste l’accuratezza

previsiva (analisi esterna o hold-out sample) Æ ma questo è più che altro un esercizio e in pratica non viene fatto

si può valutare l’accuratezza previsiva mediante il confronto fra valori

osservati e le previsioni a un passo (one-step-forecast)

(19)

Anno Mese Mlitri Previsioni

Yt Ft

1991 1 164000

1991 2 148000 164000

1991 3 152000 148000

1991 4 144000 152000

1991 5 155000 144000

1991 6 125000 155000

1991 7 153000 125000

1991 8 146000 153000

1991 9 138000 146000

1991 10 190000 138000 1991 11 192000 190000 1991 12 192000 192000

1992 1 147000 192000

1992 2 133000 147000

1992 3 163000 133000

1992 4 150000 163000

1992 5 129000 150000

1992 6 131000 129000

1992 7 145000 131000

1992 8 137000 145000

1992 9 138000 137000

1992 10 168000 138000

Esempio di previsioni a un passo con un metodo semplice

F

_t

=Y

_t-1

(20)

Misure di goodness of forecast con one-step-forecast

Indichiamo con

y

_t

: valore osservato (tempo t)

F

_t

: valore previsto (al tempo t-1 per il tempo t)

Errore di previsione e

_t

=y

_t

- F

_t

Se abbiamo e

_t

=y

_t

- F

_t

per m periodi, possiamo

valutare l’accuratezza previsiva mediante vari indici - Mean error (ME)

- Mean absolute error (MAE) - Mean squared error (MSE)

- Mean absolute percentage error (MAPE)

Valori bassi indicano accuratezza

(21)

Misure di goodness of forecast

m e ME

m

1 t

∑

t

=

( )

m e MSE

m

1 t

2

∑

t

=

m e MAE

m

1 t

∑

t

=

m 100 y e MAPE

m

1

t t

∑

t

=

ME: può assumere sia valori positivi che negativi MAE, MSE: possono assumere valori non negativi ME, MAE: stessa unità di misura di y

MSE: unità di misura di y elevata al quadrato

MAPE: non dipende dall’unità di misura di y.

(22)

Anno Mese Mlitri Previsioni

Yt Ft

1991 1 164000

1991 2 148000 164000

1991 3 152000 148000

1991 4 144000 152000

1991 5 155000 144000

1991 6 125000 155000

1991 7 153000 125000

1991 8 146000 153000

1991 9 138000 146000

1991 10 190000 138000 1991 11 192000 190000 1991 12 192000 192000

1992 1 147000 192000

1992 2 133000 147000

1992 3 163000 133000

1992 4 150000 163000

1992 5 129000 150000

1992 6 131000 129000

1992 7 145000 131000

1992 8 137000 145000

1992 9 138000 137000

1992 10 168000 138000 1992 11 176000 168000

Goodness of forecast per il modello N1

ME= -1043 MAE= 15826

MSE=437652174

MAPE= 10.4%

(23)

Migliaia di litri

Strumenti di analisi preliminare

Dati cross section e serie storiche

Dati cross section (trasversali): tutte le osservazioni si riferiscono al medesimo periodo/istante di tempo

prezzo ($US), miglia per gallone, nazione di origine di 45 auto

Serie storiche: dati ordinati rispetto al tempo

produzione mensile di birra in Australia da gennaio 1990 a dicembre

1994

Dati cross-section: esempi di dati su 45 auto

mpg:

miglia per

gallone

Serie storiche: vendite di birra in Australia Serie storiche: vendite di birra in Australia

Serie storiche: vendite di birra in Australia Serie storiche: vendite di birra in Australia

120.000 130.000 140.000 150.000 160.000 170.000 180.000 190.000 200.000

1991 1992 1993 1994

Timeplot: serve per evidenziare andamenti sistematici rispetto al

tempo

Tipi di serie storica

Continua: il fenomeno è rilevato per intervalli infinitesimi di tempo

Discreta: il fenomeno è rilevato solo ad intervalli di tempo

Stock (di livelli): grandezza riferita ad un istante di tempo (es, popolazione residente al 31.12.2001) che cambia consistenza per una serie di flussi.

Flusso: grandezza riferita ad un intervallo di tempo (es.

numero di nati in un mese)

Serie storiche: grafici e tipi di pattern sistematico

 Pattern orizzontale

 Pattern stagionale

 Pattern ciclico

 Pattern tendenziale (trend)

Serie storiche: grafici e tipi di pattern Serie storiche: grafici e tipi di pattern

Serie storiche: grafici e tipi di pattern

Serie storiche: vendite di birra in Australia

Mese

Ml itr i

presenza di stagionalità (vendite di birra in Australia)

Serie storiche: grafici e tipi di pattern

Questo tipo di andamento è presente quando la serie presenta aumenti e diminuzioni che non sono di periodo fisso e che di norma superano il periodo annuale.

Questa è la principale differenza fra le fluttuazioni cicliche e quelle stagionali.

Nelle serie economiche il pattern ciclico è determinato dalle

espansioni e contrazioni dell’economia dovuti a fenomeni

congiunturali.

Serie storiche: grafici e tipi di pattern

Sintesi numeriche

Alcune statistiche univariate adatte sia a dati trasversali sia a serie storiche

 Media

 Mediana

 Percentili

 MAD: mean absolute deviation

 MSD: mean squared deviation

 S

: varianza

 S : standard deviation

Sintesi numeriche: indici di variabilità

( )

1 n

y y

S

−

−

= ∑

n y y

MAD

∑

−

=

( )

1 S n

y y

S =

−

−

= ∑

( )

n y y

MSD

∑

−

=

Quale unità di misura hanno questi indici ?

Serie storiche: autocovarianza e autocorrelazione

Pattern orizzontale

Pattern stagionale

Pattern ciclico

Pattern tendenziale (trend)

^Media

^Mediana

^Percentili

MAD: mean absolute deviation

MSD: mean squared deviation

^S

^{: varianza}

S : standard deviation