Strumenti di analisi preliminare
Dati cross section e serie storiche
Dati cross section (trasversali): tutte le osservazioni si riferiscono al medesimo periodo/istante di tempo
prezzo ($US), miglia per gallone, nazione di origine di 45 auto
Serie storiche: dati ordinati rispetto al tempo
produzione mensile di birra in Australia da gennaio 1990 a dicembre
1994
Dati cross-section: esempi di dati su 45 auto
Marca Nazione mpg Prezzo
Chevrolet Caprice USA 18 14525
Chevrolet Lumina USA 18 13995
Dodge Gran Caravan USA 18 15395
Ford Aerostar USA 18 12267
Ford Mustang USA 18 12164
Mazda MPV JAP 19 14944
Nissan Van JAP 19 14799
Chevrolet Camaro USA 19 11545
Acura Legend JAP 20 24760
Ford LTD Crown Victoria USA 20 17257
Mitsubishi Wagon JAP 20 14929
Nissan Axxess JAP 20 13949
Mitsubishi Sigma JAP 21 17879
Nissan Stanza JAP 21 11650
Buick Century USA 21 13150
Mazda 929 JAP 21 23300
Oldsmobile Cutkas Ciera USA 21 13150
Oldsmobile Cutlass Supreme USA 21 14495
Chrysler Le Baron Coupé USA 22 12495
Chrysler New Yorker USA 22 16342
Eagle Premier USA 22 15350
Ford Taurus USA 22 13195
Nissan Maxima JAP 22 17899
Buick Skylark USA 23 10565
Oldsmobile Calais USA 23 9995
Ford Thunderbird USA 23 14980
Toyota Cressida JAP 23 21498
Buick Le Sabre USA 23 16145
Nissan 240SX JAP 24 13249
Ford Tempo USA 24 9483
Subaru Loyale JAP 25 9599
Chrysler Le Baron USA 25 10945
Mitsubishi Galant JAP 25 10989
Plymouth Laser USA 26 10855
Chevrolet Beretta USA 26 10320
Dodge Daytona USA 27 9745
Honda Prelude JAP 27 13975
Subaru XT JAP 28 13071
Ford Probe USA 30 11470
MazdaProtege JAP 32 6599
Eagle Summit USA 33 8895
mpg:
miglia per
gallone
Serie storiche: vendite di birra in Australia Serie storiche: vendite di birra in Australia
Anno Mese Quantità Anno Mese Quantità 1991 Gennaio 164.000 1993 Gennaio 139.000
Febbraio 148.000 Febbraio 143.000 Marzo 152.000 Marzo 150.000 Aprile 144.000 Aprile 154.000 Maggio 155.000 Maggio 137.000 Giugno 125.000 Giugno 129.000 Luglio 153.000 Luglio 128.000 Agosto 146.000 Agosto 140.000 Settembre 138.000 Settembre 143.000 Ottobre 190.000 Ottobre 151.000 Novembre 192.000 Novembre 177.000 Dicembre 192.000 Dicembre 184.000 1992 Gennaio 147.000 1994 Gennaio 151.000 Febbraio 133.000 Febbraio 134.000 Marzo 163.000 Marzo 164.000 Aprile 150.000 Aprile 126.000 Maggio 129.000 Maggio 131.000 Giugno 131.000 Giugno 125.000 Luglio 145.000 Luglio 127.000 Agosto 137.000 Agosto 143.000 Settembre 138.000 Settembre 143.000 Ottobre 168.000 Ottobre 160.000 Novembre 176.000 Novembre 180.000 Dicembre 188.000 Dicembre 182.000
Migliaia di litri
Serie storiche: vendite di birra in Australia Serie storiche: vendite di birra in Australia
120.000 130.000 140.000 150.000 160.000 170.000 180.000 190.000 200.000
1991 1992 1993 1994
Migliaia di litri
Timeplot: serve per evidenziare andamenti sistematici rispetto al
tempo
Tipi di serie storica
Continua: il fenomeno è rilevato per intervalli infinitesimi di tempo
Discreta: il fenomeno è rilevato solo ad intervalli di tempo
Stock (di livelli): grandezza riferita ad un istante di tempo (es, popolazione residente al 31.12.2001) che cambia consistenza per una serie di flussi.
Flusso: grandezza riferita ad un intervallo di tempo (es.
numero di nati in un mese)
Serie storiche: grafici e tipi di pattern sistematico
Pattern orizzontale
Pattern stagionale
Pattern ciclico
Pattern tendenziale (trend)
Serie storiche: grafici e tipi di pattern Serie storiche: grafici e tipi di pattern
Pattern orizzontale. In questo caso la serie oscilla intorno ad un valore costante (media della serie). Tale serie è detta stazionaria in media.
0 10 20 30
0 5 10
Sample Number
Sample Mean
Mean=3.633
Media di campioni successivi di ovetti di cioccolato di peso medio 3.633 g.
Serie storiche: grafici e tipi di pattern
Pattern stagionale. Questo esiste quando la serie è influenzata da fattori stagionali (es. serie mensile, semestrale, trimestrale, ecc.). Prodotti come gelati, bibite analcoliche, consumo di elettricità sono soggette al fenomeno stagionale. Le serie influenzate dalla stagionalità sono dette anche serie periodiche poiché il ciclo stagionale si ripete in un periodo fisso.
0 2 0 0 4 0 0 6 0 0 8 0 0 1 0 0 0 1 2 0 0 1 4 0 0
1 4 7 10 13 16 19 22 25 28 31 34
Nr. bottiglie
Vendita mensile di bottiglie di acqua
Serie storiche: vendite di birra in Australia
1991 1992 1993 1994
2 7 12
120000 130000 140000 150000 160000 170000 180000 190000
Mese
Ml itr i
Grafico stagionale (seasonal plot): è adatto ad individuare la
presenza di stagionalità (vendite di birra in Australia)
Serie storiche: grafici e tipi di pattern
Pattern ciclico.
Questo tipo di andamento è presente quando la serie presenta aumenti e diminuzioni che non sono di periodo fisso e che di norma superano il periodo annuale.
Questa è la principale differenza fra le fluttuazioni cicliche e quelle stagionali.
Nelle serie economiche il pattern ciclico è determinato dalle
espansioni e contrazioni dell’economia dovuti a fenomeni
congiunturali.
Numeri indice della produzione industriale in Italia Dati annuali (1995=100)
20 30 40 50 60 70 80 90 100 110 120
gen-60 gen-63 gen-66 gen-69 gen-72 gen-75 gen-78 gen-81 gen-84 gen-87 gen-90 gen-93 gen-96 gen-99
Serie storiche: grafici e tipi di pattern
Trend o tendenza di fondo.
E’ caratterizzato da un andamento crescente o decrescente di lungo periodo.
La serie della popolazione residente in Italia (all’inizio dell’anno) è un esempio di andamento tendenziale o trend di tipo crescente.
40 42 44 46 48 50 52 54 56 58
gen-48 gen-50 gen-52 gen-54 gen-56 gen-58 gen-60 gen-62 gen-64 gen-66 gen-68 gen-70 gen-72 gen-74 gen-76 gen-78 gen-80
Sintesi numeriche
Alcune statistiche univariate adatte sia a dati trasversali sia a serie storiche
Indici di posizione
Media
Mediana
Percentili
Indici di dispersione o variabilità
MAD: mean absolute deviation
MSD: mean squared deviation
S
2: varianza
S : standard deviation
Sintesi numeriche: indici di variabilità
( )
1 n
y y
S
n
1 i
2 2 i
−
−
= ∑
=
n y y
MAD
n
1 i
∑
i=
−
=
( )
2 n
1 i
2 i
1 S n
y y
S =
−
−
= ∑
=
( )
n y y
MSD
n
1 i
2
∑
i=
−
=
Quale unità di misura hanno questi indici ?
Serie storiche: autocovarianza e autocorrelazione
Autocovarianza e autocorrelazione sono le corrispondenti della varianza e della correlazione, per una serie storica univariata
Servono per controllare la memoria della serie misurando quanto i
valori al tempo t dipendono linearmente da quelli al tempo t-k (k èdetto lag)
( )( )
( )
∑
∑
= +
= −
−
−
−
=
n1 t
2 t
n
1 k t
k t t
k
y y
y y
y y
r
( )( )
n
y y
y y
c
n
1 k t
k t t
k
∑
+=
−
−−
=
Autocovarianza di periodo kAutocorrelazione di periodo k
2 7 12 17 -1.0
-0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0
Autocorrelation
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 0.47
0.08 -0.08 -0.18 -0.31 -0.48 -0.33
-0.14 -0.10 -0.03 0.34 0.58 0.35 0.06
-0.08 -0.14 -0.17 -0.32 3.21
0.45 -0.44 -1.04 -1.70 -2.49 -1.55
-0.62 -0.42 -0.13 1.49 2.41 1.29 0.21
-0.30 -0.50 -0.62 -1.14 10.99
11.31 11.63 13.44 18.59 31.35 37.72
38.86 39.42 39.48 46.90 68.74 76.81 77.05
77.55 78.97 81.24 89.37
Lag Corr T LBQ Lag Corr T LBQ Lag Corr T LBQ
Autocorrelation Function for Mlitri
Questo grafico è detto correlogramma
Serie storiche: funzione di autocorrelazione (r
k versusk)
Goodness of fit e goodness of forecast
Goodness of fit: come il modello riesce a riprodurre i dati storici (ovvero quelli noti ed usati per la stima del modello) Æ confronto fra stime e valori osservati
Goodness of forecast: come il modello riesce a riprodurre i dati futuri Æ confronto fra previsioni e valori futuri
Come si fa a misurare la goodness of forecast se si hanno n dati?
si può valutare solo quando si avranno i dati ai tempi t=n+1, n+2, ecc.
si può costruire il modello su t=1,…m dati, con m<n; prevedere poi le (n-m) osservazioni successive e verificare su queste l’accuratezza
previsiva (analisi esterna o hold-out sample) Æ ma questo è più che altro un esercizio e in pratica non viene fatto
si può valutare l’accuratezza previsiva mediante il confronto fra valori
osservati e le previsioni a un passo (one-step-forecast)
Anno Mese Mlitri Previsioni
Yt Ft
1991 1 164000
1991 2 148000 164000
1991 3 152000 148000
1991 4 144000 152000
1991 5 155000 144000
1991 6 125000 155000
1991 7 153000 125000
1991 8 146000 153000
1991 9 138000 146000
1991 10 190000 138000 1991 11 192000 190000 1991 12 192000 192000
1992 1 147000 192000
1992 2 133000 147000
1992 3 163000 133000
1992 4 150000 163000
1992 5 129000 150000
1992 6 131000 129000
1992 7 145000 131000
1992 8 137000 145000
1992 9 138000 137000
1992 10 168000 138000
Esempio di previsioni a un passo con un metodo semplice
F
t=Y
t-1Misure di goodness of forecast con one-step-forecast
Indichiamo con
y
t: valore osservato (tempo t)
F
t: valore previsto (al tempo t-1 per il tempo t)
Errore di previsione e
t=y
t- F
tSe abbiamo e
t=y
t- F
tper m periodi, possiamo
valutare l’accuratezza previsiva mediante vari indici - Mean error (ME)
- Mean absolute error (MAE) - Mean squared error (MSE)
- Mean absolute percentage error (MAPE)
Valori bassi indicano accuratezza
Misure di goodness of forecast
m e ME
m
1 t
∑
t=
=( )
m e MSE
m
1 t
2
∑
t=
=m e MAE
m
1 t
∑
t=
=m 100 y e MAPE
m
1
t t
∑
t=
=ME: può assumere sia valori positivi che negativi MAE, MSE: possono assumere valori non negativi ME, MAE: stessa unità di misura di y
MSE: unità di misura di y elevata al quadrato
MAPE: non dipende dall’unità di misura di y.
Anno Mese Mlitri Previsioni
Yt Ft
1991 1 164000
1991 2 148000 164000
1991 3 152000 148000
1991 4 144000 152000
1991 5 155000 144000
1991 6 125000 155000
1991 7 153000 125000
1991 8 146000 153000
1991 9 138000 146000
1991 10 190000 138000 1991 11 192000 190000 1991 12 192000 192000
1992 1 147000 192000
1992 2 133000 147000
1992 3 163000 133000
1992 4 150000 163000
1992 5 129000 150000
1992 6 131000 129000
1992 7 145000 131000
1992 8 137000 145000
1992 9 138000 137000
1992 10 168000 138000 1992 11 176000 168000