• Non ci sono risultati.

CESI A4506551

N/A
N/A
Protected

Academic year: 2021

Condividi "CESI A4506551"

Copied!
78
0
0

Testo completo

(1)

CESI Via R. Rubattino 54 Capitale sociale 8 550 000 Euro Registro Imprese di Milano Centro Elettrotecnico 20134 Milano - Italia interamente versato Sezione Ordinaria Sperimentale Italiano Telefono +39 022125.1 Codice fiscale e numero N. R.E.A. 429222 Giacinto Motta SpA Fax +39 0221255440 iscrizione CCIAA 00793580150 P.I. IT00793580150

www.cesi.it

Cliente

Ricerca di Sistema

Oggetto

Una metodologia per la previsione del prezzo orario dell’energia elettrica mediante tecniche statistiche

Ordine

L9400

Note

EXTRA / WP n° 1 / milestone n° 1.8

rapporto 1/1 della milestone

La parziale riproduzione di questo documento è permessa solo con l'autorizzazione scritta del CESI.

N. pagine

78

N. pagine fuori testo

0

Data

30/06/2004

Elaborato

CESI B. U. RETE T&D – A. Venturini

Università di Milano Bicocca – M. Beccarello, F. Bellini, S. Stefani, G. Tonini

Verificato

CESI B. U. RETE T&D – A. Ardito

(2)

© Copyright 2004 by CESI. All rights reserved - Activity code 4916E (40099N)

Indice

1 SOMMARIO ...4

2 INTRODUZIONE ...6

3 PREVISIONI DA MODELLI ARIMA DEI PREZZI ORARI DELL’ENERGIA ELETTRICA, CON E SENZA TRATTAMENTO DEGLI OUTLIERS ...8

3.1 MODELLI CON ERRORE...8

3.2 MODELLI STOCASTICI...9

3.3 MODELLI ARIMA PER L’ANALISI E LA PREVISIONE DI SERIE ORARIE...10

3.3.1 Una prima formalizzazione dei modelli ARIMA per serie orarie...10

3.4 PROCEDURA DI IDENTIFICAZIONE, STIMA E VERIFICA DI STRUTTURE ARIMA ...12

3.5 TRATTAMENTO DEGLI OUTLIERS NEL CONTESTO DELLA MODELLISTICA ARIMA...13

3.5.1 Modelli con componente ARIMA ed outliers...13

3.5.2 Possibili tipologie di valori anomali ...14

3.6 PROCEDURE DI IDENTIFICAZIONE, STIMA E TRATTAMENTO DEGLI OUTLIERS: GENERALITÀ...15

3.6.1 Individuazione e stima “sequenziale” degli outliers...15

3.6.2 Procedimento di stima congiunta degli outliers e dei parametri ARMA...16

3.7 NUOVE APPLICAZIONI DEI MODELLI ARIMA AL CASO DEL MERCATO ELETTRICO SPAGNOLO...17

3.7.1 Periodi di osservazione ed intervalli di previsione considerati ...17

3.7.2 Struttura e stime dei modelli ARMA identificati...17

3.7.3 Procedure di stima adottate tenendo conto o meno degli outliers ...18

3.8 PREVISIONI DEI PREZZI ORARI DELL’ENERGIA ELETTRICA...23

3.8.1 Intervalli ed orizzonti previsivi, tipi e strumenti di valutazione dei previsori...23

3.8.2 Misure di accuratezza delle previsioni dei prezzi orari ...24

3.8.3 Valutazione della capacità previsiva dei modelli ARMA stimati ...25

4 MODELLI PREVISIVI DEL PREZZO DELL’ELETTRICITÀ...31

4.1 PRIME ANALISI DESCRITTIVE...31

4.2 MODELLIZZAZIONE DEL CICLO SETTIMANALE E PREVISIONE DELLA VOLATILITÀ...33

4.3 MODELLI PREVISIVI DEL CARICO...36

4.4 MODELLI PREVISIVI CONGIUNTI...36

4.5 AGGIORNAMENTO GIORNALIERO DEI PARAMETRI STIMATI...37

4.6 ANALISI DELLA COMPONENTE DI SALTO...37

5 CONCLUSIONI ...39

6 BIBLIOGRAFIA...40

7 APPENDICE A...42

7.1 BORSA ELETTRICA SPAGNOLA...42

7.1.1 Sequenze e procedimento di mercato ...42

7.1.2 Mercato giornaliero (Daily Market) e infragiornaliero (Intraday Market)...44

7.2 ORGANIZZAZIONE E FUNZIONAMENTO DEL MERCATO ELETTRICO ITALIANO...50

7.2.1 Mercato del giorno prima (MGP)...50

7.2.2 Mercato di aggiustamento (MA) ...53

7.2.3 Mercato del servizio di dispacciamento (MSD) ...55

8 APPENDICE B...57

(3)

STORIA DELLE REVISIONI

Numero revisione

Data Protocollo Lista delle modifiche e/o dei paragrafi modificati

(4)

1 SOMMARIO

In questo lavoro si studieranno i prezzi dell’elettricità applicando un approccio previsivo, basato cioè sull’analisi delle serie storiche dei prezzi.

Lo scopo è quello di estrapolare l’andamento futuro della variabile prezzo dal suo andamento passato. L’analisi è stata condotta partendo da basi di dati del marcato elettrico spagnolo (prezzi e quantità risultate nel Mercado Diario della Borsa elettrica spagnola OMEL). È quindi la specificità del mercato spagnolo che si studia e, pertanto, nel presente Rapporto, all’analisi statistica si è affiancata una descrizione di tale mercato (riportata in Appendice A) utile al fine di contestualizzare i risultati del Rapporto stesso. Parallelamente alla descrizione del mercato spagnolo, nella stessa appendice, è presente anche una descrizione del mercato italiano che evidenzia similitudini e differenze nella regolamentazione dei due mercati.

Si sono condotte analisi statistiche sia a livello univariato che bivariato, introducendo la serie storica dei carichi corrispondenti ai prezzi in esame.

I modelli proposti, di tipo ARCH e GARCH, sono stati testati sui dati del mercato elettrico spagnolo. I risultati sono in linea con quelli di altri autori, ossia la performance previsiva si mantiene sull’ordine di grandezza di lavori similari. Proprio per valutare la bontà e l’efficacia delle nostre previsioni, infatti, si è lavorato sullo stesso data base di altri autori. In alcune fasi temporali i nostri risultati sono migliori, avendo introdotto affinamenti ai modelli a cui ci si è ispirati: ad esempio, nel caso di ARIMA applicato all’intero data base utilizzato (Capitolo 4) si sono aggiunti il trattamento e la classificazione degli outliers e in alcune fasce temporali ciò ha consentito una previsione migliore.

Partendo da basi di dati del mercato spagnolo (Mercado Diario della Borsa elettrica spagnola - OMEL), si sono effettuati due tipi di analisi diverse, corrispondenti ai Capitoli 3 e 4 di questo Rapporto: nel Capitolo 3 si sono usate le basi di dati al completo, mentre nel Capitolo 4 si sono usati i dati ora per ora lungo l’orizzonte temporale, vale dire 24 serie separate sul medesimi orizzonte temporale. Le conclusioni e la bibliografia sono rispettivamente nei Capitoli 5 e 6.

I risultati circa la performance dei modelli ARIMA sono incoraggianti, anche se la presenza degli outliers rende la previsione difficile.

Il lavoro si articola in tre parti: dopo una parte I d’introduzione generale (Capitolo 2), nella parte II (vedi Capitolo 3) vengono introdotti i modelli per le analisi delle serie storiche. Tra questi la scelta si orienta sui modelli stocastici e in particolare sui modelli ARIMA. Questi vengono formalizzati nei paragrafi 3.3.1.e 3.4. Le analisi vengono condotte con e senza la procedura di identificazione degli outliers (dati OMEL su tre diversi periodi – paragrafo 3.7.1.). Struttura e stima dei modelli sono nei paragrafi 3.7.2 e 3.7.3. Le previsioni sono riportate nel paragrafo 3.8 e i risultati confrontati con quelli di Contreras et al (2003) e di Venturini et al.- CESI -(2004).

(5)

esplicativa dell’andamento del prezzo e si sono condotte analisi bivariate. Infine (paragrafo 4.6) si è proposta una procedura per l’identificazione degli outliers.

Tutti i modelli dei Capitoli 3 e 4 sono confrontati ove possibile con analoghe sperimentazioni di altri autori e se ne valuta il comportamento migliore ove ciò avviene.

Per comodità di lettura si propone qui una sintesi dei risultati e delle procedure delle parti II e III. Parte II (Capitolo 3):

Dati utilizzati: tutti i prezzi delle 24 ore – tre periodi test

Orizzonte della previsione: breve- medio termine (giorno – settimana) Modelli: ARIMA (23), ARIMA (17), ARIMA (12) poi gli stessi con outliers Modello migliore:

Previsione giornaliera Prima settimana (consumi medi)

ARMA(23) senza outliers Seconda settimana

(consumi bassi)

ARMA(23) con outliers Terza settimana

(consumi alti)

ARMA(23) con outliers Previsione settimanale Prima settimana

(consumi medi)

ARMA(23) senza outliers Seconda settimana

(consumi bassi)

ARMA(12) con outliers Terza settimana

(consumi alti)

ARMA(12) con outliers MAPE e confronto con Contreras et al (2003) e Venturini et al. - CESI (2004) nella Tabella 4 (previsione giornaliera) e Tabella 5 (previsione settimanale)

Perte III (Capitolo 4):

Dati utilizzati: i prezzi ora per ora

Orizzonte della previsione: breve termine (giorno)

Modelli univariati prezzi: AR(7), AR(14) poi gli stessi con GARCH (1,1) Modello migliore: AR(14) (MAPE in Tabella 6)

Modelli bivariati prezzi e carichi: AR(14) il migliore (MAPE in Tab. 9 e errori mediani assoluti in Tab. 10)

(6)

2 INTRODUZIONE

Nell’ultima decade sono nati un po’ ovunque mercati elettrici decentralizzati: Gran Bretagna, Norvegia, Stati Uniti, Australia, Spagna e, molto recentemente, Italia.

La regolamentazione varia da mercato a mercato, ma si notano alcune caratteristiche comuni tra cui: la disgregazione delle società verticalmente integrate con la separazione delle attività di generazione, trasmissione, distribuzione e vendita (dove l’apertura alla concorrenza riguarda i settori della generazione e della vendita mentre trasporto e distribuzione rimangono settori regolamentati in quanto ritenuti monopoli naturali), l’istituzione di un Operatore di Sistema al quale viene affidata la responsabilità di garantire gli standard di qualità, affidabilità e sicurezza del servizio, la creazione di un mercato spot per l’allocazione di (almeno) una parte della produzione di energia e per la determinazione dei prezzi.

È proprio sull’andamento dei prezzi del mercato elettrico che si concentra gran parte della letteratura sul tema dei mercati elettrici. Diversamente dal caso di un’industria regolamentata, infatti, il prezzo di mercato gioca un ruolo attivo di feedback tra fornitori e consumatori, dal momento che tutti gli attori cercano di ottimizzare i propri margini.

Il prezzo proposto dal mercato diviene un segnale a cui i decisori reagiscono. Nel medio e lungo termine, sia dal lato domanda nel ridisegnare consumi e strategie di copertura sui derivati, sia dal lato offerta nella creazione di disponibilità di energia mediante nuovi impianti. Nel breve termine, solo dal alto offerta, adattando la propria strategie d’offerta (bidding) nella Borsa elettrica.

L’elettricità può essere considerata come un bene-flusso, fortemente caratterizzata dalla non convenienza, in termini economici, dello stoccaggio e soggetta a vincoli fisici che ne limitano il trasporto. Ne consegue che il prezzo dell’elettricità diviene estremamente sensibile alle situazioni contingenti di domanda e offerta. L’impossibilità di stoccaggio fa sì che l’elettricità venga percepita, in ore e giorni differenti, come un bene differente: i prezzi risultano quindi estremamente volatili, dipendendo dalle tipiche ciclicità (giornaliera, settimanale e stagionale) che caratterizzano il fabbisogno di energia (quindi la domanda) e che, in parte, caratterizzano anche la capacità di generazione disponibile (quindi l’offerta).

Vi sono inoltre forti limiti fisici nella trasportabilità dell’energia da regione a regione: questo concorre, tra l’altro, a limitare l’entrata nel mercato di nuovi produttori e, infatti, in generale questi mercati sono caratterizzati da pochi fornitori protetti da alte barriere di entrata. Una situazione di questi tipo crea la possibilità di abuso della posizione dominante e/o di collusione tra produttori (si veda ad es. Fabra e Toro (2004) per il mercato spagnolo).

Al problema dello stoccaggio si aggiunge una domanda rigida, che amplifica la volatilità: infatti, se la domanda fosse elastica, almeno i prezzi a breve termine potrebbero stabilizzarsi.

(7)

L’arbitraggio1, la tipica operazione che consente il riallineamento dei prezzi spot e derivati, basata sulla

ben nota relazione di cash and carry, diventa qui molto difficile, se non impossibile, e dunque anche la relazione tra spot e derivati, sempre e ovunque basata su considerazioni di arbitraggio, va rivista.

Risulta a questo punto essenziale che produttori e consumatori, nonché il regolamentatore del mercato, si dotino di strumenti adatti per la previsione dei prezzi spot, anche alla luce dell’accesso al mercato dei derivati.

Il problema della modellizzazione e previsione del prezzo della elettricità è stato affrontato in letteratura con una molteplicità di strumenti e con diverse finalità. Per quanto concerne le finalità, una prima classificazione può essere la seguente:

• Modelli previsivi del prezzo (a breve o lungo termine) • Modelli descrittivi

• Modelli previsivi della volatilità.

Con modelli previsivi intendiamo modelli la cui principale finalità è appunto la previsione del prezzo; con modelli descrittivi intendiamo modelli che mirano a una migliore descrizione del comportamento del prezzo, che però non necessariamente porta a una migliore previsione. Ad esempio, sapere che oltre alla componente “normale” della dinamica dei prezzi c’è una componente discontinua, “di salto”, con determinate proprietà statistiche, non necessariamente migliora la previsione ma può essere utile per altre finalità quali la valutazione di strumenti derivati aventi come sottostante il prezzo della elettricità, oppure per la valutazione di un generatore con una metodologia di tipo “real options” in cui questo viene appunto visto come una opzione. Analogo discorso vale per la previsione della volatilità.

Per una rassegna aggiornata sulle diverse tipologie di modelli si veda ad esempio (Geman and Roncoroni, 2003; Fiorenzani 2004).

Il presente rapporto si concentra sul primo tipo di modelli e propone analisi statistiche di varia natura basate su modelli ARIMA e GARCH.

Le analisi che seguiranno nei Capitoli 3 e 4 sono tutte effettuate su dati del mercato spagnolo. La serie considerata riguarda i prezzi dal 1 gennaio 1998 al 19 novembre 2000 del mercato Omel.

Si sono scelti due approcci differenti: il primo (Capitolo 3) è basato sulla singola serie dei prezzi in tutte le ore; il secondo (Capitolo 4) sulla modellizzazione separata delle 24 serie dei prezzi relativi alle diverse ore (si veda ad esempio Eberlein and Stahl, 2002). Ciò richiede un attento studio sulle stagionalità che si manifestano nell’arco dell’anno. In particolare si nota che le serie orarie dei prezzi spot dell’energia elettrica sono caratterizzate da diverse componenti temporali, tra cui meritano attenzione:

• la ciclicità giornaliera di periodo 24; • il ciclo settimanale di periodo 168; • le correlazioni seriali di breve durata;

• i legami inerziali che si esauriscono rapidamente; • i valori anomali o eccezionali, detti outliers.

Nel Capitolo 3 vengono discusse e analizzate tutte queste componenti.

1 Operazione di acquisto e vendita di titoli, merci o valuta fatta allo scopo di lucrare la differenza di prezzo, su

(8)

3 PREVISIONI DA MODELLI ARIMA DEI PREZZI ORARI DELL’ENERGIA

ELETTRICA, CON E SENZA TRATTAMENTO DEGLI OUTLIERS

Breve premessa

Un buon modello di previsione deve riuscire a tener conto adeguatamente di tutte le suddette componenti, e di altre ancora, in modo da poter cogliere al meglio la complessa struttura di autocorrelazione temporale che contraddistingue le serie di interesse.

Può essere utile partire da una prima classificazione dei modelli per l’analisi delle serie storiche, che sia anche in grado di orientare la scelta del tipo di previsore da adottare. In generale, tali modelli si possono suddividere in due grandi categorie (Piccolo, 1990):

1. i modelli con errore 2. i modelli stocastici.

3.1 Modelli con errore

Tra i modelli con errore rientrano, ad esempio, i modelli classici di regressione multipla; si tratta, com’è noto, di modelli multivariati in cui la serie storica da prevedere (variabile risposta o dipendente) viene espressa in funzione di una o più variabili esplicative o indipendenti mediante un’opportuna funzione matematica, i cui parametri vengono stimati sulla base delle osservazioni con un adeguato metodo di stima.

In sintesi, i modelli con errore sono formalizzabili come segue:

( )

t t

f

z

=

+

ε

,

dove:

z

t è la serie osservata al tempo t, per t = 1, 2, …, n;

f

( )

è una funzione matematica del tempo t, e/o di altre variabili esplicative; pertanto:

– nel primo caso,

z

t

=

f

( )

t

+

ε

t, ossia

z

t dipende soltanto dal tempo t

(9)

(

t

,

s

)

=

0

E

ε

ε

,

t

s

.

Essendo essenzialmente statico, il modello classico di regressione non sarebbe di per sé adatto a rappresentare serie temporali; tale inconveniente è stato tuttavia superato generalizzando al caso dinamico la formulazione classica, mediante i modelli dinamici di regressione con ritardi distribuiti o con funzioni di trasferimento (Pankratz, 1991).

3.2 Modelli stocastici

Alla seconda categoria appartengono i modelli stocastici proposti per l’analisi moderna delle serie storiche, tra cui assumono un ruolo rilevante i modelli della classe ARIMA (AutoRegressive Integrated Moving Average).

In generale, il modello stocastico è dato da:

(

,

,

,

...

)

g

Z

t

=

ε

t

ε

t1

ε

t2

dove

Z

t è il processo stocastico che genera la serie osservata

z

t mediante una funzione g

( )

di

variabili casuali (v.c.)

ε

tj le quali, per j = 0, 1, …, esercitano un’influsso più o meno duraturo su

Z

t.

Pertanto, in questo caso è l’intero modello ad essere intrinsecamente stocastico, mentre nel caso del modello con errore è solo una componente che risulta stocastica (

ε

t).

Ciò comporta delle conseguenze anche in sede di previsioni; infatti, valutati in termini di capacità previsiva teorica, i due suddetti tipi di modelli presentano delle differenze sostanziali, così riassumibili: – nel primo caso (modello con errore), la conoscenza della storia passata della variabile risposta serve

solo parzialmente per prevederne l’andamento futuro; inoltre, il fatto che i valori passati e presente di

z

t dipendano dai valori passati e presenti di una o più variabili esplicative fa sì che, per poter prevedere i valori futuri di

z

t, bisogna preliminarmente prevedere i valori futuri dei corrispondenti predittori; questa previsione, affinché non si riproponga continuamente il problema (come un “gatto che si morde la coda”), deve essere basata su un previsore univariato (e quindi non su un modello con errore).

– Nel secondo caso (modello stocastico), la conoscenza dei valori passati di

Z

tj, per j = 0, 1, … risulta determinante nella previsione dei valori futuri di

Z

t+k, per k = 1, 2, …; infatti:

(

,

,

,

...

)

g

Z

t2

=

ε

t2

ε

t3

ε

t4

(

,

,

,

...

)

g

Z

t1

=

ε

t1

ε

t2

ε

t3

(

,

,

,

...

)

g

Z

t

=

ε

t

ε

t1

ε

t2 Tempo passato t – j, per j = 0, 1, 2, …

---(

,

,

,

,

...

)

g

Z

t+1

=

ε

t+1

ε

t

ε

t1

ε

t2 Tempo futuro t + k, per k = 1, 2, ….

(

,

,

,

,

,

...

)

g

Z

t+2

=

ε

t+2

ε

t+1

ε

t

ε

t1

ε

t2

(10)

In conclusione:

- il modello con errore è prevalentemente indicato per interpretare l’andamento del fenomeno in funzione delle variabili esplicative considerate;

- il modello stocastico risulta adatto soprattutto a fini previsionali.

3.3 Modelli ARIMA per l’analisi e la previsione di serie orarie

Alla luce delle precedenti considerazioni, nel seguito si privilegeranno i modelli stocastici e, tra questi, i modelli della classe ARIMA (dopo averli opportunamente generalizzati al caso di serie orarie). Questi ultimi, infatti, si sono rivelati efficienti a livello statistico ed efficaci a livello operativo, dimostrandosi particolarmente utili a fini previsivi, specie nel caso di previsioni di breve periodo (Choi, 1992). Finora, tuttavia, le applicazioni hanno riguardato soprattutto serie non stagionali (annuali), oppure serie stagionali a cadenza mensile o trimestrale; molto meno numerose risultano invece le parametrizzazioni ARIMA di serie orarie, sia per la minor diffusione e disponibilità di tali serie, sia per i maggiori problemi di modellizzazione e di stima posti da tali parametrizzazioni (non del tutto superati nemmeno con gli attuali più potenti personal computer).

Uno dei campi in cui è interessante e possibile studiare l’andamento orario dei fenomeni è quello dell’energia elettrica; in tale settore, già nel passato erano state proposte alcune applicazioni della modellistica ARIMA al caso di serie dei consumi orari di energia (si veda ad esempio Nogales et al. (2002) e Contreras et al.(2003)). Più recentemente, in seguito alla liberalizzazione del mercato elettrico in diversi Paesi occidentali (Australia, Norvegia, Spagna, Stati Uniti, Svezia, ecc.), si è posto in misura pressante il problema della previsione dei prezzi orari, oltre a rendersi disponibili le corrispondenti serie storiche. In quest’ambito sono stati utilizzati, sia autonomamente che come componenti di parametrizzazioni più complesse, anche i modelli ARIMA, i cui previsori si sono rivelati tra i più efficienti ed efficaci pure in tale contesto (Contreras et al., 2003).

3.3.1 Una prima formalizzazione dei modelli ARIMA per serie orarie

Un modello moltiplicativo ARIMA utile per rappresentare serie orarie dei prezzi può assumere la seguente forma:

(

1−

φ

1⋅B

)

(

1−

φ

24⋅B24

)(

1−

φ

168⋅B168

)

⋅∇⋅∇24⋅Zt =c+

(

1−

θ

1⋅B

)

(

1−

θ

24⋅B24

)(

1−

θ

168⋅B168

)

at

dove Zt è il processo stocastico che ha generato la serie dei prezzi orari zt, c è il termine costante del modello, mentre at ~ WN(0, σ2) è un processo White Noise (successione di v.c. con media nulla,

omoschedastiche2 e incorrelate, cioè tT,

( )

=

0

(11)

(

1−

φ

1B

)

rappresenta l’operatore autoregressivo stazionario non periodico di ordine 1, con B operatore di ritardo tale per cui

B

Z

t

=

Z

t1; tale operatore autoregressivo coglie l’inerzia che in parte caratterizza il legame tra il prezzo di ciascuna ora e quello dell’ora precedente;

(

24

)

24

1

φ

B

è l’operatore autoregressivo stazionario periodico di periodo 24 e di grado 1, con

B

24 operatore di ritardo (o di retrotraslazione) tale per cui B24⋅Zt =Zt24; con tale operatore autoregressivo si riesce a spiegare il legame inerziale che sussiste tra ogni ora e la stessa ora del giorno precedente;

(

168

)

168

1−

φ

B è l’operatore autoregressivo stazionario periodico di periodo 168 e di ordine 1, con

B

168 operatore di ritardo tale per cui B168⋅Zt =Zt168; tale operatore autoregressivo serve per catturare il legame inerziale esistente tra ogni ora di un dato giorno e la stessa ora del medesimo giorno della settimana precedente.

Nel caso di serie non stazionarie in media e in ciclicità oraria, il modello deve incorporare anche gli operatori differenza, rispettivamente, ∇e

24, dove:

(

B

)

=

∇ 1 è l’operatore differenza prima non periodico di ordine 1;

(

24

)

24

=

1 B

è l’operatore differenza prima periodico di periodo 24 e di grado 1.

Questi operatori differenza possono comparire nel modello in aggiunta o in sostituzione dei corrispondenti operatori autoregressivi stazionari; in particolare, si ha la sostituzione quando le stime di

1

φ

e/o di

φ

24 sono approssimativamente pari a 1 (ciò spiega perché gli operatori differenza siano noti anche come operatori autoregressivi non stazionari). La presenza di tali operatori dà luogo alla classe dei modelli ARIMA, altrimenti si ha la (sotto)classe ARMA (AutoRegressive Moving Average).

Infine,

(

1−

θ

1B

)

rappresenta l’operatore media mobile invertibile non periodico di ordine 1; tale operatore cattura la correlazione (di breve durata) tra il prezzo di ciascuna ora e quello dell’ora precedente (o autocorrelazione di ritardo 1);

(

24

)

24

1

θ

B

è l’operatore media mobile invertibile periodico di periodo 24 e di grado 1; tale operatore coglie la correlazione (di durata limitata) tra il prezzo di ogni ora e quello della stessa ora del giorno precedente (autocorrelazione di ritardo o lag 24);

(

168

)

168

(12)

3.4 Procedura di identificazione, stima e verifica di strutture ARIMA

Per poter effettuare previsioni da modelli ARIMA bisogna anzitutto adattare alla serie osservata un opportuno modello di tale classe. A tal fine è necessario ricorrere ad una adeguata procedura, proposta inizialmente da Box e Jenkins (1970) e successivamente integrata da altri autori (si veda ad esempio Choi, 1992), la quale si articola nelle seguenti fasi:

1) analisi preliminari, volte a verificare se la serie osservata soddisfa i requisiti della modellistica ARMA (AutoRegressive Moving Average) e, in particolare, se sia stazionaria in media e in varianza; nella fattispecie, qualora la serie fosse eteroschedastica (non stazionaria in varianza), bisogna intervenire convenientemente e, mediante trasformazioni preliminari ad hoc (come ad esempio la trasformata logaritmica), rendere i dati il più possibile omoschedastici. Viceversa, la non stazionaria in media si può trattare inserendo nel modello ARMA operatori differenza non periodici e/o periodici (come ad esempio ∇ e

24), ossia passando dalla parametrizzazione ARMA a quella ARIMA.

2) Identificazione della struttura del modello, cioè individuazione sia del tipo di operatori (autoregressivi e/o media mobile, periodici e non) da inserire nel modello, sia dell’ordine massimo dei loro parametri, sia degli eventuali altri parametri di ordine inferiore al massimo. A tal fine è necessario studiare attentamente la forma delle funzioni di autocorrelazione globale e parziale calcolate sulla serie osservata (se già stazionaria), oppure sulla serie resa stazionaria mediante opportuni operatori differenza. Questa fase è la più delicata e cruciale dell’intera procedura, poiché da essa dipendono tutti i successivi sviluppi e, quindi, anche la qualità delle previsioni; in essa riveste un ruolo centrale e creativo il ricercatore, in quanto l’analisi dei correlogrammi non può che basarsi su competenze acquisite, su precedenti esperienze ed, eventualmente, su intuizioni originali. 3) Stima dei parametri del modello identificato. Una volta specificato un (primo o successivo) modello

si tratta di stimarne i parametri con un conveniente metodo di stima. Il più adeguato è quello della massima verosimiglianza esatta; tale metodo però, nel caso di modelli per serie orarie dei prezzi, richiede tempi di calcolo non trascurabili, per cui è necessario inizializzare opportunamente la procedura. A questo scopo è consigliabile seguire un procedimento di stima in due fasi, costituite rispettivamente da:

3.1 – una stima preliminare dei parametri col metodo della massima verosimiglianza condizionata, meno efficiente del precedente, ma molto più rapido;

3.2 – una stima definitiva dei coefficienti col metodo della massima verosimiglianza esatta, applicato partendo dai valori iniziali ottenuti col metodo “condizionato”.

4) Verifica della bontà del modello stimato. Detta verifica deve riguardare diversi aspetti del modello e, in particolare:

(13)

4.2 – la casualità dei residui del modello; infatti, residui casuali stanno a significare che il modello incorpora tutte le componenti sistematiche della serie in esame, per cui ciò che resta filtrando la serie col modello stesso non presenta alcuna struttura di autocorrelazione. Gli strumenti essenziali per tale verifica sono sia le funzioni di autocorrelazione globale e parziale calcolate sulla serie dei residui, sia opportuni test onnicomprensivi (come il portmanteau test di Ljung-Box, 1978); nella fattispecie, i residui si possono considerare casuali se, ai diversi lag k (per k = 1, 2, …, 24, … 168, …), risultano (quasi) tutti non significativi sia i singoli valori delle corrispondenti funzioni di autocorrelazione, sia la cumulata di tali valori fino al lag k (cumulata su cui si basano i suddetti test).

La fase di verifica può avere un duplice esito, potendo portare, a seconda dei casi, al rifiuto o all’accettazione del modello stimato; nel primo caso, si tratta di riformulare adeguatamente il modello iniziale, iterando nuovamente la procedura finché non si ottiene un buon modello finale; viceversa, nel secondo caso il modello può essere utilizzato per gli scopi teorico-operativi di interesse e, in particolare, a fini previsionali.

A questo proposito, un ulteriore verifica del modello dovrebbe riguardare la sua capacità previsiva, in quanto non sempre il modello col miglior adattamento ai valori osservati dà anche luogo alle previsioni più accurate dei valori futuri.

3.5 Trattamento degli outliers nel contesto della modellistica ARIMA

La procedura descritta sopra porta a parametrizzazioni adeguate solo se la serie in esame non è contaminata in misura apprezzabile da valori anomali (outliers). L’eventuale presenza di questi ultimi, infatti, specie se numerosi e (molto) intensi, influisce in modo determinante su tutte le fasi della procedura stessa. Nel caso del mercato elettrico, la presenza degli outliers (spikes) è molto evidente: come già sottolineato nella parte I del presente Rapporto, l’impossibilità di stoccaggio unita alla rigidità della domanda causa forti variazioni nel prezzo.

In particolare, gli outliers influenzano anzitutto la fase di identificazione del modello, potendo alterare sensibilmente la struttura di autocorrelazione dei dati e, quindi, la forma dei correlogrammi che servono per individuare il corrispondente modello ARMA; inoltre, pur in presenza di una corretta modellizzazione, gli outliers producono effetti negativi anche in fase di stima dei parametri, potendo portare a stime distorte degli stessi e/o a stime inefficienti della varianza dei residui; infine, gli outliers possono influire negativamente sia sulla fase di verifica del modello, sia sulla capacità previsiva dello stesso.

Quanto precede giustifica ampiamente l’individuazione e il trattamento dei valori anomali, senz’altro presenti nelle serie orarie dei prezzi di interesse, nella convinzione che ciò potrà migliorare non solo la conoscenza dei dati in esame, ma anche la loro parametrizzazione ARMA e la stima dei relativi coefficienti, nonché le prestazioni del corrispondente previsore.

3.5.1 Modelli con componente ARIMA ed outliers

(14)

dove

Z

t è la componente non contaminata dagli outliers e rappresentabile con un opportuno modello ARIMA come, ad esempio, Zt =

{

( )

B

( ) ( )

BB ∇⋅∇ ⋅

( )

B

( ) ( )

BB168

}

at

168 24 24 24 168 168 24 24

θ

φ

φ

φ

θ

θ

;

viceversa,

Y

t è il processo contaminato dagli outliers.

3.5.2 Possibili tipologie di valori anomali

Il generico valore anomalo

O

jt, può essere modellato come segue:

( )

t

( )

j j

j

jt

L

B

I

T

O

=

ω

,

dove

ω

j indica il segno e l’intensità dell’impatto iniziale del j-esimo outlier, mentre

I

t

( )

T

j è la variabile indicatore che ne segnala il tempo (ora)

T

j di accadimento, ed è tale per cui:

 = 1, per

t

=

T

j;

( )

j

t

T

I

 = 0, per

t

T

j, con t = 1, 2, …, n.

Infine,

L

j

( )

B

rappresenta la forma del j-esimo valore anomalo, la quale varia a seconda del tipo di outlier considerato. Nella fattispecie, le tipologie identificabili con la procedura che si illustrerà tra poco sono le seguenti quattro: effetti additivi istantanei (Additive Outliers, AO), variazioni di livello temporanee (Transient Change, TC) o permanenti (Level Shift, LS), ed effetti “innovazione” (Innovational Outliers, IO). I primi tre tipi dei succitati outliers possono essere ricavati ponendo

( )

B B L j j =

δ

1 1

e facendo assumere a

δ

j opportuni valori. In particolare:

se

δ

j

=

0

, allora

L

j

( )

B

=

1

; pertanto, nell’istante (ora)

T

j siamo in presenza di una anomalia di tipo additivo (AO) che esaurisce i suoi effetti sulle osservazioni nel momento stesso in cui si manifesta; se

0

<

δ

j

<

1

, allora

L

j

( )

B

=

1

(

1

δ

j

B

)

; di conseguenza, a partire da

T

j si ha un cambiamento

transitorio (TC) del livello della serie osservata, che tende a smorzarsi nel tempo al tasso

δ

j;

se

δ

j

=

1

, allora

L

j

( )

B

=

1

(

1

B

)

; quindi, dal tempo (ora)

T

j in poi si registra una variazione duratura (LS) del livello dei dati pari a

ω

j unità (in aumento o in diminuzione a seconda che il segno di

j

ω

sia positivo o negativo)

Da ultimo, il quarto tipo di outlier trasmette i suoi effetti su tutta la serie osservata mediante il meccanismo ARIMA di

Z

t, mentre influenza la serie delle “Innovations”

a

t in un unico istante, cioè in

j

T

(15)

quello schematizzato sopra, allora questo tipo di valore anomalo può essere formalizzato con

( )

{

( )

( ) ( )

( )

( ) ( )

168

}

168 24 24 24 168 168 24 24

B

B

B

B

B

B

B

L

j

=

θ

θ

θ

φ

φ

φ

.

3.6 Procedure di identificazione, stima e trattamento degli outliers: generalità

Per scoprire gli outliers eventualmente presenti nei dati, nel caso non si abbiano informazioni a priori sugli stessi, è necessario ricorrere ad un’opportuna procedura che consenta di stabilire se ogni data osservazione possa considerarsi anomala oppure no, sulla base delle tracce peculiari che ciascun tipo di outlier lascia sui residui ottenuti filtrando la serie osservata con un adeguato modello ARIMA.

In generale, le procedure proposte sono di tipo iterativo e si articolano in diverse fasi volte, da una parte, a identificare e stimare gli eventuali outliers e, dall’altra, ad eliminarne gli effetti indesiderati. Tali procedure, quindi, si differenziano per il modo con cui stimano e/o trattano i dati anomali identificati.

3.6.1 Individuazione e stima “sequenziale” degli outliers

Si supponga che la serie oraria di interesse sia contaminata da un certo numero di outliers di cui non si conosce né la data di accadimento, né il segno e la dimensione, né la tipologia (che può essere una delle quattro siglate sopra con AO, IO, LS e TC).

I passaggi necessari (anche se non sempre sufficienti) per riconoscere gli outliers eventualmente presenti nei dati sono quantomeno i seguenti:

1) si identifica e si stima un modello ARIMA per la serie

Y

t assumendo che nessun evento AO, IO, LS o TC sia presente nei dati;

2) si determinano i residui del modello (filtrando con quest’ultimo la serie osservata) e si stima la varianza di

a

t (cioè

σ

a2);

3) si calcolano 4 diversi test statistici – uno per ogni tipo di outlier e tutti basati sulle stime dei residui e della varianza di

a

t – in corrispondenza di ciascun possibile istante dell’intervallo temporale considerato;

4) si individua il test con valore assoluto massimo e si confronta con un prefissato livello critico; se il test risulta non superiore a tale soglia, allora la procedura si interrompe e si deduce che non vi è alcun dato anomalo nella serie; viceversa, se il test è maggiore di detto livello, allora si è scoperto un primo possibile outlier, le cui caratteristiche (istante di accadimento, segno, dimensione e tipologia) sono quelle associate al corrispondente test;

(16)

La suesposta procedura viene iterata fino a quando non è più possibile individuare alcun tipo di outlier nei dati.

3.6.2 Procedimento di stima congiunta degli outliers e dei parametri ARMA

Come accennato sopra, le fasi della suddetta procedura sono necessarie ma non sufficienti per garantire un’efficiente stima e aggiustamento degli eventuali outliers; pertanto, sono state sviluppate delle procedure più adeguate ma anche più complesse della precedente, volte a superare gli inconvenienti quest’ultima. Il principale di tali limiti è costituito dal fatto che il modello ARIMA di partenza (v. fase 1) viene stimato supponendo che la serie osservata sia priva di outliers (AO, IO, LS o TC); così facendo, però, si possono ottenere stime distorte e/o inefficienti dei parametri del modello, con la possibile conseguenza di: identificare gli outliers in modo inesatto; individuare outliers “spuri”; non riuscire a riconoscere tutti gli effettivi valori anomali presenti nella serie.

(17)

3.7 Nuove applicazioni dei modelli ARIMA al caso del mercato elettrico spagnolo

3.7.1 Periodi di osservazione ed intervalli di previsione considerati

In attesa che si rendano disponibili anche per l’Italia serie orarie dei prezzi dell’energia sufficientemente estese ed affidabili, le elaborazioni seguenti sono state effettuate con riferimento al mercato elettrico spagnolo. Si ritiene infatti che quest’ultimo, tra tutti i mercati elettrici attualmente liberalizzati, sia quello che più si avvicina alla presumibile configurazione che il mercato elettrico italiano assumerà dopo la sua completa liberalizzazione.

A fini di confronto, poi, si sono considerati gli stessi periodi di osservazione e i medesimi intervalli di previsione presi in esame, originariamente, da Contreras et al. (2003) e, successivamente, anche da Venturini et al.- CESI -(2004).

In particolare, i dati riguardano tre diversi periodi, e cioè:

I) il primo va dalle ore 1 di sabato 1° gennaio alle ore 24 di mercoledì 24 maggio 2000, per un totale di 3480 osservazioni; il corrispondente intervallo di previsione si estende sulla settimana successiva, coprendo le 168 ore che vanno dall’una di giovedì 25 alla mezzanotte di mercoledì 31 maggio 2000. Si tratta di un intervallo con un livello medio dei consumi (domanda) di energia.

II) Il secondo periodo di osservazione va dalle ore 1 di giovedì 1° giugno alle ore 24 di giovedì 24 agosto 2000, per un totale di 2040 valori osservati; il corrispettivo intervallo di previsione copre le 168 ore della settimana successiva, andando dalle ore 1 di venerdì 25 alle ore 24 di giovedì 31 agosto 2000. Si tratta di un intervallo solitamente caratterizzato da bassi livelli dei consumi (domanda) di energia.

III) Infine, il terzo periodo va dalle ore 1 di venerdì 1° settembre alle ore 24 di domenica 12 novembre 2000, per un totale di 1752 osservazioni; il corrispondente intervallo di previsione, composto sempre da 168 ore totali, va dall’una di lunedì 13 alla mezzanotte di domenica 19 novembre 2000. Si tratta di un intervallo contraddistinto generalmente da livelli elevati dei consumi (carichi) di energia.

3.7.2 Struttura e stime dei modelli ARMA identificati

Nelle tabelle 1-3 sono riportate le stime dei parametri dei modelli ARMA utilizzati nelle previsioni dei prezzi orari dell’energia elettrica, con riferimento all’orizzonte previsivo di 168 ore, ovvero al primo orizzonte previsivo di 24 ore (dove l’asterisco a esponente indica i valori non significativi al livello del 5%); non si riportano invece le sei successive varianti delle stime di ciascun parametro dei previsori a 24 ore, ottenute con riferimento a periodi di osservazione progressivamente “allungati” di 24 valori alla volta.

(18)

– i primi due modelli di ogni tabella hanno lo stesso numero di parametri (23) e la medesima struttura ARMA di quelli identificati da Contreras et al. (2003) nella loro analisi del mercato elettrico spagnolo; ciò consentirà di effettuare confronti omogenei tra la nostra e la loro applicazione, a parità di parametrizzazione;

– i successivi due modelli presentano un numero di parametri inferiore (17 o 12) e una struttura diversa rispetto ai precedenti; ciascuna di tali nuove strutture è stata identificata in modo autonomo e soddisfa un criterio di parsimonia, nel senso che consente di ottenere risultati apprezzabili (in termini sia di bontà di adattamento che di accuratezza delle previsioni) con una parametrizzazione più semplice o parsimoniosa.

A differenza dei succitati Autori, tutti i modelli delle tabelle 1-3 sono stati stimati operando con i valori osservati (prezzi orari dell’energia elettrica) anziché con il loro logaritmo, in quanto:

a) la trasformazione logaritmica, come altre della classe di Box-Cox (1966), non è parsa adeguata a trattare convenientemente serie caratterizzate da elevata volatilità;

b) la ritrasformazione nella metrica originaria pone dei problemi (sottostima sistematica delle osservazioni) non completamente risolti nemmeno con le soluzioni recentemente proposte (soggette comunque a margini non trascurabili di discrezionalità);

c) le previsioni da noi ottenute operando direttamente con i dati originari sono risultate migliori di quelle basate sui logaritmi.3

3.7.3 Procedure di stima adottate tenendo conto o meno degli outliers

I modelli con meno parametri (17 o 12) sono stati selezionati dopo ripetute e laboriose applicazioni della procedura di identificazione-stima-verifica proposta da Box e Jenkins (1970); tali applicazioni hanno portato a provare e a scartare numerosi modelli alternativi prima di giungere a quelli definitivi. Tra i criteri di scelta adottati se ne sono privilegiati due, uno riguardante la parsimonia della parametrizzazione e l’altro l’accuratezza delle previsioni.

Per ciascun modello ARMA identificato i corrispondenti parametri sono stati stimati in due modi diversi:

I) non tenendo conto degli outliers presenti nei dati (tabelle 1-3, colonne 2 e 4); II) aggiustando, in fase di stima, gli eventuali outliers (tabelle 1-3, colonne 3 e 5).

Nel primo caso, le stime sono state ottenute col metodo della massima verosimiglianza esatta, adottando la procedura ESTIM del pacchetto SCA (Liu e Hudak, 1992). Nel secondo caso, invece, si è fatto ricorso alla procedura OESTIM (Liu e Hudak, 1992), con la quale si sono potuti stimare congiuntamente gli outliers e i parametri dei diversi modelli considerati4.

3 Nella III parte, tuttavia, la trasformazione logaritmica ha dato risultati migliori che con i livelli dei prezzi.

4 Le suddette stime sono state ottenute col metodo della massima verosimiglianza condizionata, in quanto quella

(19)

Per ciascun outlier

O

jt, identificato la procedura OESTIM fornisce diverse informazioni rilevanti, e cioè: l’istante di accadimento

T

j, il segno e l’intensità di

ω

ˆ

j (stima dell’effetto iniziale del j-esimo outlier), la significatività (misurata dal test t) e la tipologia (AO = Additive Outlier; IO = Innovational Outlier; TC = Transient Change; LS = Level Shift). Una sintesi schematica di tali informazioni viene riportata nell’Appendice B dove, con riferimento ai modelli ARMA finali dell’ultima colonna delle tabelle 1-3, si classificano gli outliers identificati in ciascun periodo di osservazione secondo: la tipologia (Tab. B.1), il segno (Tab. B.2), il valore del test t (Tab. B.3), il giorno e l’ora di accadimento (Tabb. B.4-B.5).

Infine, confrontando tra loro gli ultimi due valori della colonna 3 e 5 delle tabelle 1-3 si possono valutare gli effetti positivi sulla bontà di adattamento del modello dovuti al trattamento dei valori anomali; infatti, passando dal modello stimato senza gli outliers a quello stimato congiuntamente agli outliers, si ha sempre una sensibile riduzione dell’errore standard (Standard Error, S.E.) dei corrispondenti residui.

(20)

Tab. 1 – Stime dei parametri (23 o 17) dei modelli ARMA determinate sui 3480 prezzi orari del primo periodo di osservazione (dalle ore 1 di sabato 1° gennaio alle ore 24 di mercoledì 24 maggio 2000). Standard Error (S.E.) e Indice di Determinazione (I.D.) calcolati sui residui del modello

Modello con 23 parametri Modello con 17 parametri Procedura di stima Procedura di stima

Parametri5 ESTIM OESTIM ESTIM OESTIM

C 0,0052 0,0090 0,0262 0,0027 1

θ

-0,2343 -0,3587 -0,8151 -0,2085 2

θ

0,7049 0,5922 0,1607 0,7542 24

θ

0,1626* 0,2708 0,1900 0,2612 168

θ

0,1598 0,0343* — — 336

θ

0,1857 0,1907 0,2827 0,1960 504

θ

0,2832 0,2220 0,3227 0,2165 1

φ

0,3644 0,4723 -0,1990 0,6160 2

φ

0,9569 0,8494 0,8398 0,9020 3

φ

-0,3958 -0,5130 0,0092* -0,6308 4

φ

-0,0414* 0,0174* — — 5

φ

0,0487 0,0700 0,0890 0,0697 23

φ

0,0589 0,0352* — — 24

φ

0,4476 0,5872 0,5013 0,5757 47

φ

0,0352* 0,0098* — — 48

φ

0,0138* 0,0093* — — 72

φ

0,0216* -0,0153* — — 96

φ

0,0366* 0,1052 0,0533 0,1015 120

φ

-0,0224* -0,0885 -0,0021* -0,0823 144

φ

0,1295 0,1282 0,1217 0,1185 168

φ

0,2968 0,2304 0,1571 0,2012 336

φ

0,2530 0,3209 0,3694 0,3599 504

φ

0,3251 0,3075 0,3377 0,3016 S.E.6 0,2699 0,3144 0,2731 0,3160 S.E.7 0,1557 0,1548 I.D.** 0,9380 — 0,936 —

* Valori non significativi al livello del 5%.

** Si fa notare che I.D. = r2 (quadrato del coefficiente di correlazione).

5 La stima di k

θ

indica il “peso” (quota-parte positiva o negativa) con cui la stima delle v.c.

a

tk influenza l’andamento della serie ai ritardi k = 1, 2, 24, 168, 336 e 504.

6 Standard Error (S.E.) dei residui del modello stimato senza tener conto degli outliers.

(21)

Tab. 2 – Stime dei parametri (23 o 12) dei modelli ARMA determinate sui 2040 prezzi orari del secondo periodo di osservazione (ore 1 di giovedì 1° giugno alle ore 24 di giovedì 24 agosto 2000). Standard Error (S.E.) e Indice di Determinazione (I.D.) calcolati sui residui del modello

Modello con 23 parametri Modello con 12 parametri Procedura di stima Procedura di stima

Parametri ESTIM OESTIM ESTIM OESTIM

c 0,0174* 0,0037* — — 1

θ

-1,0978 -0,3836* -0,7782 -0,8438 2

θ

-0,2160* 0,4847* — — 24

θ

0,2932 0,3333 0,3757 0,1827* 168

θ

0,1546 0,1315 — — 336

θ

0,3760 0,2702 0,4453 0,3598 504

θ

0,0783* 0,1654 0,2189 0,1007 1

φ

-0,4204 0,4053* — — 2

φ

0,6540 0,8648 0,6974 0,7606 3

φ

0,2866* -0,3008* — — 4

φ

0,0951* -0,0573* — — 5

φ

0,0815 -0,0053* — — 23

φ

0,0975 0,0702 — — 24

φ

0,5978 0,7365 0,6714 0,5849 47

φ

-0,0490* -0,0727 — — 48

φ

-0,0408* -0,1274 -0,0487* -0,0963* 72

φ

0,0323* 0,0727* 0,0201* 0,1009 96

φ

-.0166* 0,0067* — — 120

φ

0,0821 0,0772* 0,1271 0,1027 144

φ

0,1155 0,0415* — — 168

φ

0,1395 0,1858 0,0398 0,1092 336

φ

0,5330 0,4148 0,5871 0,5294 504

φ

0,2171 0,3072 0,3387 0,3028 S.E.8 0,2570 0,3319 0,2599 0,3370 S.E.9 0,2213 0,2210 I.D.** 0,907 — 0,905 —

* Valori non significativi al livello del 5%.

** Si fa notare che I.D. = r2 (quadrato del coefficiente di correlazione).

8 Standard Error (S.E.) dei residui del modello stimato senza tener conto degli outliers.

(22)

Tab. 3 – Stime dei parametri (23 o 12) dei modelli ARMA determinate sui 1752 prezzi orari del terzo periodo di osservazione (dalle ore 1 di venerdì 1° settembre alle ore 24 di domenica 12 novembre 2000). Standard Error (S.E.) e Indice di Determinazione (I.D.) calcolati sui residui del modello

Modello con 23 parametri Modello con 12 parametri

Procedura di stima Procedura di stima

Parametri ESTIM OESTIM ESTIM OESTIM

C 0,0190* 0,0069* — — 1

θ

-0,9256 -0,6136 -0,7555 -0,7590 2

θ

-0,0418* 0,0951* — — 24

θ

-0,0705* 0,6971 0,5969 0,5587 168

θ

-0,0140* -0,2278 0,1671 0,1684 336

θ

0,3992 0,4951 0,3438 0,2961 504

θ

0,3226 0,2772 0,2835 0,1011* 1

φ

-0,2135* 0,1102* — — 2

φ

0,6802 0,5331 0,6494 0,6153 3

φ

0,1349* -0,0087* — — 4

φ

0,1024* 0,0958* — — 5

φ

0,0931 0,1157 0,1288 0,1608 23

φ

0,0355* -0,0004* — — 24

φ

0,2396 1,0253 0,8750 0,8155 47

φ

-0,0178* 0,0221* — — 48

φ

0,1213* -0,1137* -0,0555 -0,0054* 72

φ

0,0710* -0,0868* — — 96

φ

0,0270* 0,0362* — — 120

φ

0,0598* -0,0105* — — 144

φ

0,0558* 0,0704* — — 168

φ

0,2721 0,1181* 0,4411 0,5319 336

φ

0,4757 0,6133 0,3744 0,3785 504

φ

0,1903 0,2053 0,1568 0,0685* S.E.10 0,3385 0,4696 0,3337 0,4714 S.E.11 0,3583 0,3427 I.D.** 0,940 — 0,941 —

* Valori non significativi al livello del 5%.

** Si fa notare che I.D. = r2 (quadrato del coefficiente di correlazione).

10 Standard Error (S.E.) dei residui del modello stimato senza tener conto degli outliers.

(23)

3.8 Previsioni dei prezzi orari dell’energia elettrica

3.8.1 Intervalli ed orizzonti previsivi, tipi e strumenti di valutazione dei previsori

Conseguiti gli obiettivi intermedi di questo lavoro (identificazione, stima e verifica di un modello parsimonioso “ottimale”, oltre a quello con 23 parametri), si può passare ora all’obiettivo finale del lavoro stesso, che consiste nel valutare le previsioni ottenute. A questo proposito si tratterà di individuare il previsore “ottimale”, con riferimento sia a ciascuno dei tre diversi intervalli di previsione considerati, sia ai possibili orizzonti previsivi di interesse.

Per quanto riguarda il primo aspetto si rammenta che detti intervalli sono tre:

1) il primo copre le ore dell’ultima settimana di maggio 2000 ed è caratterizzato da un livello medio della domanda di energia;

2) il secondo abbraccia l’ultima settimana di agosto 2000 ed è contraddistinto da un basso livello della domanda di energia;

3) il terzo, infine, è a cavallo tra la seconda e la terza settimana di novembre 2000 e presenta un livello elevato della domanda.

Per quel che concerne invece il secondo aspetto, gli orizzonti previsionali presi in considerazione sono quelli di maggior interesse per gli operatori del settore (almeno nel breve periodo), e cioè i seguenti due: a) l’orizzonte fino a 24 ore, che va dalla prima all’ultima ora del giorno dopo l’ultimo di osservazione; b) l’orizzonte fino a 168 ore, che va dalla prima all’ultima ora della settimana successiva a quella di

origine delle previsioni.

Ovviamente, ciascuno dei precedenti due casi si può indirettamente ricavare dall’altro; in particolare, previsioni indirette a 168 ore si possono ottenere aggregando previsioni successive a 24 ore calcolate, giorno dopo giorno, per sette giornate consecutive; viceversa, previsioni indirette a 24 ore si possono ricavare disaggregando, per ciascun giorno della settimana, le previsioni a 168 ore determinate per l’intera settimana.

Infine, si sottolinea il fatto che l’aver operato con modelli stocastici consente di valutare in termini non solo descrittivi ma anche probabilistici le previsioni ottenute; infatti, il previsore associato a ciascun modello ARIMA è in grado di fornire, oltre a previsioni puntuali, anche gli intervalli di confidenza delle previsioni stesse (in corrispondenza ad un prefissato livello, solitamente posto pari al 95%).

Pertanto, l’attendibilità delle previsioni sarà valutata:

1) in primo luogo, a livello descrittivo, mediante un opportuno indice sintetico basato sugli errori (puntuali) di previsione;

(24)

3.8.2 Misure di accuratezza delle previsioni dei prezzi orari

Per misurare l’accuratezza dei previsori utilizzati si è calcolata la media dei valori assoluti degli errori percentuali, MAPE (Mean Absolute Percentage Error).

La sua formula di calcolo varia leggermente a seconda dell’orizzonte previsivo considerato, ossia:

I) per previsioni fino a 24 ore si ha:

( )

( )

100

24

1

24

24 1

×

=

= + k h k h h

Y

k

e

MAPE

, dove

( )

k Y

( )

k

eh = h+kh è l’errore di previsione12 che si commette sostituendo al valore osservato13

nell’istante h+k, cioè a

Y

h+k, il corrispondente valore previsto k istanti dopo l’ultimo istante di osservazione h (in simboli Yˆh

( )

k ), per k = 1, 2, …, 24 e h = n, n +24, …, n +144 (con n pari

alle ore 24 del 24 maggio, del 24 agosto e del 12 novembre in corrispondenza, rispettivamente del primo, secondo e terzo periodo di osservazione).

I valori di

MAPE 24

( )

h sono riportati nelle colonne della Tab. 4 (dalla seconda alla penultima) in corrispondenza dei diversi giorni della settimana di ciascun intervallo previsivo considerato. Infine, l’ultima colonna della Tab. 4 contiene la media settimanale dei valori di

MAPE 24

( )

h espressa da:

(

)

( )

( )

100

168

1

24

7

1

7

24

144 24 ,

×

=

=

×

+

∑∑

+ = + n n n h h k h k h h

Y

k

e

MAPE

MAPE

.

II) Per previsioni fino a 168 ore la formula di MAPE diventa:

( )

( )

= +

×

=

168 1

100

168

1

168

k n k n

Y

k

e

MAPE

,

dove en

( )

k =Yn+kn

( )

k ,

Y

n+k e n

( )

k assumono significato analogo a quello visto sopra, con l’unica differenza che ora l’ultimo istante di osservazione h non è variabile ma fisso e pari a n (con n che indica sempre le ore 24 del 24 maggio, del 24 agosto e del 12 novembre nel caso rispettivamente del primo, del secondo e del terzo periodo di osservazione considerato).

I valori di MAPE

( )

168 sono contenuti nell’ultima colonna della Tab. 5, mentre le altre colonne riportano la disaggregazione di tali valori per ciascun giorno della settimana.

12 Ovviamente, gli errori di previsione compaiono nella formula in valore assoluto, onde evitare effetti di

compensazione tra gli scarti con segno positivo e quelli con segno negativo; inoltre, i singoli errori vengono espressi in termini relativi per poterne valutare l’incidenza sui corrispondenti valori osservati. Sul problema delle misure di accuratezza delle previsioni vedasi, ad esempio, Makridakis (1993).

13 Si fa notare che, trattandosi di previsioni ex-post, i valori osservati k h

(25)

Infine, per quanto riguarda l’interpretazione di MAPE, si può affermare che le prestazioni previsive di un modello sono tanto migliori quanto più piccolo è il valore dell’indice stesso, essendo quest’ultimo funzione diretta dell’errore di previsione (il quale a sua volta è inversamente legato a tali prestazioni).

3.8.3 Valutazione della capacità previsiva dei modelli ARMA stimati

Nel seguito, la capacità previsiva dei diversi modelli adottati sarà valutata basandosi soprattutto, se non esclusivamente, sui valori degli indici MAPE

(

24×7

)

e MAPE

( )

168 evidenziati in neretto, rispettivamente, nell’ultima colonna delle tabelle 4 e 5. In particolare, ci si propone di valutare come varia tale capacità al variare, ceteris paribus, di aspetti rilevanti come:

1) il numero di parametri del modello; 2) il trattamento o meno degli outliers; 3) l’intervallo di previsione considerato; 4) l’ampiezza dell’orizzonte previsivo; 5) il tipo di previsore (modello) utilizzato.

Le valutazioni prospettate risulteranno utili soprattutto al fine di individuare l’eventuale previsore “ottimale” con riferimento a ciascuno dei precedenti aspetti.

3.8.3.1 Selezione del previsore “ottimale” in base al numero di parametri del modello

Nel primo caso, la scelta tra due o più modelli con un diverso numero di parametri si è basata sul seguente criterio: a parità di prestazioni previsive dei modelli posti a confronto, o per differenze trascurabili di tali prestazioni, è preferibile adottare il modello più semplice o parsimonioso, cioè quello con il minor numero di parametri.

Con riferimento a ciascuna settimana di previsione, il modello con meno parametri presenta un valore dell’indice MAPE che, se in alcuni casi è solo leggermente superiore (meno di un punto percentuale) rispetto al corrispondente modello più complesso, in altri casi è addirittura inferiore. Infatti, confrontando tra loro – riquadro per riquadro – i valori dell’ultima colonna delle tabelle 4 e 5 (il primo con il terzo e il secondo con il quarto) si evince rispettivamente che:

a) nella Tab. 4, in quattro confronti su sei i valori dell’indice MAPE

(

24×7

)

presentano differenze trascurabili (inferiori ad un punto percentuale), mentre risultano superiori in un caso soltanto (cfr. 2° e 4° valore della settimana di agosto); vi è infine un caso in cui il valore minimo di MAPE si ha in corrispondenza del modello più parsimonoso (nella settimana di novembre);

(26)

Dai precedenti confronti esce confermato il fatto che non sempre il modello più complesso è anche quello con la maggior capacità previsiva. Nella fattispecie, i risultati ottenuti portano a privilegiare i modelli più parsimoniosi, cioè quelli con 17 e 12 parametri (anziché con 23), proposti nel caso rispettivamente della prima, ovvero della seconda e terza settimana di previsione.

Tali parametrizzazioni sembrano preferibili anche ai corrispondenti modelli più complessi (con 23 parametri) stimati da Contreras et al. (2003); infatti, dall’ultima colonna della Tab. 4 si evince che, pur essendo i valori di MAPE

(

24×7

)

dei modelli più semplici sempre maggiori rispetto a quelli dei succitati Autori, le differenze sono comunque piuttosto contenute (inferiori al punto percentuale), a fronte di una struttura relativamente meno complessa.

3.8.3.2 Capacità previsiva dei modelli ARIMA senza e con trattamento degli outliers

Dal confronto tra le prestazioni previsive dei modelli con e senza aggiustamento degli outliers emergono risultati contrastanti, che risentono della settimana di previsione considerata. Infatti, nel caso dell’ultima settimana di maggio, il trattamento dei valori anomali non solo non fa aumentare l’accuratezza delle previsioni, ma la fa addirittura diminuire, seppur di poco. Ciò si verifica indipendentemente dal numero di parametri del modello e dall’orizzonte previsionale (cfr. il 1° e 2° valore, nonché il 3° e 4° dell’ultima colonna delle tabelle 4 e 5). In questo caso, pertanto, non sembrerebbe giustificato il trattamento dei valori anomali, anche se per tirare delle conclusioni definitive bisognerebbe altresì considerare le caratteristiche (cadenza, tipologia e intensità) degli outliers stimati.

Con riferimento invece alle altre due settimane in esame, le previsioni migliori si ottengono sempre (salvo un’unica eccezione) con i modelli che tengono conto degli outliers, anziché con quelli che non ne tengono conto; in alcuni casi tale miglioramento è elevato, mentre in altri non lo è. Trattando gli outliers, infatti, il valore di MAPE registra una decrescita in ben sette degli otto possibili confronti relativi alle settimane di agosto e di novembre: in tre casi tale decremento è piuttosto limitato, in due è più sostenuto (superiore al punto percentuale, anche se non di molto), mentre nei restanti due casi è decisamente forte (ben oltre i 5 punti percentuali). Le riduzioni maggiori dei valori di MAPE si hanno comunque in corrispondenza dei modelli più semplici e delle previsioni con un orizzonte di 168 ore (Tab. 5), anziché per quelle con orizzonte 24 (Tab. 4).

Dai risultati ottenuti si può dunque trarre la conclusione che vale sempre la pena operare con previsori che tengano conto anche degli outliers, in aggiunta se non proprio in alternativa ai modelli che non li considerano. Queste conclusioni assumono ancora maggior rilievo, come vedremo tra poco, alla luce delle considerazioni sviluppate nel prossimo paragrafo.

3.8.3.3 Il previsore “ottimale” a seconda dell’intervallo di previsione considerato

(27)

Questo “ordinamento” fra le tre settimane si manifesta, con un’unica eccezione, indipendentemente sia dal numero di parametri del modello, sia dal trattamento o meno degli outliers, sia dall’orizzonte previsivo considerato. Inoltre, un “ordinamento” analogo si può riscontrare anche per il modello di previsione proposto da Contreras et al. (2003), come si evince dalla Tab. 4.

Viceversa, per il previsore di Venturini et al. - CESI (2004) l’ordinamento fra le settimane si distingue da quello risultante dai modelli precedenti; infatti, sia nel caso dell’applicazione su orizzonte settimanale

(vediMAPE

( )

168 nella Tab.5) che nel caso dell’applicazione con passo giornaliero (vedi

(

24×7

)

MAPE nella Tab. 4), le prestazioni del previsore in parola peggiorano passando dalla settimana con i consumi più bassi a quella con i più elevati.

Si noti, infine, che l’analisi sopra riportata, non è orientata a stabilire una correlazione tra le prestazioni previsive dei modelli e le condizioni di domanda nelle quali le previsioni avvengono. Le precedenti osservazioni, infatti, devono essere rapportate al valore, differenti da periodo a periodo, della volatilità intrinseca dell’andamento dei prezzi che rende non uniforme la difficoltà di previsione dei prezzi sui diversi intervalli.

3.8.3.4 Scelta del previsore “ottimale” a seconda dell’orizzonte previsivo

Dopo aver analizzato come variano le prestazioni previsive dei modelli ARMA al variare dei loro parametri, del trattamento o meno degli outliers e della settimana di previsione, si tratta ora di valutare se e come varia la loro capacità previsionale in funzione dell’ampiezza dell’orizzonte di previsione. A questo proposito si sono presi in esame due diversi orizzonti, uno a 24 e l’altro a 168 ore (previsioni orarie, rispettivamente, per il giorno dopo e per la settimana dopo), essendo i due di maggior interesse per gli operatori del settore, almeno nel breve periodo.

Le valutazioni si basano sempre sull’indice MAPE calcolato, nel primo caso, come media di 7 successivi valori giornalieri dell’indice stesso (v. MAPE

(

24×7

)

, Tab. 4, ultima colonna) e, nel secondo caso, direttamente sui 168 errori percentuali di previsione (in modulo) dei prezzi orari di un’intera settimana (v. MAPE

( )

168 , Tab. 5, ultima colonna).

Dal confronto tra ciascun valore di MAPE

(

24×7

)

con il corrispondente valore di MAPE

( )

168 si evince che:

1. Nel caso della settimana di maggio le differenze tra i due indici sono trascurabili, essendo tutte inferiori ad un punto percentuale; ciò vale indipendentemente dal numero di parametri del modello e dall’aggiustamento o meno degli outliers. Tenendo conto che, in generale, al crescere dell’ampiezza dell’orizzonte previsivo è lecito aspettarsi una riduzione di accuratezza delle previsioni, e visto che quanto atteso non si è verificato durante l’intervallo previsionale di fine maggio 2000, si può quindi ritenere che i previsori ARMA funzionino meglio per l’orizzonte previsivo settimanale (di 168 ore) che per quello giornaliero (di 24 ore).

(28)

il contrario, o non vi sono pratiche differenze. Pertanto, nella prima situazione l’orizzonte previsivo più indicato sembra essere quello giornaliero, mentre nella seconda è ancora una volta quello settimanale.

3. Infine, per l’intervallo previsivo di novembre, in due dei quattro possibili confronti gli indici

(

24×7

)

MAPE e MAPE

( )

168 presentano scarti minimi (inferiori al punto percentuale), mentre

negli altri due confronti MAPE

(

24×7

)

risulta inferiore a MAPE

( )

168 . A differenza però della settimana precedente, le prestazioni migliori non sono associabili né all’aggiustamento o meno degli outliers, né al numero di parametri del modello.

In definitiva, considerando l’insieme delle previsioni ottenute per le tre settimane in esame, si può trarre la conclusione che i previsori ARIMA sembrano più indicati per le previsioni a 168 ore che per quelle a 24 ore, specialmente quando i loro parametri sono in numero relativamente contenuto e vengono stimati congiuntamente agli outliers.

Con riferimento alle previsioni di Venturini et al. - CESI (2004), limitandosi per brevità, come si è fatto sempre finora, ai confronti tra gli indici medi di MAPE, si può notare che, comparando i valori di

(

24×7

)

MAPE della Tab. 4 con quelli corrispettivi di MAPE

( )

168 della Tab. 5, i primi risultano inferiori ai secondi indipendentemente dalla settimana di previsione considerata. Di conseguenza, la procedura proposta in Venturini et al.- CESI -(2004) sembra “ottimale” per le previsioni con l’orizzonte più breve.

Riferimenti

Documenti correlati

Con riferimento alle esigenze sopra illustrate, è stato pertanto acquisito il preventivo di euro 240,80 più iva, della ditta NIPE DESIGN Srl riferito ad una sedia ergonomica

Le Parti concordano di individuare congiuntamente gli ambiti di intervento, in riferimento ai quali si impegnano ad attuare, sulla base delle specifiche competenze, delle

Si evidenzia comunque che tale clausola non è pertinente per tutte le polizze ma, eventualmente solo per le polizze che prevedono una responsabilità civile verso terzi

(10) Dire, formalizzando la questione e utilizzando il teorema del valor me- dio o di Lagrange, se è vero che «se un automobilista compie un viaggio senza soste in cui la velocità

Per accedere alla prova pratica occorre superare quella teorica che quindi occorre svolgere come prima prova.. L'iscrizione all'esame va fatta

Riguardo alle letture dantesche la maggioranza della classe preferisce che solo alcune volte siano anticipate nello studio a casa degli alunni, e che più spesso si ricorra

Una sola risposta è corretta: individuarla e fornire un’esauriente spiegazione della scelta effettuata.... Determinare il più grande valore di n per cui l’espressione numerica k

Nella programmazione parallela ci sono occasioni in cui alcuni processi non posso procedere fino a quando altri