• Non ci sono risultati.

La previsione dei consumi idrici urbani attraverso reti neurali (2007)

Calaon propone una versione dello stimatore basato sul valore dell’erogato dell’anno precedente, ampliato o diminuito in base al valore di un coefficiente termico e alla differenza di temperatura. Si tratta di un caso particolare del modello di Davanzo, nel quale il coefficiente rˆ è calcolato soltanto con i dati dell’anno precedente e la stima i

del consumo totale annuo si ricava per trasposizione di quanto realizzato l’anno precedente. In luogo del coefficiente αˆ viene utilizzato il coefficiente termicoi

settimanale rappresentato nel grafico di Figura 2.7 che ne è sostanzialmente una versione semplificata. A titolo di esempio, per la 28a settimana il consumo può essere stimato sulla base di quanto erogato la medesima settimana dell’anno precedente, aumentato (o ridotto) del 2% per ogni grado in più (o in meno) rispetto alla temperatura dell’anno precedente.

Figura 2.7 - Coefficiente termico al variare della settimana.

2.3 La previsione dei consumi idrici urbani attraverso

reti neurali (2007)

Il 28 e 29 giugno 2007 si è tenuto a Ferrara un convegno sul tema “Approvvigionamento e distribuzione idrica: esperienze, ricerca ed innovazione” nel quale è stato presentato un modello di previsione dei consumi idrici che si basa sull’utilizzo di reti neuronali artificiali. È uno studio che pone evidenza sulla metodologia seguita per il calcolo dei pesi della rete neurale, per i quali viene utilizzato un algoritmo di tipo Bayesiano “Shuffled Complex Evolution Metropolis – Uncertainty Assessment” (SCEM-UA) (Campisano et al., 2007).

Sono state sviluppate due famiglie di modelli: una per la previsione dei consumi idrici a scala oraria con orizzonte temporale di 1 ora, 2 ore, …, 24 ore e una per la previsione giornaliera con orizzonte di 1 giorno, 2 giorni,…, 7 giorni.

Le reti neuronali artificiali utilizzate sono del tipo feedforward con un singolo strato nascosto. Le funzioni di attivazione dello strato di input e intermedio sono di tipo logistico, quelle dello strato di output di tipo lineare. Per gli aspetti metodologi e teorici sulle reti neurali si rimanda al Capitolo 4.

Il numero di neuroni presenti nello strato nascosto varia con gli orizzonti temporali in funzione di un migliore adattamento della rete, mantenendo un valore non superiore al doppio del numero di neuroni dello strato di input, al fine di ridurre la possibilità di overfitting.

I modelli sono stati realizzati su una parte della rete di distribuzione della città di Catania la cui utenza è rappresentativa dell’intera rete di distribuzione cittadina, e hanno riguardato il periodo di osservazione 1/1/2003 – 31/12/2004. Sono stati utilizzati i dati dell’anno 2003 per la calibrazione dei modelli e quelli dell’anno 2004 per la validazione.

Le prestazioni dei modelli costruiti sono comparate con altri 3 metodi di stima: il primo basato sempre su reti neuronali con algoritmo di calibrazione dei parametri di tipo Bayesiano, il secondo su un modello regressivo lineare e il terzo su sistemi inferenziali di neuro-fuzzy (ANFIS). A tale scopo è stato calcolato, per i modelli realizzati, l’indice di efficienza EI di Nash e Sutcliffe (1970):

(

)

(

)

2 2 1

− − − = mean obs pred obs f f f f EI , (2.15) Dove: obs

f = valore reale osservato,

pred

f = valore previsto dal modello,

mean

f = valore medio delle osservazioni.

L’indice assume valore 1 in caso di previsione coincidente con i valori reali, valore 0 nel caso la bontà della stima sia equivalente alla semplice media dei dati reali e valori negativi nei casi in cui la media sia migliore delle stime prodotte dal modello.

La bontà dell’adattamento della rete calibrata mediante l’algoritmo SCEM-UA è paragonabile a quella degli altri modelli basati sulle reti neurali e superiore a quanto realizzato mediante modelli di regressione lineare, sia considerando le previsioni a scala giornaliera, sia considerando quelle a scala oraria. Il vantaggio della soluzione proposta risiede nella possibilità di fornire un intervallo di confidenza per i valori stimati.

2.3 - La previsione dei consumi idrici urbani attraverso reti neurali (2007) 27

2.3.1 La previsione a scala giornaliera

Nei modelli di previsione a scala giornaliera, indicando con t l’ultimo giorno del quale si conosce il consumo idrico realizzato, l’obiettivo è la stima del valore del consumo del giorno t+i, dove i rappresenta l’orizzonte temporale di previsione e assume valori da 1 a 7. Per ogni valore di i viene costruito uno specifico modello basato su reti neurali.

Ciascun modello presenta 3 neuroni di input corrispondenti alle seguenti variabili:

t

Q consumo idrico giornaliero al tempo t , cioè l’ultimo valore disponibile; i

t+

ξ assume valore 0 o 1 e caratterizza il giorno t+i rispettivamente come feriale o festivo;

i t

d+ assume valori da 1 a 7 e specifica il giorno di previsione t+i all’interno della settimana.

Il neurone dello strato di output, corrispondente al consumo idrico stimato al tempo

i

t+ , viene indicato con Qt+i.

I modelli realizzati, al variare dell’orizzonte temporale di previsione, hanno mostrato buone capacità predittive come si può verificare dal grafico di Figura 2.8. I valori dell’indice di efficienza di Nash-Sutcliffe ottenuti nel caso di reti neurali SCEM-UA sono comparabili con i valori ottenuti mediante reti neurali Bayesiane e lievemente migliori dei valori relativi ai modelli basati su leggi di regressione e i modelli ANFIS. In aggiunta, si è osservato un decadimento della capacità predittiva dei diversi modelli al crescere dell’orizzonte temporale di previsione.

Figura 2.8 - Indice EI per i modelli giornalieri al variare dell'orizzonte temporale

2.3.2 La previsione a scala oraria

Nei modelli di previsione a scala oraria, indicando con t l’ultima ora per la quale si conosce una registrazione del consumo idrico realizzato, l’obiettivo è la stima del valore del consumo all’ora t+h, dove h rappresenta l’orizzonte temporale di previsione e assume valori da 1 a 24. Per ogni valore di h viene costruito uno specifico modello basato su reti neurali.

Ciascun modello presenta 4 neuroni di input corrispondenti alle seguenti variabili:

t

Q consumo idrico giornaliero all’ora t , cioè l’ultimo valore orario disponibile; h

t+

ξ assume valore 0 o 1 e caratterizza il giorno relativo all’ora t+h

rispettivamente come feriale o festivo;

h t

d+ assume valori da 1 a 7 e specifica il giorno relativo all’ora di previsione t+h

all’interno della settimana;

h t+

ϑ

assume valori da 1 a 24 e specifica l’ora di previsione all’interno del giorno. Il neurone dello strato di output, corrispondente al consumo idrico stimato per l’ora

h

t+ , viene indicato con Qt+h.

Anche per questa classe di modelli è stata condotta una comparazione con i modelli equivalenti già descritti in precedenza. Nel grafico di Figura 2.9 si possono osservare i valori dell’indice di efficienza di Nash-Sutcliffe per valutare la bontà delle diverse soluzioni: i modelli basati su reti neurali SCEM-UA sono comparabili con i valori ottenuti mediante reti neurali Bayesiane e lievemente migliori dei valori ricavati mediante le leggi di regressione e i modelli ANFIS.

Figura 2.9 - Indice EI per i modelli orari al variare dell'orizzonte temporale di previsione

Capitolo 3

-

Aggiornamenti e nuovi modelli di

previsione per i consumi idrici

urbani

In questo capitolo viene dapprima verificata l’attualità della problematica della previsione dei consumi idrici a Padova e la sussistenza delle condizioni necessarie a renderla tutt’oggi di interesse. Fatto ciò, dopo aver presentato il dataset attuale a disposizione, sono state condotte analisi per la stima del consumo idrico applicando diversi modelli confrontandoli poi sulla base di indicatori.

Per spiegare il dataset utilizzato si è proceduto illustrando l’origine dei dati raccolti, descrivendo tutte le variabili che lo compongono ed infine elaborando statistiche descrittive su queste ultime.

Le analisi per la stima del consumo idrico vengono condotte dapprima applicando i modelli Acegas-Aps al dataset attuale e poi costruendo diverse soluzioni mediante l’applicazione di alcuni modelli statistici, in particolare regressione lineare, reti neurali e Random Forests.

Per agevolare i riferimenti ai modelli proposti, ciascuno di essi è identificato da un codice che viene riportato tra parentesi nel titolo del paragrafo nel quale viene presentato.

Per le ultime due tipologie di modelli (reti neurali e Random Forests) è possibile trovare un approfondimento teorico nel Capitolo 4. Per migliorare la leggibilità, i comandi per la costruzione dei modelli realizzati mediante il software R, nonché gli output che ne riportano le caratteristiche, sono riportati in Appendice.

Nella logica costruttiva dei modelli di Acegas-Aps il riferimento temporale è la settimana. In essi viene stimato il consumo per l’intera settimana di interesse ed in seguito questo viene ripartito nei giorni che la compongono. Nei nuovi modelli elaborati la logica è inversa: vengono dapprima stimati i consumi giornalieri per i singoli giorni e in seguito questi vengono combinati al fine di produrre modelli settimanali. Tale aggregazione è stata fatta solo per i modelli basati su reti neurali e

su Random Forests che meglio si adattavano alla rappresentazione della problematica.

Nell’ultimo paragrafo (§3.7) si presenta un’analisi comparativa dei modelli elaborati sulla base delle prestazioni e delle caratteristiche che possano rendere conveniente l’adozione di una soluzione rispetto ad un’altra, viene redatto anche un quadro d’insieme dei modelli elaborati e si espongono le considerazioni conclusive del presente lavoro.

Documenti correlati