• Non ci sono risultati.

1.2 Analisi e previsione di rumore acustico con l’utilizzo di un modello a stagionalità multipla

1.2.4 Analisi dell’errore

Un’analisi statistica dell’errore di previsione è stata effettuata sui risultati del modello DSM, utilizzando i metodi presentati nei paragrafi precedenti.

Le statistiche riassuntive dell’errore di previsione del modello a doppia stagionalità sono riportate in tabella I.13. Gli errori sono quelli calcolati sui 474 dati di calibrazione, ossia sono stati esclusi le 26 misurazioni mancanti. L’istogramma di frequenza è mostrato in figura I.22(a).

Tab. I.13: Statistiche riassuntive della distribuzione degli errori stimate per l’intervallo di calibrazione. Media [dBA] Dev.Std. [dBA] Mediana [dBA] Min [dBA] Max

[dBA] skew kurt

(a) (b)

Fig. I.22: (a) Istogramma di frequenza degli errori calcolati per i 474 dati di calibrazione. (b) Grafico quantile-quantile (distribuzione normale ipotizzata) che descrive l’andamento degli errori del modello

DSM applicato ai 474 dati di calibrazione.

Calcolando il t-test nell’ambiente di programmazione di "R", si è potuto concludere che l’errore medio non è statisticamente diverso da zero. In particolare, la statistica t calcolata sugli errori del modello DSM, sui 474 periodi di calibrazione, è 0.6960518 e la probabilità corrispondente di osservare questi errori, se l’ipotesi nulla di media pari a zero fosse stata vera, è risultata di 0.2433691. Questo valore è solitamente considerato troppo alto per rigettare l’ipotesi nulla.

I risultati dei test di Shapiro-Wilk e Jarque-Bera sono riportati nella tabella I.14, mentre il diagramma quantile-quantile è presentato nella figura I.22(b).

Tab. I.14: Test di normalità Shapiro-Wilk e Jarque-Bera applicati agli errori del modello DSM usato per prevedere i 474 dati di calibrazione.

Tipologia di test Statistica del test df p-value

Shapiro-Wilk 0.968 _ 1.176 exp(-8)

Jarque-Bera 109.024 2 < 2.2 exp(-16)

Il p-values riportato nella tabella I.14 per entrambi i test è molto basso confrontato ai livelli di significatività usualmente considerati. Questo risultato fa propendere per il rifiuto dell’ipotesi nulla, che è la normalità della distribuzione degli errori. Questa conclusione sembrerebbe in contrasto con i valori di asimmetria e curtosi e con l’aspetto dell’istogramma. Inoltre il diagramma quantile-quantile mostra che solo una piccola parte dei quantili della distribuzione degli errori devia dalla linea bisettrice. Bisogna considerare che a causa della numerosità del campione i due test di normalità risultano molto severi.

Svolgendo il t-test sui 44 periodi di validazione, si è concluso che l’errore medio non è statisticamente diverso da zero. La statistica t calcolata sugli errori del DSM è -0.7441655 e la corrispondente probabilità di osservare questo set di errori qualora l’ipotesi nulla fosse valida è 0.7695881. Questo valore è generalmente considerato troppo alto per rifiutare l’ipotesi nulla.

-3 -2 -1 0 1 2 3 -4 -3 -2 -1 0 1 2 Normal Q-Q Plot Theoretical Quantiles S a m p le Q u a n til e s

L’istogramma degli errori e il Q-Q plot (diagramma quantile-quantile) sono riportati nella figura I.23, mentre i risultati dei test di Shapiro-Wilk e Jarque-Bera sono presentati nella tabella I.15.

(a) (b)

Fig. I.23: (a) Istogramma di frequenza degli errori calcolati sui 44 periodi di validazione. (b) Grafico quantile-quantile (distribuzione normale ipotizzata) che descrive l’andamento degli errori del modello

DSM applicato ai 44 dati di validazione.

Tab. I.15: Test di normalità Shapiro-Wilk e Jarque-Bera applicati agli errori del modello DSM usato per prevedere i 44 dati di validazione.

Tipologia di test Statistica del test df p-value

Shapiro-Wilk 0.9805 - 0.6542

Jarque-Bera 0.3549 2 0.8374

Il p-values nella tabella I.15 è molto alto confrontato con i livelli di significatività ai quali si fa riferimento in entrambi i test. Questo risultato fa propendere per l’accettare l’ipotesi nulla, ossia la normalità della distribuzione degli errori.

1.2.5 Discussione sui risultati ottenuti

In questo paragrafo si è concentrata l’attenzione sul problema del monitoraggio e della previsione dell’inquinamento acustico nelle aree urbane. È stata effettuata l’analisi statistica di un set di livelli di rumorosità notturna, ottenuti da una stazione di monitoraggio a Messina. Queste misurazioni sono state adottate per la costruzione e la validazione di un modello basato sull’analisi della serie storica. L’obbiettivo principale è stato quello di prevedere i livelli di esposizione alla rumorosità. Questa metodologia parte dall’assunzione che il livello acustico nel tempo è il risultato della composizione di varie componenti: l’andamento di lungo periodo (trend), che è funzione del tempo ed è ottenuto dal lisciamento (smoothing) dei dati osservati; una componente ricorsiva (stagionalità), che descrive la periodicità del fenomeno; ed infine una componente irregolare, non deterministica, che può essere considerata con tecniche

errori del modello con doppia stagionalità sulla validazione

Error [dBA] F re q u e n cy [co u n ts] -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 0 5 10 15 -2 -1 0 1 2 -1 .0 -0 .5 0 .0 0 .5 1 .0 1 .5 Normal Q-Q Plot Theoretical Quantiles S a m p le Q u a n til e s

probabilistiche. Il modello adottato è di tipo misto: moltiplicativo tra il trend e la stagionalità e additivo per considerare la componente irregolare.

È stato considerato un primo set di 321 dati, e grazie all’applicazione di test statistici, è stata evidenziata la presenza di fluttuazioni periodiche. Su questo set di dati è stato costruito un primo modello, considerando una periodicità settimanale, confermata dalla forte autocorrelazione in corrispondenza di un ritardo pari a 7 periodi.

Utilizzando questo primo modello è stato ricostruito un intervallo di 26 misurazioni mancanti ed è stato possibile ottenere un set di dati completo di 500 periodi da poter analizzare. Lo studio del correlogramma di questo ampio set di misurazioni ha confermato la periodicità settimanale dei dati (k1 = 7). Successivamente è stato ottenuto un set di valori privi di questa

prima stagionalità grazie all’applicazione di una media mobile centrata di ampiezza pari a 7 periodi. È stato costruito il correlogramma di questo nuovo set di valori ed è stata evidenziata una seconda periodicità. Le nuove fluttuazioni periodiche sono risultate di più bassa frequenza: la seconda stagionalità è di circa 4 mesi, ossia k2 = 125. Una possibile ipotesi sulla natura di

questa seconda periodicità nei dati è che l’aumento di emissioni acustiche sia registrato in periodi dell’anno corrispondenti ad un incremento del flusso turistico verso la Sicilia. Infatti i picchi di periodicità 125 si registrano in concomitanza alle festività estive e a quelle natalizie. È importante notare che questa ipotesi è accreditata anche dal fatto che la periodicità k = 125 si evidenzia in questo set di misure notturne, dove è lecito ipotizzare che la rumorosità è legata alle attività turistiche invece che a quelle commerciali, che influenzano maggiormente le misure diurne utilizzate nella prima sezione di questo capitolo.

A questo punto il modello a singola stagionalità (SSM) è stato migliorato considerando anche questa seconda periodicità evidenziata sul set di misurazioni esteso facendo così ottenere il più sofisticato modello a doppia stagionalità (DSM). I modelli SSM e DSM sono stati validati comparando le previsioni con 44 misure reali (non usate nella fase di calibrazione). Questi dati di validazione sono stati anche usati per un confronto quantitativo tra le prestazioni dei due modelli. Il modello a doppia stagionalità mostra prestazioni migliori in termini di più bassa deviazione standard della distribuzione degli errori e di una media più vicina allo zero. Inoltre l’applicazione dei test di normalità confermano l’ipotesi di distribuzione normale degli errori nella fase di validazione.

1.3 Un modello di previsione basato sull’analisi delle serie storiche