• Non ci sono risultati.

Correlazione con le aree di innesco delle colate rapide

8. ERODIBILITA' DEL SUOLO E COLATE RAPIDE DI FANGO E DETRITO

8.2 Correlazione con le aree di innesco delle colate rapide

8.2.1 Considerazioni statistiche preliminari

La verifica dei legami statistici tra indice di erosione del suolo e distribuzione delle colate rapide può essere effettuata mediante un'analisi di regressione logistica spazializzata, cioè un tipo di analisi finalizzata ad assegnare un valore di probabilità che una colata rapida abbia luogo, tenendo conto anche della variabilità spaziale dei dati osservati. Questo tipo di analisi necessita,

118

però, di un accurato piano di campionamento ovvero di formazione del campione statistico. L'inventario dei fenomeni franosi nei bacini dei torrenti Mili, Briga e Giampilieri ammonta a 1259 eventi, un numero molto limitato rispetto alla griglia sulla base della quale è stato determinato l'indice di erosione RUSLE. A tale proposito, si può ricorrere a diverse soluzioni (Ramani et al., 2011), onde ottenere un campione sufficientemente rappresentativo. Nel presente caso, si è deciso di adottare un campione bilanciato con uguale proporzione di osservazioni corrispondenti a colate rapide ed osservazioni non registrate come tali. Dalla griglia RUSLE sono stati estratti in modo casuale 1259 casi, corrispondenti a punti dello spazio non interessati da colata rapida, a condizione che essi fossero ubicati ad almeno 100 metri dal più vicino punto interessato da colata rapida, allo scopo di favorire una migliore distribuzione spaziale. A questi casi si sommano i 1259 corrispondenti a punti realmente registrati come colata rapida. Il dataset ottenuto si compone quindi di 2518 osservazioni, con una probabilità a priori di evento di colata rapida pari al 50%. La figura 6 evidenzia la distribuzione spaziale dell'indice RUSLE in relazione alla distribuzione dei punti corrispondenti alle colate rapide censite (punti neri).

Ad un livello eminentemente descrittivo di analisi, si osserva una forte tendenza alla concentrazione dei fenomeni di colata in particolari aree dei bacini osservati. L' 87% dei punti interessati dagli eventi di frana è infatti concentrato nell'area orientale, mentre il 75% dei punti privi di tali fenomeni si trova nell'area occidentale (tab. 4). L'analisi della Nearest Neighbor

Distance, come riportata in tabella 5, conferma la non casualità di questa tendenza (p < 0.001). Il

valore medio dell'indice RUSLE nell'area orientale è pari a 137 Mg/ha/anno, contro il valore di 103 Mg/ha/anno dell'area occidentale.

Ad un ulteriore livello di analisi, si è deciso di "dicotomizzare" l'indice RUSLE nelle categorie "basso/medio-basso" e "alto/medio-alto", introducendo un valore di cutoff convenzionale, corrispondente a 50 Mg/ha/anno. In tal modo si è cominciata ad evidenziare una relazione significativa tra colate censite e valore dell'indice di erosione (tab. 6). A questo punto si è potuto ragionevolmente procedere all'identificazione e validazione di un modello di regressione, passando da un livello descrittivo ad un livello esplicativo.

Figura 6 - Carta della distribuzione dell'indice RUSLE nei bacini Mili, Giampilieri e Briga in relazione alle colate rapide osservate (punti neri)

119

Presenza di colata Assenza di colata

Ovest 13 75

Est 87 25

totale 100 100

Tabella 4 - Occorrenza di colate rapide di detrito per settori di bacino (%)

Mili Giampilieri Briga

Area (m2) 5943637 10396924 10124084

n° di eventi osservati 140 531 588

Distanza media osservata 47.21 39.22 32.63

Distanza media attesa 103.02 69.96 65.61

Errore standard 4.55 1.59 1.41

z value 12.26 19.37 23.32

p value 0.0000 0.0000 0.0000

Tabella 5 - Statistici dall'analisi della Nearest Neighbor Distance nei tre bacini.

Indice RUSLE Presenza di colata Assenza di colata

Basso e Medio-basso (< 50) 205 (16%) 627 (49%)

Alto e Medio-alto (> 50) 1054 (84%) 632 (51%)

totale 1259 (100%) 1259 (100%)

Tabella 6 - Numero di successi ed errori nella previsione di colate di detrito mediante dicotomizzazione dei valori dell'indice RUSLE

8.2.2 Considerazioni sulla tecnica statistica adottata

Per la scelta del modello statistico ci si è orientati verso la regressione logistica spazialmente vincolata, segnatamente la tecnica GWR - Geographically Weighted Regression (Fotheringham, et al. 2000, 2002), implementata nell'omonimo software, versione 3.0. Un altro

software utilizzato è costituito dal GeoDa, specialmente per l'analisi spaziale di auto-

correlazione. In generale, l'analisi di regressione logistica, di cui la GWR costituisce una particolare versione, è una tecnica che lega la probabilità di occorrenza di un determinato fenomeno, o variabile dipendente, ad una serie di variabili indipendenti. Il valore aggiunto della tecnica GWR è dato dalla stima dei coefficienti, l’intercetta e la pendenza della retta di regressione, in ciascun punto geografico dell’area di studio. In altre parole, l'analisi attraverso la GWR restituisce un'equazione per ciascun punto esaminato nello spazio fisico anziché produrre una singola equazione generale. Il risultato è la restituzione di una vera e propria mappatura geografica dei valori di sensibilità alle colate rapide. Prima di illustrare nel dettaglio la specifica tecnica GWR, è opportuno richiamare alcuni elementi generali dell'analisi di regressione logistica, di qui in avanti definita regressione “globale”.

Nel modello logistico globale la variabile dipendente dicotomica (Y) è rappresentata dal verificarsi dell'evento di colata rapida, che assume i valori ‘0’ e ‘1’, rispettivamente, in caso di assenza ("falso") o presenza ("vero") di tale evento. La variabile indipendente (X) è rappresentata dall'indice RUSLE. La ragione per cui un modello globale spesso fallisce quando viene applicato a dati spaziali è perché non rispetta le assunzioni di base del modello. Queste possono essere così sintetizzate: si assume che le osservazioni siano indipendenti e che i residui non siano affetti da errore sistematico. In particolare, dato che vengono trattati dati georiferiti, ci si aspetta che i residui, una volta rapportati alla carta geografica, non siano distribuiti in maniera sistematica, ovvero non mostrino un trend di natura spaziale. Questo è molto spesso proprio il punto debole della regressione logistica globale, e quando si verifica indica che le osservazioni

120

non sono indipendenti le une dalle altre. Tale fenomeno è ben noto in letteratura col termine di "autocorrelazione spaziale", basato sull'osservazione di Tobler (1970) che “qualunque oggetto è correlato agli altri, ma oggetti vicini sono più correlati degli oggetti lontani". Se, come appare ampiamente ipotizzabile e come viene empiricamente verificato, le colate rapide mostrano una tendenza all’autocorrelazione spaziale, anche i residui del modello tradizionale di regressione logistica possono essere affetti da autocorrelazione spaziale. Il rischio, in questo caso, è di ottenere stime distorte ed inefficienti, ovvero con un errore standard troppo ampio e valori errati o addirittura di segno opposto al valore reale. Tale problema è stato affrontato nel recente passato nella letteratura statistica (Anselin, 1988) attraverso svariate tecniche. Nell'approccio utilizzato nella presente indagine è stata considerata la tecnica Geographically Weighted

Regression (Brunsdon et al., 1996; Fotheringham et al., 1996; 1997; 2002). Tale tecnica è in

grado di gestire con maggiore efficienza il problema dell'autocorrelazione spaziale, producendo stime più accurate. Questa consiste nell'attribuire pesi differenti a ciascuna osservazione, mediante un metodo iterativo, al fine di massimizzare la rispondenza della variabile dipendente. I pesi sono legati alla posizione geografica di ogni osservazione, in maniera tale che ogni osservazione abbia influenza maggiore su quella più vicina e via via minore su quelle più lontane. Lo schema di pesi adottato è una funzione dei quadrati delle distanze:

(

)

in cui dij esprime la distanza osservata tra la i-esima e la j-esima osservazione e h denota il valore di bandwidth, ovvero l’estensione spaziale entro la quale computare la ponderazione. Il valore di bandwidth si pone quindi come parametro di smussamento o, in altre parole, un parametro di continuità tra le osservazioni. La funzione di cui sopra indica che più alto è tale valore più la regressione GWR è simile alla regressione tradizionale non-spaziale. Inoltre, minore è la distanza, maggiore è il peso che l'osservazione i-esima esercita sull'osservazione j- esima. L'espressione generale:

[ ]

può essere riscritta nella forma:

[ ]

Dove ui, νi sono le coordinate dei punti nello spazio. In tal modo, mediante la tecnica GWR, si

possono ottenere stime dei parametri, ovvero i coefficienti di regressione, noti come intercetta e pendenza, per ogni punto osservato. È così possibile, nel caso della nostra indagine, misurare punto per punto la sensibilità al fattore erosione. I "pesi" risultati dalla nostra indagine, tuttavia, non sono applicabili ad altre aree al di fuori di quella considerata, e la validità del modello scaturito è circoscritta all’ambito considerato. Lo scopo principale del presente studio, infatti, è di dimostrare la connessione empirica tra indice di erosione ed eventi di colata rapida in riferimento al territorio di Messina piuttosto che definire una legge generale di correlazione.

Documenti correlati