• Non ci sono risultati.

Un concetto centrale della teoria delle variabili regionalizzate è quello della dipendenza spaziale secondo la quale si assume che i valori dell’attributo oggetto di studio non siano distribuiti casualmente, ma risultino correlati spazialmente (Castrignanò e Buttafuoco, 2004). La dipendenza spaziale fa cadere i presupposti fondamentali della statistica classica, per cui è necessario seguire un approccio alternativo. La teoria delle variabili regionalizzate è ben formulata matematicamente e applicata con successo in numerosi ambiti, da quello più propriamente geologico, in cui ebbe origine, a quello delle scienze ambientali o, più recentemente, di quelle biomediche. I concetti esposti sono riferibili ad un qualsiasi sistema fisico-biologico. Secondo la teoria delle variabili regionalizzate, la variazione spaziale di una qualunque proprietà può essere espressa come la somma di 3 componenti principali:

1. una componente deterministica, relativa ad un valore medio costante o ad una variazione graduale a lungo raggio, generalmente descritta da un polinomio (trend); 2. una componente casuale correlata spazialmente;

3. un rumore (“white noise”) o errore residuo non correlato spazialmente.

Se con xi indichiamo il vettore posizione, allora la variabile spaziale Z nel punto xi è data da: ·+€¸.  ¹+€¸.  º»+€¸.  º¼¼ 3.1

dove m(xi) è una funzione deterministica che descrive la componente di trend; ε’(xi) rappresenta il residuo da m(xi) di natura stocastica, variabile localmente e dipendente spazialmente, e ε’’ il termine di errore, indipendente spazialmente, con media zero e varianza σ2.

I concetti fondamentali su cui si basa la geostatistica sono le funzioni casuali, le variabili regionalizzate e la stazionarietà.

Per variabile casuale si intende una qualsiasi proprietà che si suppone vari secondo una determinata legge di distribuzione delle probabilità. Tale variabile risulta pertanto determinata dai parametri caratteristici di detta distribuzione, quali, per esempio, la media e la varianza nel caso di distribuzione normale.

A tal proposito occorre ricordare che il valore medio di una variabile casuale è detto valore atteso (o speranza matematica) e viene indicato come E[z]=µ. In generale, se z è una variabile casuale discreta che assume i valori z1, z2... con probabilità P(z1), P(z2),... il suo valore atteso è dato da:

½t¾u  M ¾¸=+¾¸. o

ƒ

3.2

Se z è una variabile casuale continua, con funzione di densità di probabilità f(z), l’espressione del valore atteso diventa:

½t¾u  ¿ ¾¸=+¾¸. ÀÁ

{Á Q¾ 3.2

Analogamente, la varianza di una variabile casuale è definita da:

Â]^+¾.  ½Ãt¾ w ½+¾.u Ä  k 3.4

Una variabile regionalizzata z(x) (rappresentata da una lettera minuscola) è una variabile casuale, definita nello spazio. Ne segue, pertanto, che una variabile regionalizzata può essere considerata una particolare manifestazione o “realizzazione” di una variabile casuale, per ogni fissata posizione x all’interno della regione di spazio considerata. Le variabili regionalizzate non sono indipendenti le une dalle altre e rappresentano i campioni reali, mentre la variabile casuale è un modello matematico statistico.

Se si considerano tutti i possibili valori che la z(x) può assumere in tutti i punti dello spazio, si ha che essa diventa un membro di una serie infinita di variabili casuali a cui si dà il nome di funzione casuale, Z(x) (rappresentata da una lettera maiuscola).

Tutte le variabili casuali che compongono tale serie godono della proprietà di essere caratterizzate dalla stessa funzione di probabilità cumulata, F(z), indipendente dalla posizione x.

Per poter fare inferenza statistica è necessario che le variabili regionalizzate soddisfino una qualche ipotesi di “stazionarietà”, ovvero di omogeneità statistica applicata ai momenti statistici di un determinato ordine. Esistono diversi tipi di stazionarietà:

• Una funzione casuale, Z(x), si dice stazionaria di primo ordine se, per ogni punto x, si verifica che:

2. ½t·+€. w ·+€  Å.u  0

dove m rappresenta la media nella statistica classica; ; dove h è il vettore distanza fra due punti di campionamento e [Z(x) – Z(x+h)] è detto

residuo.

• Verificata la stazionarietà del primo ordine, si ha una stazionarietà del secondo ordine quando la covarianza spaziale C(h) di ogni coppia di valori z(x) e z(x+h) è indipendente da x e funzione unicamente del vettore distanza h, ovvero:

<+Å.  ½t+·+€. w ¹. w +·+€  Å. w ¹.u 3.5

Dalla stazionarietà della covarianza segue, facilmente, la stazionarietà della varianza campionaria s2. Infatti, ponendo nella precedente relazione h = 0, si ottiene:

<+0.  ½t+½+¾. w ¹. u  k 3.6

• La stazionarietà del secondo ordine non si applica nei casi in cui varianza e covarianza non siano finite, come nei fenomeni in cui sia presente un trend, nel qual caso si assume un’ipotesi più debole, detta ipotesi intrinseca, che richiede che, per tutti i vettori h, la varianza del residuo Z(x) - Z(x+h) sia finita ed indipendente dalla

posizione x, ovvero: :

Â]^t·+€. w ·+€  Å.u  ½t·+€. w ·+€  Å.u  2Æ+Å. 3.7

Dividendo detta varianza per 2, si ottiene la statistica γ(h), detta semivarianza o semivariogramma.

A questo punto conviene fare alcune considerazioni interessanti:

1. l’ipotesi di stazionarietà è una decisione fatta da un esperto che stabilisce quale area possa essere assunta statisticamente omogenea, il che comporta in pratica la delimitazione di un’area geografica all’interno della quale ha senso effettuare le operazioni di media. L’ipotesi di stazionarietà permette di trattare insieme, rappresentandoli con un unico istogramma delle frequenze, dati rilevati in punti o in istanti differenti. La decisione di stazionarietà è quindi particolarmente critica ai fini della rappresentatività e affidabilità degli strumenti geostatistici utilizzati: trattare insieme, per esempio, più unità di suolo può, in realtà, mascherare molte importanti differenze geopedologiche; d’altra parte, suddividere i dati in un numero eccessivo di classi di suolo può condurre ad una statistica non affidabile, perché non rappresentativa a causa del limitato numero di campioni ricadenti in ciascuna classe. Una regola generale, quando si vuol fare inferenza statistica, è quella di trattare insieme la maggiore informazione possibile, al fine di ottenere previsioni attendibili. La stazionarietà non è quindi una proprietà reale, bensì dipende dal modello spaziale

adottato e dagli obiettivi specifici dell’indagine. Può pertanto cambiare, qualora varino la scala spaziale e/o la disponibilità di dati sperimentali. Nel caso in cui l’obiettivo dello studio sia di tipo generale o globale, le proprietà locali possono venire opportunamente mediate; al contrario, sarà necessario intensificare il campionamento se si vogliono rilevare ulteriori differenze statisticamente significative ad una scala di dettaglio più fine.

2. Le variabili regionalizzate non sono indipendenti le une dalle altre e rappresentano i campioni reali, mentre la variabile casuale è un modello matematico statistico.

3. Esistono iversi strumenti statistici che permettono di tradurre in termini formali e, quindi, di quantificare l’ipotesi fondamentale di continuità spaziale per le variabili regionalizzate, quali la covarianza, la semivarianza e la correlazione spaziale o coefficiente di correlazione, ρ(h), così definita: :

Ç+Å. È+_.È+A. 3.8

ρ(h), detto anche correlogramma, rappresenta, il rapporto fra la covarianza spaziale e la varianza campionaria della variabile regionalizzata z(x) e può essere determinata solo nel caso in cui sia valida l’ipotesi di stazionarietà del secondo ordine.