• Non ci sono risultati.

DIAGRAMMA DI DISPERSIONE

Nel documento Parte II 1.MISURAZIONE (pagine 71-76)

MODELLO OUTPUT

2. la funzione covarianza o del secondo momentotra due punti x e x’:

1.2.2 DIAGRAMMA DI DISPERSIONE

Nella maggior parte dei set di dati relativi alle scienze della terra esiste una continuità spaziale. Valori campionati in due punti vicini tra loro hanno una probabilità maggiore di essere simili rispetto a quelli campionati in punti lontani. Quando si osserva una mappa a curve di livello, i valori non appaiono casualmente distribuiti, ma sembra invece che i valori più piccoli stiano vicini ad altri valori piccoli e viceversa per quelli grandi. Alcuni strumenti statistici usati per descrivere le relazioni che intercorrono tra due variabili possono essere usati con successo anche per descrivere le relazioni che intercorrono tra il valore di una variabile e quello della stessa variabile campionato in un punto vicino. Il diagramma di dispersione è uno di questi strumenti e può essere usato, insieme ad alcuni parametri ad esso associabili, per descrivere la continuità spaziale di una variabile.

Il diagramma di dispersione è in grado di rappresentare tutte le possibili coppie di dati le cui posizioni sono separate da una fissata distanza h in una particolare direzione.

Indichiamo con x la posizione di un generico punto di coordinate (x,y) e con x+h quella di un punto che dista h dal primo. Si indichi con z(x) il valore assunto da una funzione generica nel punto x, e z(x+h) il valore assunto nel punto x+h. La funzione z(x) è detta regionalizzata, nel senso che è definita su un dominio spaziale, ovvero il suo valore dipende dalla localizzazione del punto espresso dalle sue coordinate spaziali. Se ora si fanno assumere al primo punto n posizioni all’interno del dominio in esame, tali che il secondo punto, posizionato sempre a distanza h, stia anch’esso all’interno del campo, si ottengono n coppie di valori z(x)-z(x+h) che possono essere graficati per dar luogo a una nuvola di correlazione (o dispersione). La nuvola di dispersione ci dà un’informazione precisa su come i valori dei dati sono continui per una certa distanza in una data direzione.

Rappresentando diversi diagrammi di dispersione per diversi valori crescenti di h, si nota come, all’aumentare della distanza nella direzione stabilita, vari la continuità spaziale della variabile considerata.

a)

b)

c)

FIG 2. Nuvola di dispersione in relazione alla distanza |h| tra due punti.

In generale, per |h| piccolo, i punti sono pressoché allineati lungo la bisettrice x=y del primo quadrante (FIG 2.a); all’aumentare di |h|, la nuvola si disperde (FIG 2.b) fino a dar luogo a una dispersione che sembra costante (FIG 2.c). Naturalmente per |h|=0 i punti della nuvola si collocano esattamente sulla bisettrice.

Come si richiede spesso nel caso di rappresentazioni grafiche caratteristiche di fenomeni naturali, anche in questo caso è indispensabile definire uno o più parametri capaci di riassumere e quantificare le informazioni contenute del diagramma di dispersione. La caratteristica principale è data dall’ampiezza della nuvola. Un parametro che viene usato per quantificare tale aspetto è il coefficiente di correlazione. Se si grafica tale coefficiente (FIG3.)

xi

xi+h

xi

xi+h

xi

xi+h

zi

zi+h

zi+h

zi+h

zi

zi

si ottiene una curva che esprime, limitatamente alla direzione in esame, la variabilità spaziale di z(x).

1.2.3 VARIOGRAMMA

Un indice alternativo al coefficiente di correlazione è la covarianza empirica. Tale coefficiente è definito come:

C (x,x+h) = E{z(x) · z(x+h)}- E{z(x)} · E{z(x+h)}

Se la funzione covarianza è invariante per traslazione, cioè non dipende dalla posizione particolare dei due punti ma solo da |h|, e se anche il momento primo3 è invariante per traslazione, si può scrivere:

C (h) = E{z(x) · z(x+h)}- m2

La covarianza è una funzione pari e generalmente decresce con la distanza fino ad annullarsi quando z(x) e z(x+h) diventano indipendenti.

Un altro importante indice rappresentativo dell’ampiezza della nuvola di dispersione è il cosiddetto momento di inerzia riferito alla retta x=y, che è pari a:

momento di inerzia = 1/2n Σ(xi – yi)2 i = 1….n

3 Dato un punto qualsiasi x appartenente a un dominio S e definita una V.A z(x), si definisce momento primo:

E[z(x)] = m (x) .

h1 h2

1

ρ(h)

h

FIG 3. Correlazione della coppia in funzione della distanza |h|.

Questa espressione rappresenta la metà della media delle differenze quadrate delle coordinate x e y di ogni coppia di punti. A differenza dei precedenti parametri caratteristici della continuità spaziale, il momento di inerzia aumenta all’allargarsi della nuvola di dispersione.

La relazione tra il momento di inerzia e il vettore h è tradizionalmente chiamato semivariogramma o, semplicemente, variogramma γ(h).

In geostatistica si preferisce lavorare con il variogramma. Esso è definito come la semi-varianza dell’incremento della variabile tra due punti.

γ(x,h) = 1/2 var {z(x)- z(x+h)}

Il variogramma è una funzione pari ed è una misura della variabilità del parametro di studio in funzione della distanza. Il suo valore generalmente cresce con la distanza.

Nel caso in cui vi è stazionarietà, il variogramma è funzione della sola h ed è dato da:

γ(h) = 1/2 E {[z(x) - z(x+h)]2}

Esso è legato alla covarianza dalla seguente relazione:

γ(h) = C(0)– C(h)

Poiché C(h) è sempre minore o uguale a C(0), si ha che, nel caso di stazionarietà, il variogramma è sempre limitato ed il limite è costituito da C(0).

C(0) γ(h)

C(h) h

FIG 4. Confronto tra l’andamento della funzione di covarianza e della funzione variogramma

E’ possibile dimostrare che :

γ(0) = 0 e che γ(h) = γ(-h)

Questo comporta che il variogramma calcolato per una qualunque direzione sarà identico a quello calcolato per la direzione opposta.

Il variogramma è lo strumento basilare per l’analisi delle variabili regionalizzate. Esso costituisce, tra l’altro, il modello più semplice per interpretare in senso probabilistico una VR. La funzione variogramma viene stimata coi dati di campionatura attraverso il calcolo, nelle diverse direzioni, di variogramma sperimentali.

a) b)

FIG 5. Disposizione dei punti secondo una griglia regolare (b) e irregolare (a).

Nella pratica della determinazione dei variogrammi sperimentali, spesso si è costretti ad operare delle approssimazioni. Un problema che si incontra sempre è legato al numero delle coppie di valori ad una data distanza h. Infatti, raramente nei casi reali di monitoraggio si dispone di siti di campionamento disposti su griglie regolari (FIG 5.b), ma questi sono in genere disposti in maniera casuale sul territorio (FIG 5.a). Questa casualità nella disposizione dei punti di campionamento comporta una variabilità continua del vettore h sul territorio considerato. Per ovviare a ciò si specifica una tolleranza sia sul distanza (∆r) che sulla sua direzione (∆ϕ). Così facendo tutte le coppie di campioni aventi distanza compresa tra r –∆r e r + ∆r, e allineate secondo una direzione compresa tra ϕ - ∆ϕ e ϕ + ∆ϕ, contribuiscono al calcolo del variogramma. Le tolleranze da adottare dipendono ovviamente dalla quantità di campioni di cui si dispone. E’ comunque di uso abbastanza frequente calcolare i variogrammi sperimentali per distanze multiple di una distanza di base, chiamata passo.

Nel documento Parte II 1.MISURAZIONE (pagine 71-76)