• Non ci sono risultati.

Analisi spaziotemporale della concentrazione di clorofilla nella costa settentrionale del Cile : un approccio geostatistico

N/A
N/A
Protected

Academic year: 2021

Condividi "Analisi spaziotemporale della concentrazione di clorofilla nella costa settentrionale del Cile : un approccio geostatistico"

Copied!
112
0
0

Testo completo

(1)

Scuola di Ingegneria Industriale e dell'Informazione

Corso di Laurea Magistrale in Ingegneria Matematica

Analisi spaziotemporale della concentrazione

di clorolla nella costa settentrionale del Cile:

un approccio geostatistico

Relatore: Prof.ssa Alessandra Guglielmi Correlatore: Prof. Emilio Porcu

Tesi di Laurea Magistrale di: Viola Melis Matr. 799475

(2)

Indice

Abstract 9 Introduzione 11 1 I modelli geostatistici 15 1.1 Introduzione . . . 15 1.2 I dati geostatistici . . . 16

1.3 Le ipotesi del modello gaussiano stazionario . . . 17

1.3.1 Il campionamento non preferenziale . . . 17

1.3.2 La stazionarietà debole, in senso stretto e intrinseca. L'isotropia . . . 18

1.3.3 La gaussianità e l'indipendenza . . . 19

1.4 Il modello stazionario gaussiano . . . 20

1.5 Le funzioni di covarianza e correlazione. Il variogramma . . . 21

1.5.1 Covarianza e correlazione . . . 21

1.5.2 Il variogramma . . . 22

1.5.3 Continuità e dierenziabilità . . . 25

1.6 Alcuni modelli isotropici di correlazione . . . 26

1.6.1 La famiglia di Matérn . . . 28

1.6.2 La famiglia sferica . . . 30

1.7 Estensioni del modello stazionario gaussiano . . . 30

1.7.1 Rilassamento dell'ipotesi di stazionarietà . . . 31

(3)

1.8 I modelli lineari generalizzati geostatistici . . . 34

2 La stima classica dei parametri 36 2.1 Introduzione . . . 36

2.2 La stima della media . . . 37

2.3 La stima non parametrica del variogramma . . . 38

2.4 La stima parametrica del variogramma . . . 39

2.4.1 Il metodo dei minimi quadrati . . . 39

2.4.2 La massima verosimiglianza classica e ristretta . . . 40

2.4.3 La verosimiglianza composita . . . 42

2.5 Alcuni criteri per la selezione del modello . . . 45

3 La previsione spaziale 48 3.1 Introduzione . . . 48

3.2 Il previsore a errore quadratico medio minimo . . . 49

3.3 Il kriging lineare gaussiano . . . 50

3.3.1 Il kriging semplice . . . 51

3.3.2 Il kriging universale e il kriging ordinario . . . 52

3.3.3 Alcune considerazioni . . . 54

3.3.4 I target lineari . . . 55

3.4 Il kriging gaussiano trasformato . . . 55

3.5 La cross validation . . . 56

4 I modelli geostatistici spaziotemporali 58 4.1 Introduzione . . . 58

4.2 Il modello gaussiano stazionario spaziotemporale . . . 60

4.3 Alcune proprietà della covarianza spaziotemporale . . . 62

4.4 Alcuni modelli di covarianza e correlazione . . . 64

4.4.1 Il punto di vista sico . . . 64

4.4.2 Un esempio di correlazione separabile . . . 65

4.4.3 Alcuni modelli non separabili . . . 65

(4)

5 La concentrazione di clorolla nella costa settentrionale del

Cile 69

5.1 Introduzione . . . 69

5.2 Descrizione del fenomeno sico . . . 71

5.3 Descrizione del dataset e scelta della regione di studio . . . 74

5.4 L'approccio geostatistico . . . 77

5.4.1 Analisi esploratoria . . . 77

5.4.2 Una prima analisi del mese di marzo . . . 80

5.4.3 Rilassamento delle ipotesi del modello gaussiano sta-zionario . . . 83

5.4.4 La stima e la previsione spaziale . . . 85

5.4.5 L'analisi spaziotemporale . . . 88

5.5 Discussione dei risultati . . . 92

Conclusioni 94

Appendice 96

(5)

Elenco delle gure

1.1 Variogramma di un processo stocastico stazionario con discontinuità nel-l'origine. In rosso la sella σ2, in blu il nugget, in verde il practical

range. . . 24

1.2 Funzione di correlazione e variogramma esponenziale (a sinistra) e gaus-siano (a destra), con varianza unitaria. . . 27

1.3 Funzione di correlazione esponenziale di un processo stocastico gaussiano, al variare del parametro di scala Φ = 0.05 (linea piena), Φ = 0.50 (linea tratteggiata), Φ = 1.00 (linea punteggiata). . . 28

1.4 Funzione di correlazione di Matérn di un processo stocastico gaussiano, al variare dei parametri k e Φ, approssimati per ottenere uno stesso practical range. In particolare, sono state considerate le coppie (k, Φ) = (0.7, 0.25) (linea piena), (k, Φ) = (1.5, 0.16) (linea tratteggiata) e (k, Φ) = (2.5, 0.13) (linea punteggiata). . . 29

1.5 Simulazione di un processo stocastico gaussiano S(x), x ∈ R2, con

funzione di correlazione di Matérn, al variare dei parametri k e Φ, per uno stesso practical range. In particolare, sono state considerate le coppie (k, Φ) = (0.7, 0.25) (a sinistra), (k, Φ) = (1.5, 0.16) (al centro) e (k, Φ) = (2.5, 0.13) (a destra). . . 30 2.1 Variogram cloud (a sinistra) e variogramma campionario (a destra), per

un campione di 468 osservazioni satellitari relative alla concentrazione di clorolla nella costa settentrionale del Cile. . . 39

(6)

5.1 http://oceanservice.noaa.gov/facts/upwelling.html.

Schema del fenomeno oceanograco dell'upwelling. Le acque fredde e ricche di sostanze nutritive vanno a sostituire quelle calde, trasportate a largo dai venti presenti in supercie. . . 72

5.2 https://it.wikipedia.org/wiki/Corrente_oceanica.

Mappa delle correnti oceaniche globali. L'area considerata nella presente tesi per lo studio dellupwelling è evidenziata in giallo. . . 73

5.3 http://www.cpc.noaa.gov/products/analysis_monitoring.

Anomalie nella temperatura superciale dell'acqua a partire dall'anno 2000 (a sinistra) e periodi di occorrenza degli eventi El Niño-La Niña, a partire dall'anno 1994 (a destra). In particolare, W, M, Se VS , stanno a signicare, rispettivamente, la presenza di un evento debole, moderato, forte e molto forte. . . 74

5.4 La concentrazione di Chl-a (a sinistra) e il suo logaritmo (a destra), nell'area compresa tra le latitudini 18° S e 26° S e tra le longitudini 70.08° W e 78° W, nel mese di marzo 2010. La variazione della concentrazione di clorolla è rappresentata tramite una scala cromatica che va dal blu al giallo; la parte bianca presente sulla destra di ciascun graco rappresenta la costa cilena. . . 75

5.5 La regione iniziale (linea rossa), compresa tra le latitudini 18° S e 26° S e tra le longitudini 70.08° W e 78° W e l'area ridotta (linea gialla), delimitata dalle latitudini 19.5° S e 21.5° S e dalle longitudini 70.08° W e 70.6° W. . . 76

5.6 Concentrazione di clorolla [mg/m3]nell'area delimitata dalle latitudini

19.5° S e 21.5° S e dalle longitudini 70.08° W e 70.6° W, per ogni mese dell'anno 2010. La variazione della concentrazione di clorolla è rap-presentata tramite una scala cromatica che va dal blu al giallo; la parte bianca presente sulla destra di ciascun graco rappresenta la costa cilena, mentre i punti bianchi all'interno dell'area oceanica sono dati mancanti. . 77 5.7 Istogrammi della concentrazione di clorolla nell'area delimitata dalle

latitudini 19.5° S e 21.5° S e dalle longitudini 70.08° W e 70.6° W, per ogni mese dell'anno 2010. . . 78

(7)

5.8 Boxplot della concentrazione di clorolla nell'area delimitata dalle lati-tudini 19.5° S e 21.5° S e dalle longilati-tudini 70.08° W e 70.6° W, per ogni mese dell'anno 2010. . . 78

5.9 Variogrammi campionari della concentrazione di clorolla nell'area deli-mitata dalle latitudini 19.5° S e 21.5° S e dalle longitudini 70.08° W e 70.6° W, per ogni mese dell'anno 2010. I graci sono stati ottenuti con la funzione evario() del pacchetto CompRandFld. . . 79

5.10 Istogramma, boxplot e qqplot della concentrazione di Clorolla nell'area delimitata dalle latitudini 19.5° S e 21.5° S e dalle longitudini 70.08° W e 70.6° W, nel mese di marzo 2010. . . 80 5.11 Variogramma campionario della concentrazione di clorolla nel mese di

marzo 2010, considerando tutto il range spaziale disponibile. In rosso, i valori del variogramma ottenuti per distanze superiori ai 150 km. . . 81

5.12 Variogramma campionario della concentrazione di clorolla nel mese di marzo 2010, per un numero di lag spaziali pari a 5, 10, 15 e 20 (in gura in ordine da sinistra a destra). . . 82

5.13 Variogramma campionario dei residui in seguito alla computazione di un trend lineare (a sinistra), quadratico (al centro) e di un modello lineare generalizzato (a destra), ottenuto con la funzione gam() del pacchetto mgcv. . . 83 5.14 Variogramma campionario calcolato per le direzioni nord 0°, nord-est 45°,

est 90° e sud-est 135°. I graci sono stati ottenuti grazie alla funzione variogram() del pacchetto gstat. . . 84

5.15 Variogrammi dei modelli gaussiano (in verde), sferico (in rosso) e espo-nenziale (in blu); i parametri di tali modelli sono stati ottenuti grazie alla funzione FitComposite() del pacchetto CompRandFld. . . 86

5.16 Variogrammi e covarianze dei modelli gaussiano (in alto), sferico (al cen-tro) e esponenziale (a destra); i parametri di tali modelli sono stati ottenuti grazie alla funzione FitComposite() del pacchetto CompRandFld. 87 5.17 Concentrazione di clorolla [mg/m3]nell'area delimitata dalle latitudini

19.5° S e 21.5° S e dalle longitudini 70.08° W e 70.6° W, per ogni mese dell'anno 2010. In particolare, sono state considerate solo le locazioni in cui sono disponibili le osservazioni per ogni mese. . . 90

(8)

5.18 Variogramma marginale spaziale (in alto a sinistra) e temporale (in al-to a destra); il variogramma spaziotemporale è riportaal-to in due diverse versioni: in basso a sinistra i singoli valori calcolati in funzione dello spa-zio e del tempo e in basso a destra una versione più liscia dello stesso variogramma. . . 90

5.19 Variogramma campionario (a) e variogrammi del modello esponenziale separabile (b), di De Iaco (c), di Gneiting (d) e di Porcu(e). I graci sono stati ottenuti con la funzione Covariogram() del pacchetto Com-pRandFld, utilizzando i parametri ottenuti applicando il metodo della verosimiglianza composita. . . 91

(9)

Elenco delle tabelle

5.1 Numero di coppie (pairs) che contribuiscono al calcolo del variogramma campionario, per distanze prossime ai valori dati da centers. . . 81

5.2 Risultati della stima parametrica per i modelli gaussiano, sferico e espo-nenziale. . . 85

5.3 Risultati della predizione con il metodo del kriging semplice, per i modelli sferico, esponenziale e gaussiano, al variare delle ripartizioni dei dati in un training sample e un test sample. Sono riportati sia gli errori MSE e MAE che il rapporto tra tali errori e la somma dei quadrati e dei valori assoluti delle osservazioni reali, rispettivamente. . . 86

5.4 Risultati della stima parametrica per i modelli spaziotemporali esponen-ziale, di De Iaco, di Gneiting e di Porcu.. . . 89 5.5 Risultati della predizione con il metodo del kriging semplice, per i

mo-delli spaziotemporali esponenziale, di De Iaco, di Gneiting e di Porcu, al variare delle ripartizioni dei dati in un training sample (80% dei dati spaziali e 11 mesi) e un test sample (restante 20% dei dati spaziali, mese di dicembre). Sono riportati sia gli errori MSE e MAE che il rapporto tra tali errori e la somma dei quadrati e dei valori assoluti delle osservazioni reali, rispettivamente. . . 89

(10)

Abstract

Geostatsitcs is a branch of Spatial Statistics focusing on the analysis of con-tinuous phenomena, distributed in space or both in space and time. Geo-statistical models and methods will be applied with the aim of studying the probabilistic structure of chlorophyll concentration along the Northen Chi-lean coast (Tarapacá region), due to the continuous nature of this variable; monthly averaged satellite data during the year 2010 will be considered for this purpose. The spatiotemporal distribution of chlorophyll could give es-sential information needed for the study of the upwelling phenomenon in the considered study region. Upwelling refers to water displacement of nutrient rich and cool water from the subsurface to the surface layer, strongly aec-ting both local climate and marine ecosystem. It is strictly related to the El Niño Southern Oscillation (ENSO) phenomenon, which refers to an anoma-lous behavour of the sea surface temperature in the western coast of South America; in the year 2010, chosen for this analysis, both the cool (La Niña) and the warm (El Niño) events occurred. A preliminary purely spatial ana-lysis of the month of March provides encouraging estimating and predictive results, although it could be improved by including external eects in the trend specication, such as the wind stress or the batimetry of the coastal region. The spatiotemporal analysis was not successful; a possible solution could be that of considering more frequent observations, such as daily data.

(11)

Abstract

La Geostatistica è una branca della Statistica Spaziale che si occupa di ana-lizzare dei fenomeni continui, distribuiti nello spazio oppure nello spazio e nel tempo. I modelli e i metodi geostatistici saranno applicati nel presente lavoro per studiare la struttura probabilistica della concentrazione di cloro-lla nella costa settentrionale cilena (regione di Taparacá), data la natura continua di tale variabile; a questo proposito, saranno considerati dei dati satellitari relativi alla concentrazione mensile media della clorolla, nell'an-no 2010. La distribuzione spaziotemporale di tale variabile può fornire delle informazioni fondamentali per lo studio del fenomeno oceanograco della ri-salita delle acque profonde (upwelling) nella regione considerata. L'upwelling consiste nello spostamento di grandi masse di acqua fredda e ricca di sostanze nutritive, e comporta degli importanti eetti sia nel clima che nell'ecosiste-ma nell'ecosiste-marino delle zone costiere. È strettamente legato al fenomeno El Niño Oscillazione Meridionale (ENSO), ovvero un comportamento anomalo della temperatura superciale dell'acqua nella costa occidentale dell'America del Sud; nell'anno 2010, scelto per questa analisi, si ebbe l'occorrenza sia del-l'evento freddo (La Niña) che di quello caldo (El Niño). Una prima analisi preliminare del mese di marzo fornisce dei risultati incoraggianti per la stima e la previsione spaziale della concentrazione di clorolla; tali risultati potreb-bero essere ulteriormente migliorati considerando degli eetti esterni nella specicazione della media, come la forza e la direzione del vento o la batime-tria del fondale marino. D'altra parte, l'analisi spaziotemporale non è stata soddisfacente: una possibile soluzione potrebbe essere quella di considerare una griglia temporale più tta, data ad esempio da osservazioni giornaliere.

(12)

Introduzione

La Geostatistica è una branca della statistica spaziale che si occupa di fa-re infefa-renza su un fenomeno spaziale continuo - il segnale - a partifa-re da un campione nito di osservazioni, correlate con il segnale stesso, il più delle volte non direttamente osservabile. I metodi geostatistici saranno applica-ti nella presente tesi per analizzare la distribuzione spaziotemporale della concentrazione di clorolla nella costa settentrionale cilena (regione di Ta-rapacá), nell'anno 2010. La clorolla, presente nei phytoplankton che si trovano nello strato superciale dell'acqua, risulta essere strettamente rela-zionata alla temperatura superciale e al fenomeno della risalita delle acque profonde, o upwelling, centrale negli studi oceanograci. L'upwelling consiste nello spostamento di grandi quantità d'acqua fredda dal fondo alla supercie del mare ed è legato al fenomeno El Niño-Oscillazione Meridionale (ENSO), che consiste in un'anomalia positiva (evento El Niño) o negativa (evento La Niña) nella temperatura superciale dell'acqua. Sia l'evento freddo che quel-lo caldo si sono presentati nell'anno 2010, scelto per la presente analisi. La risalita delle acque profonde comporta fondamentali cambiamenti nell'ecosi-stema marino, nonché numerosi eetti climatici nelle zone costiere. Risulta inoltre essenziale per l'attività peschereccia: circa il 25% del pescato marino mondiale proviene dalle zone di upwelling, che occupano solo il 5% della su-percie oceanica globale (Jennings, Kaiser e Reinolds, 2001). D'altra parte, un'intensicazione anomala della risalita delle acque profonde, dovuta all'au-mento dei gas serra, può portare a delle conseguenze negative sia dal punto di vista dell'ecosistema marino, sia per quanto riguarda il clima locale (Bakun, 1990).

(13)

particolare la concentrazione di clorolla, tramite un approccio di tipo model-based, espressione coniata da Diggle, Tawn e Moyeed (1998), per descrivere l'applicazione di metodi statistici formali, sotto l'assunzione di un model-lo stocastico esplicito. Tale approccio è stato ripreso da Peter J. Diggle e Paulo J. Ribeiro Jr. nel libro Model-based geostatistics (2007), per fornire una controparte applicativa a Stein (1999), che espone una rigorosa teoria matematica del kriging. L'opera è stata per me fondamentale per un primo avvicinamento alla materia, dal punto di vista che più mi interessava: l'anali-si dei dati reali. Un altro essenziale testo, che mi ha permesso di comprendere alcuni importanti aspetti teorici della geostatistica, è la tesi di dottorato di Emilio Porcu (2004), con il quale ho avuto la fortuna di lavorare sullo stu-dio oggetto di questa tesi, durante il mio periodo alla Universidad Técnica Federico Santa María di Valparaiso (Cile).

L'interesse per la struttura probabilistica della concentrazione di cloro-lla nella zona considerata è sorto in quanto, in tale area, i classici metodi per lo studio dell'upwelling, basati sulle serie temporali della temperatura superciale dell'acqua, non forniscono modelli soddisfacenti per descrivere il comportamento di tale variabile (Hormazabal et al., 2001). Questo potrebbe essere dovuto alla forma geograca della costa settentrionale del Cile e alla struttura del fondale marino in tale area, che rende necessario considerare modelli più complessi, che tengano conto dell'interazione tra la componen-te spaziale e quella componen-temporale. L'obiettivo nale di questo lavoro è quindi quello di fornire un nuovo modello spaziotemporale per la stima e la previsio-ne della struttura probabilistica della concentrazioprevisio-ne di clorolla previsio-nella costa settentrionale del Cile. A tale scopo, sono stati considerati dei dati satel-litari, distanziati di 4 km e distribuiti mensilmente nell'anno 2010, relativi alla concentrazione di clorolla (espressa in mg/m3) e ottenuti a partire dalle

misurazioni del sensore MoDIS (Moderate Resolution Imaging Spectrometer), presente nel satellite Aqua. Il dataset, inizialmente costituito da 423.708 os-servazioni (35.309 per ciascun mese), tra le latitudini 18° S e 26° S e tra le longitudini 70.08° W e 78° W è stato in seguito ridotto, restringendo la regione di studio all'area compresa tra le latitudini 19.5 S e 21.5 S e tra le longitudini 70.08° W e 70.6° W. Tale riduzione si è resa necessaria sia per

(14)

motivi computazionali che per ottenere dei migliori risultati previsivi relati-vamente alla zona costiera, di interesse per lo studio dell'upwelling. L'insieme nale dei dati, considerato per lo studio geostatistico descritto in questa te-si, comprende 5.664 osservazioni; i dettagli della scelta della sottoregione sono discussi nel quinto capitolo. Il procedimento utilizzato per analizzare il dataset in questione è stato quello di dividere la ricerca in due passaggi fondamentali: si è dapprima eettuata una analisi del mese di marzo, per esplorare la struttura spaziale della concentrazione di clorolla; in seguito, si sono applicati i metodi geostatistici spaziotemporali. Sono stati testati vari modelli geostatistici di correlazione spaziale prima e spaziotemporale poi, che saranno descritti nel primo e nel quarto capitolo. La stima parametrica di tali modelli è stata possibile grazie all'utilizzo del pacchetto CompRandFld del software R, sviluppato da Simone Padoan e Moreno Bevilacqua (2015), che costituisce un supporto computazionale al recente metodo della verosi-miglianza composita, fondamentale per l'analisi di grandi insiemi di dati. La previsione spaziale e spaziotemporale è stata eettuata tramite il metodo del kriging, oggetto del terzo capitolo. I risultati emersi dall'analisi preliminare puramente spaziale sono piuttosto convincenti. Tuttavia, la stima e la pre-visione spaziotemporali non forniscono risultati soddisfacenti; per migliorarli si potrebbero da un lato includere gli eetti di variabili esterne per la stima della media del modello, dall'altro considerare delle informazioni giornaliere e distribuite su un intervallo temporale più ampio.

Per quanto riguarda la struttura della tesi, saranno in primis esposti i metodi e i modelli geostatistici necessari per lo studio oggetto del presente lavoro; in secundis sarà considerata la loro applicazione per l'analisi della clorolla. Pertanto, inizialmente si espone un quadro generale della Geo-statistica, da un punto di vista esclusivamente spaziale (Capitoli 13); in particolare, nel primo capitolo sono descritte le principali ipotesi del modello gaussiano stazionario, la sua struttura, la funzione di covarianza e il vario-gramma; sono inne descritte alcune estensioni di tale modello. Il secondo capitolo è dedicato alla stima parametrica dei modelli geostatistici, tramite la massima verosimiglianza e la massima verosimiglianza composita; il ter-zo, alla previsione geostatistica e al metodo del kriging. Nel Capitolo 4, si

(15)

fornisce una descrizione dei modelli geostatistici spaziotemporali, necessaria per la comprensione dell'analisi della clorolla, oggetto del Capitolo 5. Nel capitolo conclusivo, mi soermerò sui limiti dello studio eettuato e esporrò delle idee relative a eventuali sviluppi futuri dell'analisi. Inne, una traccia del codice utilizzato per ottenere i risultati e i graci riportati nella presente tesi sarà fornita in Appendice.

Relativamente all'analisi computazionale dei dati, eettuata tramite il software R, mi sono inizialmente adata ai pacchetti geoR (Riberio e Dig-gle, 2015) e sp, descritto in Applied Spatial Data Analysis with R (2013) da Roger S. Bivand, Edzer Pebesma e Virgilio Gómez-Rubio. Ho poi utilizzato il pacchetto CompRandFld, sviluppato da Simone Padoan e Moreno Bevilac-qua (2015), in cui è implementato il metodo della massima verosimiglianza composita per l'analisi dei campi aleatori. Il pacchetto è stato molto utile ai ni della mia ricerca, in quanto tale metodo fornisce un buon compro-messo computazionale per l'analisi spaziotemporale di grandi insiemi di dati (Bevilacqua et al., 2012).

Il presente lavoro di tesi è stato realizzato presso la Universidad Técnica Federico Santa María di Valparaíso (Cile), in cui ho lavorato con il Prof. Emilio Porcu e con il Prof. Moreno Bevilacqua della Universidad De Valpa-raíso, da aprile ad agosto 2015. Inoltre, un fondamentale contributo a questa ricerca è stato fornito dal professore di Oceanograa Samuel Hormazabal, della Ponticia Universidad Católica de Valparaíso, e dalle studentesse di dottorato Daira Velandia e Alessandra Fariñas. I dati utilizzati per l'analisi sono disponibili al sito http://oceandata.sci.gsfc.nasa.gov/.

(16)

Capitolo 1

I modelli geostatistici

1.1 Introduzione

L'idea alla base della Geostatistica è quella di fare inferenza su un processo stocastico spaziale continuo su un'area di interesse, detto segnale, a parti-re da un insieme di osservazioni, misurate in corrispondenza di un insieme discreto di punti all'interno della regione selezionata (Cressie, 1993). Gli stu-di geostatistici ebbero origine grazie all'apporto stu-di contributi provenienti da varie discipline: matematica, statistica, ingegneria mineraria e geologia. Il termine risale agli anni '60, quando a Fontainebleu, nel sud della Francia, si rese necessario descrivere i lavori di Georges Matheron, matematico francese dell'Ecole de Mines de Paris, e di un ingegnere minerario sudafricano, Danie Krige, inerenti alla predizione spaziale in ambito minerario. Noel Cressie (1993), punto di riferimento fondamentale nell'area della Geostatistica, la considera una delle tre branche principali della statistica spaziale, assieme alla variazione spaziale discreta e ai processi spatial point. L'applicazione dei metodi geostatistici si è estesa ben oltre il contesto minerario iniziale e riguarda attualmente le più svariate aree: scienze ambientali, meteorologia, ecologia, idrogeologia, scienze economiche, oceanograa, etc.

Nel presente capitolo, mi soermerò sull'analisi strutturale dei processi spaziali e sulla formulazione del modello geostatistico. Inizialmente, foca-lizzerò la mia attenzione sui modelli gaussiani stazionari, in quanto

(17)

rappre-sentano il modello di base più utilizzato in Geostatistica (Diggle e Riberio, 2007). I paragra 1.2 e 1.3 sono propedeutici ai ni della comprensione del par. 1.4, in cui descrivo tali modelli. Segue un'analisi della loro struttura di covarianza e del variogramma, nel par. 1.5. Il paragrafo 1.6 è dedicato alla descrizione di alcune famiglie di correlazione per i processi stazionari. In-ne, sono trattate alcune estensioni a modelli più complessi (par. 1.7) e sono brevemente descritti i modelli lineari generalizzati geostatistici (par. 1.8).

1.2 I dati geostatistici

I dati geostatistici spaziali, nella loro forma più semplice, cioè in assenza di covariate, sono solitamente rappresentati come coppie (xi, yi) : i = 1, . . . , n.

In particolare, si osserva un insieme nito di dati y1, y2, . . . , yn, in cui yi ∈ R

è la realizzazione di una variabile aleatoria, la risposta Yi, in ogni punto di

campionamento xi ∈ Rk, all'interno di una regione continua A ⊂ Rk. xi è

solitamente espresso in una, due o tre dimensioni spaziali; da qui in avan-ti, considererò quindi k = 1, 2, 3. Ai ni della mia ricerca, mi soermerò esclusivamente su modelli univariati. Per una trattazione multivariata, si può vedere, ad esempio, Wackernagel (1995). Inoltre, saranno trattati esclu-sivamente i processi stocastici a valori reali, in quanto l'estensione al caso complesso esula dai ni della presente tesi.

Per esplicitare un modello geostatistico, è necessario specicare una rela-zione tra la variabile risposta Y = (Y1, . . . , Yn)e il processo stocastico spaziale

S(·) = {S(x), ∀x ∈ Rk} in ogni punto di campionamento xi, e cioè tra Yi

e S(xi), ∀i = 1, . . . , n. Nel seguito, si utilizzerà il termine segnale (Diggle

e Riberio, 2007) per descrivere il processo spaziale oggetto di interesse. Il principale modello geostatistico descritto in questo capitolo è quello stazio-nario gaussiano, che sarà utilizzato ai ni dell'analisi della concentrazione di clorolla, nel quinto capitolo.

(18)

1.3 Le ipotesi del modello gaussiano

stazionario

1.3.1 Il campionamento non preferenziale

Un point process X è un meccanismo stocastico che genera un insieme nu-merabile di eventi (Diggle, 2003). Nel contesto della statistica spaziale, può essere visto come un processo casuale in cui ogni realizzazione consiste in un insieme di punti isolati nel tempo e/o nello spazio geograco (Diggle e Riberio, 2007); l'intero processo può quindi essere descritto completamente dagli intervalli (casuali) tra i punti. In ambito geostatistico, i point process sono spesso utilizzati per descrivere la tecnica per il campionamento dei dati. In questo caso, X = (X1, . . . , Xn) e ciascun punto xi utilizzato per il

cam-pionamento è una realizzazione della corrispondente variabile aleatoria Xi. I

principali point process utilizzati in Geostatistica sono i processi di Cox (Cox, 1955) e i processi di Cox log-gaussiani, in cui log S è un processo gaussiano (Møller et al., 1998).

Sia ora X = (X1, . . . , Xn)il point process che genera i punti di

campiona-mento e sia Y = (Y1, . . . , Yn) il processo di misura, che genera le osservazioni

y1, . . . , yn, in corrispondenza delle locazioni spaziali x1, . . . , xn, realizzazioni

di X. Una prima convenzione comunemente utilizzata per la modellizzazione geostatistica prevede che la tecnica di campionamento sia di tipo non prefe-renziale, cioè deterministica o indipendente dal segnale. In termini pratici, questo signica che i processi di campionamento e misura sono tra loro in-dipendenti; in questo caso, i metodi geostatistici sono volti all'analisi della distribuzione di Y (Diggle e Riberio, 2007). Infatti, la distribuzione congiun-ta di X e Y è fattorizzabile: [X, Y ] = [X][Y ]; è quindi corretto analizzare la distribuzione di Y e, dunque, del segnale sottostante. Se il campionamento è preferenziale, si avrà invece [X, Y ] = [Y |X][X]. Una possibile soluzione è quella di formulare un modello congiunto appropriato per X e Y , sfruttan-do la loro mutua dipendenza dal segnale. Per quanto riguarda il presente lavoro di tesi, si osserva che, poiché i dati relativi alla concentrazione di clo-rolla provengono da osservazioni satellitari, il campionamento può essere

(19)

considerato non preferenziale e, più in particolare, deterministico.

1.3.2 La stazionarietà debole, in senso stretto

e intrinseca. L'isotropia

Una seconda, fondamentale, ipotesi è quella di stazionarietà debole o del second'ordine per il segnale S. Sia A ⊂ Rk la regione di interesse.

Denizione 1 (Debole stazionarietà). Un processo stocastico S(·) = {S(x), ∀x ∈ A} si dice debolmente stazionario se possiede momenti primo e secondo niti e costanti, e se ammette una funzione di covarianza C : A → R il cui valore dipende esclusivamente dal vettore di separazione tra ciascuna coppia di punti in cui è calcolata. In formule:

E[S(x)] = µ < ∞, E[S(x)2] < ∞, ∀x ∈ A, Cov(S(xi), S(xj)) = C(xi− xj), ∀xi, xj ∈ A.

(1.1)

Si noti che la varianza di un processo debolmente stazionario è costante:

Var(S(x)) = Cov(S(x), S(x)) = C(0) = σ2, ∀x ∈ A. (1.2) L'assunzione di debole stazionarietà non riguarda la struttura probabilistica del segnale: i momenti primo e secondo possono essere costanti indipenden-temente dalla sua distribuzione di probabilità.

La stazionarietà in senso stretto si verica invece se

Pr{S(x1+ x) 6 t1, . . . , S(xn+ x) 6 tn} = Pr{S(x1) 6 t1, . . . , S(xn) 6 tn},

∀x, x1, . . . , xn∈ A, ∀t1, . . . , tn∈ R,

ovvero la distribuzione del segnale S è invariante per traslazione. In senso sico, un segnale strettamente stazionario è omogeneo e si ripete con una certa regolarità nel dominio di denizione (Porcu, 2004).

Nel caso della stazionarietà intrinseca, il segnale S è una funzione intrin-seca casuale (Matheron, 1973), cioè è tale che per ogni x, u ∈ A, il processo

(20)

stocastico denito dagli incrementi

Du(x) = S(x) − S(x − u) (1.3)

sia debolmente stazionario. Si noti che la richiesta di stazionarietà in senso stretto è più forte rispetto a quella della stazionarietà debole, che è a sua volta più restrittiva dell'intrinseca stazionarietà. Dunque, un processo fortemente stazionario lo è anche debolmente (e quindi intrinsecamente), ammesso che il momento secondo esista. Nel mio lavoro, mi limiterò all'assunzione di debole stazionarietà, comunemente utilizzata in ambito geostatistico.

Per concludere, un processo (debolmente) stazionario è detto isotropo nella regione considerata se, posto u = xi− xj per ogni xi e xj in A,

C(xi− xj) = C(u) = C(||u||), (1.4)

in cui C(·) è la funzione di covarianza del segnale, come in (1.1).

1.3.3 La gaussianità e l'indipendenza

Il segnale {S(x) : x ∈ Rk} è un processo stocastico gaussiano se la

distribuzio-ne congiunta di {S(x1), . . . , S(xn)}è una gaussiana multivariata ∀x1, . . . , xn

collezione di punti in Rk. La struttura di un processo di questo tipo può essere

univocamente descritta dalla sua media µ(x) = E[S(x)] e dalla sua funzione di covarianza Cov(S(x1), S(x2)), ∀x, x1, x2 ∈ Rk. Se il processo gaussiano è

anche debolmente stazionario, si avrà µ(x) = µ.

Un'ultima richiesta è che le variabili Yi siano indipendenti,

condizionata-mente al segnale S, e che la loro media sia costante:

E[Yi|S(·)] = µ(xi) = µi, ∀i ∈ 1, . . . , n. (1.5)

In alcune applicazioni, le variabili aleatorie Yi|S(·) sono invece tra loro

di-pendenti. In questo caso, occorre adottare un modello lineare generalizzato, come descritto nel paragrafo (1.8).

(21)

1.4 Il modello stazionario gaussiano

È ora possibile dare una formulazione del modello stazionario gaussiano. Sto-ricamente, tale modello era ed è tuttoggi utilizzato per la sua unica trattabi-lità analitica, nonostante tale aspetto abbia col tempo perso d'importanza, a causa del crescente sviluppo di metodi e tecniche computazionali di modella-zione. Tuttavia, continua ad essere il modello di riferimento di base principale in Geostatistica e, nella pratica, è ampiamente utilizzato in gran parte delle applicazioni reali. Si osserva inoltre che la classe dei modelli gaussiani può essere facilmente estesa trasformando la variabile risposta (par. 1.7.2), per-mettendo in molti casi di arrivare a una buona approssimazione empirica dei dati.

Siano S(·) e Y = (Y1, . . . , Yn) rispettivamente il segnale e il processo di

misurazione, come descritto nei paragra precedenti. Nella sua forma basica, ovvero nel caso univariato e in assenza di variabili esplicative, il modello è espresso tramite la relazione

Yi = S(xi) + Zi, ∀i = 1, . . . , n, (1.6)

in cui le Zi rappresentano l'errore di misurazione e sono variabili aleatorie

indipendenti dal segnale e tra loro, con media nulla e varianza τ2: Z i ∼

N (0, τ2); il segnale S è un processo gaussiano debolmente stazionario indi-pendente da Z e le variabili risposta Yi sono indipendenti e normalmente

distribuite, dato il segnale. Si noti che, in questo caso,

E[Yi|S(·)] = S(xi), Var(Yi|S(·)) = τ2, ∀i ∈ 1, . . . , n. (1.7)

(22)

1.5 Le funzioni di covarianza e correlazione. Il

variogramma

1.5.1 Covarianza e correlazione

Come già osservato, un processo stazionario gaussiano è completamente de-scritto dalla sua media e dalla sua struttura di covarianza. Si ricorda che, in generale, la funzione di covarianza di un processo stocastico S(·), con momenti primo e secondo niti, deve soddisfare la proprietà di semidenita positività

n

X

i,j=1

aiajCov(S(xi), S(xj)) ≥ 0, (1.8)

per ogni successione {xi}ni=1 in Rk e per ogni successione {ai}ni=1 di valori

reali. Tale condizione è necessaria e suciente per l'esistenza di un processo stocastico la cui covarianza sia proprio quella in (1.8). Sia ora S un processo debolmente stazionario e sia C la sua funzione di covarianza, come in (1.1). C rispetta allora le seguenti proprietà:

C(0) ≥ 0, C(x) = C(−x), |C(x)| ≤ C(0).

(1.9)

Sia σ2 la varianza (1.2) (costante) del segnale e sia u = x

i− xj, con xi e xj

punti arbitrari in Rk. La funzione di correlazione ρ è allora

ρ(u) = C(u)

σ2 . (1.10)

Da (1.9) segue che anche ρ è simmetrica e non negativa nell'origine, in cui assume il suo punto massimo. Laddove il processo sia anche isotropo, si avrà inoltre che C(u) = C(||u||) e ρ(u) = ρ(||u||).

(23)

1.5.2 Il variogramma

Il variogramma ore una caratterizzazione alternativa della struttura di di-pendenza del second'ordine di un processo spaziale. La sua relazione con la covarianza verrà discussa nel seguito di questo paragrafo.

Denizione 2 (Variogramma). Sia {S(x), x ∈ Rk} un processo spaziale

stocastico intrinsecamente stazionario, con varianza Var(S(x)), e siano xi e

xj dei punti in Rk. Il variogramma (o variogramma teorico) di S(x) è la

funzione 2γ(·) tale che

γ(xi, xj) =

1

2Var(S(xi) − S(xj)). (1.11) Nel caso debolmente stazionario, si avrà

γ(xi, xj) =

1

2E[(S(xi) − S(xj))

2]. (1.12)

La funzione γ(·) è detta semivariogramma. Alcuni autori non fanno distin-zione tra i termini variogramma e semivariogramma. Nel seguito, si farà riferimento a γ(·) o a 2γ(·) indierentemente, a seconda del contesto. Sia u = xi − xi, il vettore di separazione tra i punti xi e xj. Il variogramma

rispetta le proprietà seguenti:

γ(0) = 0, γ(u) = γ(−u), γ(u) ≥ C(0).

(1.13)

Un'altra fondamentale proprietà del variogramma è la sua semidenita ne-gatività condizionale, cioè

n X i,j=1 cicjγ(xi− xj) ≤ 0, n X j=1 cj = 0, (1.14)

in cui cj ∈ R e xj ∈ Rk, j = 1, . . . , n. Il variogramma rispetta dunque tutte

(24)

par-ticolare, la combinazione lineare tra variogrammi è ancora un variogramma, e vale lim ||u||→∞ γ(u) ||u||2 = 0,

ovvero il variogramma deve crescere meno velocemente di ||u||2 (Matheron,

1971).

Per quanto riguarda la relazione tra C(·) e γ(·), occorre innanzittutto osservare che la classe dei variogrammi è più ampia rispetto a quella delle funzioni di covarianza. Infatti, dato un processo spaziale stocastico con va-rianza nita, la sua covava-rianza è limitata per (1.9), mentre il variogramma potrebbe non esserlo. Se il processo è debolmente stazionario, allora anche γ(·) è limitato. In questo caso, da (1.11) segue che

γ(u) = C(0) − C(u) = σ2− C(u), (1.15) in cui σ2 è la varianza del segnale, σ2 = Var(S(x))e C(·) è la sua covarianza,

come in (1.1). Non è sempre possibile esplicitare la covarianza in funzione del variogramma, in quanto quest'ultimo potrebbe non essere limitato. Si noti che, ricordando la denizione di correlazione (1.10), la (1.15) equivale a

γ(u) = σ2(1 − ρ(u)). (1.16) È ora possibile analizzare le proprietà siche del variogramma, ai ni della sua stima e interpretazione a partire dai dati reali. Tali proprietà sono fondamentali per la comprensione dell'analisi della concentrazione di clorol-la, esposta nel quinto capitolo. Si ricorda che il variogramma è identicamente nullo nell'origine, cresce all'aumentare della distanza euclidea e, nel caso in cui sia limitato, si assesta sulla varianza σ2 del processo, detta sella, o sill.

Osservando la (1.16), risulta evidente che la sella è raggiunta in corrispon-denza di una correlazione spaziale nulla. È allora interessante chiedersi quale sia la distanza tale per cui ciò accade: tale distanza è detta range. Nel caso in cui la sella è raggiunta solo asintoticamente, risulta inoltre utile denire il practical range, e cioè la distanza in cui il variogramma raggiunge il valore (1 − α)σ2, in cui α è solitamente pari a 0.05. Quando vi è una discontinuità

(25)

nell'origine del variogramma, si parla di eetto pepita, o nugget eect. Il termine fu coniato da Matheron negli anni 60' e deriva dal fatto che nelle mi-niere d'oro si trovano spesso pepite molto più piccole rispetto alle dimensioni standard, con una percentuale di metallo nobile dierente rispetto alle altre pietre. Dal punto di vista del modello geostatistico, tale eetto è prodotto da variazioni spaziali il cui range è inferiore rispetto alla più piccola distan-za campionaria disponibile. A seguire, un variogramma teorico discontinuo nell'origine (Fig. 1.1).

Figura 1.1: Variogramma di un processo stocastico stazionario con discontinuità nell'origine. In rosso la sella σ2, in blu il nugget, in verde il practical range.

Considerando il modello stazionario gaussiano, come in (1.6), il vario-gramma approssiamto 2γY(·)della risposta Y è denito come

γY(u) =

1

2Var(Yi− Yj), u = xi− xj, i, j = 1, . . . , n. (1.17) Siano ora CY(·) e ρY(·) le funzioni di covarianza e di correlazione di Y , al

(26)

seguenti relazioni: CY(u) = C(u) ρY(u) = ρ(u) σ2 σ2+ τ2 γY(u) = σ2(1 − ρ(u)) + τ2. (1.18)

L'ultima equazione in (1.18) equivale ad aermare che

γY(u) = γ(u) + τ2. (1.19)

Una discontinuità nell'origine del variogramma approssimato nasconde un duplice signicato: da una parte, gli eetti di microscala (nugget eect), dall'altra l'errore di misurazione.

1.5.3 Continuità e dierenziabilità

La struttura di covarianza di un processo spaziale condiziona fortemente la regolarità (smoothness) della supercie generata dal processo. Vi sono due principali concetti di continuità e dierenziabilità, in generale non relazionati tra loro: la continuità e dierenziabilità in media quadratica e quella del pro-cesso. Quest'ultima è relativa alle realizzazioni del segnale S(·): il processo si dirà continuo o k volte dierenziabile se le sue realizzazioni sono continue o k volte dierenziabili.

La continuità del second'ordine si verica invece se

lim

u→0E[(S(x) − S(x − u))

2] = 0. (1.20)

Nel caso stazionario, questo equivale ad aermare che il variogramma γ(·) del processo è continuo nell'origine, dunque non vi sono eetti di microscala. S(x) si dice dierenziabile in media quadratica se vale

lim u→0E "  S(x) − S(x − u) u − S 0 (x) 2# = 0. (1.21)

(27)

In questo caso, S0(x) è la derivata ai minimi quadrati di S(x). Il processo si

dice due volte dierenziabile in media quadratica se S0(x)è dierenziabile, e

così via. Nella gura 1.2, sono riportati i graci della funzioni di correlazione e del variogramma esponenziale (a sinistra) e gaussiano (a destra), con va-rianza unitaria, che saranno descritti analiticamente nel prossimo paragrafo. Entrambi i processi sono continui ai minimi quadrati. Quello gaussiano è anche dierenziabile innite volte, mentre quello esponenziale non lo è nem-meno una volta. I graci in gura 1.2 sono stati ottenuti con la funzione cov.spatial() del pacchetto geoR.

Si riporta inne un importante risultato, descritto ad esempio da Bartlett (1955).

Teorema 1. Un processo stocastico debolmente stazionario, con funzione di correlazione ρ(u), è k volte dierenziabile ai minimi quadrati se e solo se ρ(u) è 2k volte dierenziabile in u = 0.

1.6 Alcuni modelli isotropici di correlazione

Una condizione necessaria e suciente anchè una funzione C(·) sia la cova-rianza di un processo stocastico stazionario S(x) è che sia denita positiva, come in (1.8). Trovare delle classi di funzioni denite positive e suciente-mente essibili da poter essere utilizzate nel contesto dei dati geostatistici è tutt'altro che banale. Per questo motivo, risulta utile considerare delle classi standard, per le quali tali ipotesi siano già state vericate. Empiricamen-te, il caso più comune è quello in cui la correlazione tra S(x) e S(x − u) descresce all'aumentare della distanza u tra due punti o, equivalentemente, il variogramma aumenta al crescere di u. A seguire, parlerò di alcuni tra i modelli di correlazione più comunemente usati in ambito geostatistico, sof-fermandomi su quelli crescenti e isotropici. Tali modelli sono stati utilizzati per l'analisi spaziale della concentrazione di clorolla nel mese di marzo 2010, come sarà descritto nel Capitolo 5.

(28)

Figura 1.2: Funzione di correlazione e variogramma esponenziale (a sinistra) e gaussiano (a destra), con varianza unitaria.

(29)

Figura 1.3: Funzione di correlazione esponenziale di un processo stocastico gaussiano, al variare del parametro di scala Φ = 0.05 (linea piena), Φ = 0.50 (linea tratteggiata), Φ = 1.00 (linea punteggiata).

1.6.1 La famiglia di Matérn

Quella di Matérn è tra le famiglie di correlazione più comunemente utilizzate in ambito geostatistico, e ha la forma seguente:

ρ(u) = (u/Φ)

kK

k(u/Φ)

2k−1Γ(k) , (1.22)

in cui Kk(·) è la funzione di Bessel di ordine k, che è anche l'ordine del

modello e ne determina la dierenziabilità. Infatti, un processo stocastico di ordine k con funzione di correlazione di Matérn, è bkc volte dierenziabile ai minimi quadrati. Φ è un parametro di scala ed ha le dimensioni di una distanza. Si osservi che, per k → ∞, ρ(u) tende alla funzione

ρ(u) = exp  −||u|| Φ 2! , (1.23)

(30)

Figura 1.4: Funzione di correlazione di Matérn di un processo stocastico gaussiano, al variare dei parametri k e Φ, approssimati per ottenere uno stesso practical range. In particolare, sono state considerate le coppie (k, Φ) = (0.7, 0.25) (linea piena), (k, Φ) = (1.5, 0.16)(linea tratteggiata) e (k, Φ) = (2.5, 0.13) (linea punteggiata).

detta anche correlazione gaussiana. Se invece k = 0.5, la (1.22) si riduce alla correlazione esponenziale ρ(u) = exp  −||u|| Φ  . (1.24)

Come precedentemente notato, la prima è innite volte dierenziabile ai mi-nimi quadrati, mentre la seconda è continua ma non dierenziabile. Fissando l'ordine del modello, il practical range aumenta all'aumentare di Φ (Figura 1.3). Tuttavia, non è possibile comparare parametri di scala relativi a or-dini dierenti: la relazione tra Φ e il practical range dipende da k, come si può osservare nella gura 1.4. Ai ni della stima parametrica, risulta quindi comodo ottimizzare il valore di Φ per alcuni valori ssati di k, per esempio k = 0.5, k = 1.5, k = 2.5, corrispondenti a un processo continuo ma non dierenziabile, dierenziabile una e due volte rispettivamente, nel senso dei minimi quadrati. Le realizzazioni di tali processi formano superci tra loro molto diverse, come si deduce dalla gura 1.5, ottenuta con la funzione grf() del pacchetto geoR.

(31)

Figura 1.5: Simulazione di un processo stocastico gaussiano S(x), x ∈ R2, con

funzione di correlazione di Matérn, al variare dei parametri k e Φ, per uno stesso practical range. In particolare, sono state considerate le coppie (k, Φ) = (0.7, 0.25) (a sinistra), (k, Φ) = (1.5, 0.16) (al centro) e (k, Φ) = (2.5, 0.13) (a destra).

1.6.2 La famiglia sferica

Un'altra famiglia ampiamente utilizzata in Geostatistica è quella sferica, che possiede la peculiarità di avere un range nito:

ρ(u) =   

1 −32(||u||/Φ) +12(||u||/Φ)3 0 ≤ ||u|| ≤ Φ

0 ||u|| > Φ (1.25)

Anche in questo caso, Φ è un parametro di scala, con le proprietà sopra descritte. La famiglia sferica è però meno essibile di quella di Matérn: la sua correlazione è infatti dierenziabile una sola volta in u = Φ.

1.7 Estensioni del modello stazionario

gaussiano

A seguire, saranno esplorate due principali estensioni del modello gaussiano stazionario, spesso utilizzate nella modellizzazione dei fenomeni reali: la non stazionarietà (paragrafo 1.7.1) e la trasformazione della variabile risposta (paragrafo 1.7.2).

(32)

L'ipotesi di stazionarietà risulta in molti casi essere inverosimile, soprat-tutto per quanto riguarda l'assunzione sulla media del processo. Ad esempio, nell'applicazione oggetto dell'ultimo capitolo, si considera una media non co-stante e si analizzano i residui (intesi come la dierenza tra le osservazioni e la media stimata), in quanto non sarebbe corretto ipotizzare che la tendenza della concentrazione di clorolla non varia nello spazio. I risultati ottenuti utilizzando un modello che dipende solo dalle coordinate spaziali non risulta-no tuttavia soddisfacenti e potrebbero essere migliorati includendo nella spe-cicazione della tendenza degli eetti esterni, ossia delle variabili esplicative che dipendono dalle coordinate.

La non stazionarietà riguarda anche la struttura di dipendenza spaziale del second'ordine. In questo caso, possono essere considerati dei modelli ani-sotropici, in cui la correlazione dipende da una o più direzioni e non solo dal vettore di separazione tra i punti. Tuttavia, se da un lato è relativamente semplice esplorare eventuali comportamenti anisotropici, la computazione di tali modelli è tutt'altro che banale e, ad oggi, non sono stati implementati in alcun pacchetto computazionale geostatistico. Ciononostante, lo studio e l'implementazione di metodi anisotropici è sicuramente di notevole impor-tanza e di interesse per eventuali studi futuri, sia in generale che dal punto di vista dell'analisi dell'upwelling.

Nel paragrafo 1.7.2 si presenteranno alcune frequenti trasformazioni della variabile risposta, dovute a considerazioni empiriche, alla semplice convenzio-ne o ancora a considerazioni di carattere probabilistico sulla struttura della variabile risposta. Si descriverà il particolare caso della trasformazione loga-ritmica, utilizzata per rendere possibile una leggibile visualizzazione dei dati relativi alla clorolla.

1.7.1 Rilassamento dell'ipotesi di stazionarietà

Il caso più comune di non stazionarietà è quello in cui la media µ(x) del segnale S(x) non è costante. Si parla di drift se µ(x) è una funzione delle coordinate spaziali. La media è allora stimata tramite dei metodi di regres-sione, in cui le coordinate sono le variabili esplicative. Solitamente, non sono

(33)

considerati polinomi con grado superiore al secondo, in quanto comportamen-ti complessi sono più comunemente spiegacomportamen-ti dalla struttura di covarianza del processo. Dal punto di vista del variogramma, la presenza di un drift lineare si traduce in un andamento parabolico nell'origine dello stesso. In generale, quando µ(x) varia in funzione di una o più covariate spaziali d1(x), . . . , dr(x),

si ha µ(x) = α + r X i=1 βidi(x), (1.26)

in cui βi, i = 1, . . . , r sono i coecienti della regressione. Una volta stimata

la media, si considera quindi S(x) − µ(x) ai ni dell'analisi geostatistica. Un processo S(x) tale che S(x) − µ(x) è (debolmente) stazionario, si dice stazionario per covarianza (Diggle e Riberio, 2007).

Un'altra forma di non stazionarietà riguarda la struttura di dipendenza del second'ordine. Un modo per rilassare l'ipotesi di indipendenza per tra-slazione della funzione covarianza del segnale è quello di considerare processi anisotropici, ovvero tali per cui quest'ultima dipenda non solo dalla distanza tra due punti ma anche dal loro orientamento reciproco. In altre parole, la direzione tra due punti è rilevante e il variogramma teorico del processo varia con essa. Nella pratica, per vericare la presenza di eetti direzionali, occorre osservare i variogrammi del processo in più direzioni regolari, per individuare eventuali dierenze e anomalie. Le forme più comuni di anisotropia sono la geometrica e la zonale, che costituisce un caso degenere della prima. Per una caratterizzazione generale dell'anisotropia e dei suoi parametri si può vede-re, ad esempio, Allard, Senoussi e Porcu (2015). L'anisotropia geometrica si verica quando la sella è raggiunta in corrispondenza di range dierenti a seconda della direzione. Il modello può essere convertito in stazionario tramite una roto-traslazione delle coordinate. In due dimensioni, preso un punto (x1, x2) ∈ R2, si ha (x01, x02) = (x1, x2) cos(ΨA) − sin(ΨA) sin(ΨA) cos(ΨA) ! 1 0 0 ΨR ! . (1.27)

(34)

mentre (x0 1, x

0

2)sono le nuove coordinate. La direzione lungo cui il

variogram-ma ha il range superiore rispetto alle altre è detta asse principale. L'aniso-tropia zonale è più dicile da trattare. Si verica quando il variogramma dipende solo da alcune componenti del vettore di separazione u. In que-sto caso, sia il range che la sella variano in funzione della direzione. Non è possibile riportarsi al caso stazionario con una trasformazione delle coordi-nate, si cerca piuttosto di ottenere una combinazione lineare di variogrammi isotropici.

È ora lecito chiedersi se sia più adeguato utilizzare un modello del tipo (1.26) oppure includere gli eetti direzionali all'interno della struttara di covarianza del processo. Non vi è una risposta univoca a tale interrogativo. In termini pratici, si predilige solitamente un modello con media spaziale (1.26) laddove il variogramma presenti delle variazioni di scala comparabile con quella del fenomeno considerato. Qualora vi sia una variabilità di microscala, si ricorre invece all'uso di modelli anisotropici (Diggle e Riberio, 2007).

Per concludere, si ricorda che la stazionarietà intrinseca è una condizio-ne meno restrittiva di quella del second'ordicondizio-ne, come spiegato condizio-nel paragrafo (1.2.2). Per questo motivo, viene spesso utilizzata quando l'ipotesi di debo-le stazionarietà non è vericata. In particolare, considerando gli incrementi Du(x) come in (1.3), la varianza σ2u è anche il variogramma di S(x). Le

funzioni intrinseche possono allora essere pensate come processi il cui vario-gramma (ma non necessariamente la funzione di covarianza) dipende solo dalla separazione u tra i punti.

1.7.2 I modelli gaussiani trasformati

Nella Geostatistica, così come nelle altre aree della statistica, sono molte-plici le cause che possono suggerire una trasformazione della risposta Y. In taluni casi, si ricorre ad argomenti qualitativi o alla semplice convenzione. Ad esempio, nell'applicazione considerata nell'ultimo capitolo, si è adottata una trasformazione logaritmica delle realizzazioni di Y , prassi usuale nel-l'analisi della concentrazione di clorolla: senza tale modica, non sarebbe possibile una chiara visualizzazione spaziale dei dati. La stessa

(35)

trasforma-zione logaritmica potrebbe rivelarsi utile per convertire eetti moltiplicativi in componenti additive, più facilmente trattabili. La radice quadrata è inve-ce utilizzata per stabilizzare la varianza delle osservazioni, sotto l'ipotesi di campionamento di Poisson. È quindi evidente che vi sono numerose trasfor-mazioni ammissibili, ognuna rispondente alle necessità peculiari di ciascun problema specico. La famiglia di Box-Cox costituisce una generalizzazione empirica del modello gaussiano, in cui la scelta di una particolare trasfor-mazione corrisponde alla stima di un parametro addizionale λ. Siano Y e Y∗ rispettivamente la risposta e la sua trasformazione, secondo il modello di Box-Cox (Box e Cox, 1964). Si ha allora che

Y∗ =    (Yλ− 1)/λ λ 6= 0 log(Y ) λ = 0. (1.28) Il caso più comune è comunque quello logaritmico, λ = 0, utilizzato per l'ana-lisi oggetto di questa tesi. Per concludere questo paragrafo, si forniscono quin-di alcune relazioni esplicite per tale trasformazione. Posto T (x) = exp(S(x)), in cui S(x) è un processo stazionario gaussiano con media µ e varianza σ2,

vale µT = exp(µ + 1/2σ2), σT2 = exp(2µ + σ2)(exp(σ2) − 1), ρT(u) = exp(σ2ρ(u)) − 1 exp(σ2) − 1 , (1.29)

in cui µT, σ2T e ρT(u)sono rispettivamente la media, la varianza (costanti) e

la funzione di correlazione del processo.

1.8 I modelli lineari generalizzati geostatistici

In questo paragrafo si darà una breve panoramica dei modelli lineari gene-ralizzati per i dati geostatistici. Tale argomento è trattato per completezza ma risulta essere marginale rispetto agli scopi della presente tesi.

(36)

I modelli lineari generalizzati geostatistici rappresentano un'estensione al caso dei modelli lineari generalizzati (GLM), introdotti da Nelder e Wed-deburn (1972). Date n variabili aleatorie Y1, . . . , Yn, con media E[Yi] = µi,

∀i = 1, . . . , n, un GLM è tale che le Yi seguano la stessa distribuzione di

probabilità e siano tra loro indipendenti. Inoltre, vale la seguente relazione:

h(µi) = d(xi)Tβ ∀i ∈ 1, . . . , n, (1.30)

in cui h(·) è detta link function, d(xi) è un vettore di k variabili esplicative

associate a ciascuna variabile Yi e β è un vettore di parametri sconosciuti.

Si osservi che, se h(·) è la funzione identità, la (1.30) corrisponde alla (1.26) calcolata nei punti di campionamento xi.

Un modello lineare generalizzato misto (GLMM) include, nella specica-zione della link function, una componente stocastica ˜S = ( ˜S1, . . . , ˜Sn), detta

variabile latente:

h(µi) = d(xi)Tβ + ˜Si ∀i ∈ 1, . . . , n. (1.31)

Nel caso specico dei dati geostatistici, le variabili ˜Si corrispondono al segnale

calcolato in corrispondenza del punto xi, ovvero ˜Si = S(xi). Inoltre, le

Yi non sempre sono indipendenti; al contrario, le (y1, . . . , yn) sono spesso

considerate come realizzazioni di una singola variabile risposta multivariata Y. Un esempio di GLMM geostatistico è quello in cui le risposte Yi seguono

la distribuzione di Poisson, condizionatamente al segnale S, e la link function è il logaritmo:

log(µi) = α + S(xi), (1.32)

in cui α è un parametro reale. Per una visione pù approfondita dei modelli lineari generalizzati misti e delle loro applicazioni si rimanda a Breslow e Clayton (1993).

(37)

Capitolo 2

La stima classica dei parametri

2.1 Introduzione

In questo capitolo, mi soermerò sulla stima classica dei parametri di un modello geostatistico che possa descrivere un processo spaziale continuo S(x), a partire da un insieme nito di osservazioni y1, . . . , yn. Per una visione

bayesiana, si può vedere, ad esempio, Diggle e Riberio (2007), Capitolo 7. Per quanto riguarda la struttura del capitolo, illustrerò dapprima il pro-blema della stima della media µ(x) del processo, tramite il metodo dei minimi quadrati (paragrafo 2.2). Come puntualizzato nel paragrafo 1.7, l'assunzione di stazionarietà per la media risulta essere un'ipotesi non verosimile in gran parte dei problemi reali e può portare a stime erronee del variogramma. Ai ni del calcolo del variogramma approssimato, si considerano pertanto i re-sidui Ri, ottenuti sottraendo alle variabili risposta Yi le medie approssimate

ˆ

µ(x), valutate nei punti xi, e ˆµi = ˆµ(xi). Il paragrafo 2.3 descrive il problema

della stima non parametrica del variogramma, mentre il 2.4 di quella para-metrica. Nel 2.4.3 verrà illustrato il metodo della massima verosimiglianza composita, che costituisce un ecace compromesso tra l'ecienza statistica e la complessità computazionale, nel caso di grandi insiemi di dati. Tale me-todo sarà applicato nel quinto capitolo, per la stima spaziotemporale della struttura di correlazione relativa alla concentrazione di clorolla nella costa settentrionale del Cile. Inne, nel paragrafo 2.5 si esporranno alcuni metodi

(38)

di confronto per la scelta dei modelli geostatistici, descrivendo un partico-lare criterio ottenuto a partire dal metodo della verosimiglianza composita, implementato nel pacchetto CompRandFld e utilizzato ai ni della presente tesi.

2.2 La stima della media

Si consideri un processo gaussiano S(x) la cui media è descritta da

µ(x) = β0+ p

X

i=1

βidi(x), (2.1)

in cui le di(x) sono p variabili esplicative e i coecienti βi, per i = 1, . . . , n,

sono i parametri da stimare. Ponendo µ = (µ1, . . . , µn) e β = (β0, . . . , βp), si

avrà allora µ = Dβ, in cui la matrice D è data da

D =     1 d1(x1) . . . dp(x1) ... ... ... ... 1 d1(xn) . . . dp(xn)     . (2.2)

Il metodo dei minimi quadrati cerca lo stimatore ˆβ di β che minimizza la quantità Pn

i=1(Yi− µi)

2. Tale stimatore è dato da

ˆ

β = (DTD)−1DTY. (2.3) Si noti che ˆβ è non distorto e non dipende dalla struttura di covarianza di Y , descritta dalla matrice V tale che Vij = Cov(Yi, Yj). Qualora V fosse nota,

uno stimatore più eciente sarebbe

˜

β = (DTV−1D)−1DTV−1Y. (2.4) ˜

β è lo stimatore a varianza minima tra quelli lineari e non distorti. Inoltre, dato che Y è un processo gaussiano, (2.4) è anche lo stimatore della massima verosimiglianza per β.

(39)

2.3 La stima non parametrica del variogramma

Una prima stima del variogramma (1.17) è data dalle quantità vij = 12(Yi−

Yj), per ogni punto uij della regione considerata A ⊂ Rk, e uij = xi− xj per

ogni xi e xj in A. La collezione di coppie (uij, vij)è detta variogramma

empi-rico, o variogram cloud di Y . Si ricordi che, nel caso debolmente stazionario, il variogramma approssimato di Y assume la forma

γY(uij) =

1

2E[(Yi− Yj)

2]. (2.5)

Si può allora osservare che le vij sono degli stimatori non distorti per (2.5).

Tuttavia, il variogramma empirico risulta essere costituito da 1

2n(n−1)coppie

tra loro correlate, in quanto vi sono solo n osservazioni totali. Inoltre, l'or-dinata vij è proporzionale a una χ2(1), distribuione fortemente asimmetrica.

Un altro problema è che il variogramma così ottenuto è piuttosto irregola-re, mentre γY(u) dovrebbe variare regolarmente. Si considerano quindi le

quantità ˆ γY(uk) = 1 2|Nk| X i∈Nk E[(Yi− Yj)2], (2.6)

ottenute a partire dallo stimatore classico, introdotto da Matheron (1962). Nella (2.6), Nk è l'insieme delle coppie di punti la cui distanza è pari a uk e

|Nk|è la sua cardinalità. Più in generale, si considera una regione di

tolleran-za attorno al valore uk, in quanto non sempre si ha a disposizione una griglia

perfettamente regolare. Lo stimatore ˆγY(·), detto variogramma

campiona-rio, è non distorto e costituisce una stima più verosimile per γY(·)rispetto al

variograma empirico, ma è sensibile alla presenza di outliers e risente degli stessi problemi descritti per il variogramma empirico. Nella gura 2.1 sono riportati il variogram cloud e il variogramma campionario, ottenuti grazie alla funzione EVariogram() del pacchetto CompRandFld, a partire da un insieme di 468 osservazioni satellitari relative alla concentrazione di clorolla nella costa settentrionale del Cile. Si noti che il variogramma campionario viene di norma plottato per distanze inferiori alla distanza di campionamento disponibile. Questo si deve da una parte al fatto che, in prossimità di grandi

(40)

Figura 2.1: Variogram cloud (a sinistra) e variogramma campionario (a destra), per un campione di 468 osservazioni satellitari relative alla concentrazione di clorolla nella costa settentrionale del Cile.

distanze, vi siano meno coppie disponibili, dall'altra alla minore precisione delle stime, dovuta a una maggiore correlazione tra le vij (Diggle e Riberio,

1997; Padoan e Bevilacqua, 2015). Tali considerazioni saranno approfondi-te nel quinto capitolo, cuando si renderà necessario scegliere la numerosità e l'ampiezza degli intervalli spaziali per la visualizzazione del variogramma campionario relativo alla concentrazione di clorolla.

Per le problematiche sopra elencate, si preferisce utilizzare gli stimatori non parametrici vij e (2.6) solo per l'analisi espolatoria dei dati e per la

ricerca iniziale delle cosiddette quantità pilota, ossia dei valori iniziali per delle stime di tipo parametrico, descritte nel prossimo paragrafo.

2.4 La stima parametrica del variogramma

2.4.1 Il metodo dei minimi quadrati

Il metodo dei minimi quadrati stima i parametri θ del variogramma γY(u; θ),

a partire dalle quantità (uk, vk, nk), in cui vk rappresenta la media delle

(41)

nume-ro di ordinate che contribuiscono alla media, per k = 1, . . . , m. L'algoritmo dei minimi quadrati ordinari minimizza il criterio

S0(θ) = m

X

k=1

(vk− γY(uk; θ))2. (2.7)

Un ranamento di (2.7) è ottenuto pesando l'eetto della variazione di nk, tramite il metodo dei minimi quadrati pesati. La quantità che viene

minimizzata è, in questo caso,

Sn(θ) = m

X

k=1

nk(vk− γY(uk; θ))2. (2.8)

Per concludere, si considera un criterio proposto da Cressie (1985), che si basa sull'osservazione che la varianza di vk dipende non solo dal valore di nk

ma anche variogramma teorico γY(uk; θ). Infatti, assumendo un modello

sta-zionario gaussiano, si ha che E[vk] = γY(uk) e Var(vk) = 2γY(uk; θ). Cressie

propose dunque di minimizzare

SV(θ) = m X k=1 nk  (vk− γY(uk; θ)) γY(uk; θ) 2 . (2.9)

Si osservi inne che i metodi basati sul variogramma campionario pro-ducono delle stime troppo regolari rispetto a quello reale. Inoltre, un unico outlier può potenzialmente compromettere i valori di n − 1 ordinate del va-riogramma. Anche la stima dell'eetto pepita è delicata, in quanto i meto-di sopra descritti utilizzano procedure meto-di estrapolazione, operazione spesso pericolosa (Diggle e Riberio, 2007).

2.4.2 La massima verosimiglianza classica e ristretta

Gli stimatori di massima verosimiglianza (ML) sono generalmente considerati le migliori opzioni per la stima dei parametri del variogramma e risultano essere non viziati, consistenti, ecienti e asintoticamente normali. Per una discussione generale dei metodi di massima verosimiglianza, si può vedere,

(42)

ad esempio, Azzalini (1996).

Si assuma un modello stazionario gaussiano, come descritto nel Capitolo 1, i.e. Yi = S(xi) + Zi, Zi ∼ N (0, τ2) ∀i ∈ 1, . . . , n. In questo caso,

risul-ta semplice dedurre la funzione di verosimiglianza e la stima dei parametri incogniti. Y segue la distribuzione

Y ∼ N (Dβ, σ2R(Φ) + τ2I). (2.10)

D e β sono le stesse descritte in (2.1) e (2.2); σ2 è la varianza del processo

S(x)e σ2R(Φ)la sua matrice di varianza-covarianza. In particolare, R

ij(Φ) =

ρij(Φ), in cui ρ(·) è la funzione di correlazione del processo. Inne, τ2I è

la matrice di varianza-covarianza del vettore gaussiano Z. Le funzioni di verosimiglianza e di log-verosimiglianza saranno allora:

L(β, τ2, σ2, φ) = exp (y − Dβ) T2R(Φ) + τ2I)−1(y − Dβ) p(2π)n2R(Φ) + τ2I| , (2.11) l(β, τ2, σ2, φ) = − 1 2 n log(2π) + log(|σ 2R(Φ) + τ2I|) + + (y − Dβ)T(σ2R(Φ) + τ2I)−1(y − Dβ). (2.12)

Sia ν2 = τ22 il cosiddetto noise-to-signal ratio. Tale riparametrizzazione

risulta utile per comparare l'impatto dell'errore di misurazione con la varia-bilità del processo. Un possibile algoritmo per la massimizzazione di (2.12) è descritto a seguire.

1. Sia V = σ2R(Φ) + τ2I. Massimizzando (2.12), si ottiene

ˆ β(V ) = (DTV−1D)−1DTV−1y, (2.13) ˆ σ(V ) = 1 n y − D ˆβ(V )) TV−1 (y − D ˆβ(V ). (2.14) Si osservi che, se V è nota, la (2.13) equivale allo stimatore dei minimi quadrati generalizzato (2.4).

(43)

concentrata:

l0(ν2, Φ) = −

1

2(n log(2π) + n log σ

2(V ) + log |V | + n). (2.15)

3. Inne, si ottimizza numericamente la (2.15) rispetto a Φ e a µ; i dettagli dell'ottimizzazione potrebbero dipendere dalla particolare famiglia di covarianza considerata. Le stime così ottenute sono sostituite in (2.13) e (2.14).

Il metodo della massima verosimiglianza ristretta (REML) permette di rimuovere la dipendenza di (2.12) dal parametro β che descrive la media del processo. Più in generale, la REML può essere utilizzata per diminuire la dimensione del vettore dei parametri θ. Per illustrare il metodo, si consideri un modello che dipende da due soli parametri θ = (α, Ψ). La massima verosimiglianza ristretta per α, o prole likelihood è data da

lp(α) = l(α, ˆψ(α)) = max

ψ l(α, ψ). (2.16)

La funzione da massimizzare dipende quindi solo da α, in quanto la log-verosimiglianza è già stata massimizzata in funzione di Ψ, considerando α ssato. Generalizzando la denizione al caso di m parametri incogniti, con m ≥ 2, si può notare che la massima verosimiglianza concentrata (2.15) non è altro che la log-verosimiglianza ristretta per (ν2, Φ). Si osserva inne

che, nel caso gaussiano, sotto l'assunzione E[Y ] = Dβ, è sempre possibile trasformare i dati in Y∗ = AY in modo tale che Y non dipenda da β. Si

consideri, ad esempio, la matrice A = I − D(DTD)−1DT, che proietta Y

sullo spazio generato dai residui dei minimi quadrati. Si dimostra inoltre che la stima ottenuta massimizzando la log-verosimiglianza di Y∗ non dipende

dalla scelta di A.

2.4.3 La verosimiglianza composita

La verosimiglianza composita (CL) (Lindsay, 1988) costituisce un metodo di stima alternativo alla massima verosimiglianza e permette di

(44)

diminuir-ne notevolmente i tempi computazionali. Ciascuna valutaziodiminuir-ne della log-verosimiglianza richiede l'inversione della matrice di varianza-covarianza. Per un insieme di n osservazioni, l'ordine computazionale per tale operazione è pari a O(n3). La verosimiglianza composita permette di calcolare una pseudo

log-verosimiglianza in O(n2). Chiaramente, la velocizzazione computazionale

è bilanciata da una perdita in ecienza, ma i risultati asintotici sono rassi-curanti: lo stimatore ottenuto è consistente e asintoticamente normale, come dimostrato da Bevilacqua, Gaetan, Mateu e Porcu (2012), nel caso spazio-temporale. Altri approcci per la risoluzione del problema della stima dei parametri, nel caso di grandi insiemi di dati, mirano invece ad approssimare la matrice di varianza-covarianza, piuttosto che a considerare una dierente funzione obiettivo. Ad esempio, Kaufman, Schervish e Nychka (2008) pro-pongono un metodo basato sul tapering: la varianza-covarianza viene molti-plicata, elemento per elemento, per una matrice di correlazione sparsa. La matrice risultante può così essere manipolata utilizzando degli ecienti al-goritmi per le matrici sparse. Padoan e Bevilacqua (2015) mostrano tuttavia che lo stimatore della verosimiglianza composita è ancor più veloce.

Bevilacqua et al. (2012) partono dai risultati spaziali di Curriero e Le-le (1999), che proposero una particolare forma di CL basata sulLe-le dieren-ze Uij = Yi − Yj. Gli autori estendono tale concetto al contesto

spazio-temporale e propongono due stimatori per i parametri incogniti: quello della verosimiglianza composita pesata (WCL) e un secondo stimatore calcolato a partire dagli score (WCS), valido anche al di fuori del contesto spaziale. Inne, viene proposto un criterio informativo per la selezione di un modello spazio-temporale.

Siano lij(θ) le log-verosimiglianze delle dierenze. La verosimiglianza

composita è data da cl(θ) = n X i=1 n X j>i lij(θ). (2.17)

(45)

in cui γij = γY(uij), con uij = xi− xj. La (2.17) diventa cl(θ) = − n X i=1 n X j>i  log(γij(θ)) 2 + Uij2 4γij(θ)  . (2.18)

Lo stimatore della verosimiglianza composita è non distorto e non richiede l'inversione di alcuna matrice. L'ordine computazionale per la valutazione di (2.18) è pari a O(n2). Si osserva che i risultati sono validi anche per

Uij = Yi|Yj e Uij = (Yi, Yj); tali soluzioni sono implementate nel pacchetto

CompRandFld (Padoan e Bevilacqua, 2012).

La funzione della verosimiglianza composita pesata è ottenuta a partire da (2.17), considerando dei pesi che tengono conto della distanza tra le coppie di osservazioni: wcl(θ) = n X i=1 n X j>i lij(θ)wij. (2.19)

Vi sono varie scelte per i pesi. La più immediata considera wij = 1 se

||xi − xj|| < dS, wij = 0 altrimenti, in cui dS è una distanza ssata. Lo

stimatore così ottenuto è debolmente consistente e asintoticamente normale, con matrice di varianza-covarianza G(θ)−1 tale che

G(θ) = H(θ)J (θ)−1H(θ)T (2.20) è la matrice di informazione di Godambe e

H(θ) = −E[∇2wcl(θ)], J (θ) = E[∇ wcl(θ)∇ wcl(θ)T],

in cui ∇ denota l'operatore dierenziale. Gli autori mostrano che, dato un modello di correlazione strettamente decrescente, l'ecienza asintotica relativa (ARE) dello stimatore WCL rispetto allo stimatore REML decresce all'aumentare della soglia dS. È allora possibile scegliere dS in modo tale da

migliorare l'ecienza di (2.19)

d∗S = arg min

d∈D

Figura

Figura 1.1: Variogramma di un processo stocastico stazionario con discontinuità nell'origine
Figura 1.2: Funzione di correlazione e variogramma esponenziale (a sinistra) e gaussiano (a destra), con varianza unitaria.
Figura 1.3: Funzione di correlazione esponenziale di un processo stocastico gaussiano, al variare del parametro di scala Φ = 0.05 (linea piena), Φ = 0.50 (linea tratteggiata), Φ = 1.00 (linea punteggiata).
Figura 1.4: Funzione di correlazione di Matérn di un processo stocastico gaussiano, al variare dei parametri k e Φ, approssimati per ottenere uno stesso practical range
+7

Riferimenti

Documenti correlati

Normalmente, il completamento della reazione viene indicato dal cambiamento di colore di una sostanza posta ad hoc in soluzione, un indicatore, presente in poche gocce...

I dati sono eloquenti: Italia e Francia sono molto vicine in termini di quota di mercato delle prime 5 banche e di indice di concentrazione; in Spagna il sistema si addensa

La presenza in Cile, con l’osservazione diretta dei limiti e dei bisogni non solo del sindacalismo cileno, ma della società stessa, diedero il via a una fase di cooperazione che

Questa comunicazione presenta i risultati di uno studio condotto dall’Università degli Studi di L’Aquila, Dipartimento di Architettura ed Urbanistica, e l’Università degli

Dall’analisi della distribuzione spaziale (effettuata in ambiente GIS) della concentrazione di radon nelle acque sorgive di una serie di sorgenti site in Calabria settentrionale,

Trasferimento da Punta Arenas con Bus Regolare (senza guida) a Puerto Natales (Light Box lunch incluso) Si viaggerà per circa tre ore verso Puerto Natales, una piccola cittadina

Il piano prevede un impegno economico di 9,5 milioni di euro, ha una durata di nove mesi e intende fornire sostegno a 108.416 famiglie (542.000 persone) nelle diocesi di

Abbiamo con- dotto uno studio, insieme ai nostri colleghi Olandesi, volto a verificare se ci fossero differenze fra il citrato 105 mM ed il citrato 109 mM (3).Quest’ultimo studio si