• Non ci sono risultati.

Inversione geostatistica per la stima congiunta di impedenza acustica e facies litologiche da dati sismici post stack.

N/A
N/A
Protected

Academic year: 2021

Condividi "Inversione geostatistica per la stima congiunta di impedenza acustica e facies litologiche da dati sismici post stack."

Copied!
93
0
0

Testo completo

(1)

Dipartimento di Scienze della Terra

Corso di Laurea Magistrale in Geofisica di Esplorazione ed Applicata

Tesi di Laurea Magistrale

Inversione geostatistica per la stima congiunta di impedenza

acustica e facies litologiche da dati sismici post stack

Candidato:

Davide PECCI

Relatore:

Prof. Mattia ALEARDI

Controrelatore:

Prof. Alfredo MAZZOTTI

ANNO ACCADEMICO 2019/2020

(2)

Indice

ABSTRACT ... IV

CAPITOLO 1 ... 6

INTRODUZIONE ... 6

CAPITOLO 2 ... 9

STATO DELL’ARTE –LA GEOSTATISTICA ... 9

2.1 Cenni storici ... 9

2.2 Obiettivi della Geostatistica ...10

2.3 Fasi dell’analisi Geostatistica ...11

CAPITOLO 3 ... 12

MATERIALI E METODI ...12

3.1 Inversione Sismica ...12

3.2 Gaussian-Mixture e Classificazione Bayesiana ...14

3.2 Variabile Aleatoria ...17 3.3 Assunto di Stazionarietà ...19 3.4 Correlazione Spaziale...20 3.5 Variogramma ...22 3.6 Stima di Kriging...24 3.6.1 Simple Kriging...24 3.6.2 Finestra di ricerca ...26 3.6.3 Stima di Co-Kriging ...29

3.6.4 Stima di Collocated Co-Kriging ...30

3.7 Inversione Geostatistica ...32

3.8 Inversione Lineare ...51

CAPITOLO 4 ... 57

RISULTATI ...57

(3)

CONCLUSIONI ...84

APPENDICE A ... 88

DIRECT SEQUENTIAL SIMULATION E CO-SIMULATION ...88

(4)

Abstract

La stima delle proprietà del sottosuolo (impedenze, velocità sismiche, o densità) è uno degli step fondamentali per la caratterizzazione del reservoir. Tale processo applica algoritmi di inversione che sfruttano congiuntamente l’informazione proveniente dal dato sismico a riflessione e quella derivante da registrazioni in pozzo e/o precedenti interpretazioni geologiche. Tipicamente tali problemi di inversione sono mal posti, nel senso che più modelli di sottosuolo spiegano il dato osservato. Per tale motivo è necessario inserire all’interno del framework di inversione opportune regolarizzazioni nello spazio dei modelli che riducano il numero delle possibili soluzioni. Tali regolarizzazioni possono essere trattate come vincoli hard o soft (hard e soft constraints). I primi forzano il modello a onorare perfettamente determinati valori misurati nel sottosuolo (ad esempio in pozzo); i secondi invece guidano il modello predetto verso determinate assunzioni, ad esempio, circa la distribuzione spaziale e/o temporale delle proprietà di interesse. Un’altra difficoltà nella reservoir characterization risiede nella complessa distribuzione e/o mutua influenza delle proprietà di interesse e la loro dipendenza da variabili “nascoste” come le facies lito-fluide. Tale caratteristica fa sì che le variabili continue in gioco (es. impedenze sismiche) assumano distribuzioni multimodali in cui a ciascuna moda è di solito associata una diversa facies.

Detto ciò, nel presente lavoro di tesi è implementato un algoritmo di inversione geostatistica per la stima congiunta di facies e impedenze acustiche da dati sismici post-stack. Tale algoritmo tiene in considerazione sia vincoli hard che soft al fine di ridurre il mal condizionamento del problema. Entrambi i vincoli sono derivati dai log disponibili nell’area di indagine. In particolare, come vincolo soft si assumerà che la distribuzione dei valori di impedenza segua un modello Gaussian mixture in cui ciascuna componente della mistura viene associata ad una specifica facies. Si assumerà, inoltre, che la distribuzione spaziale/temporale dei valori di impedenza segua un modello di variogramma Gaussiano. Fissati tali vincoli l’inversione procede in maniera iterativa. Il primo step riguarda la generazione di una popolazione di modelli iniziali, cioè modelli di facies e relative impedenze acustiche tutti in accordo con i vincoli imposti. A tal fine si è utilizzato il Simple Kriging per la generazione dei modelli di impedenza, coadiuvato a un algoritmo di classificazione Bayesiana per la determinazione dei modelli di facies ad essi associati. Da questi starting models vengono ricavate le tracce di riflettività che, convolute con un’ondina sorgente, generano i sismogrammi sintetici predetti corrispondenti. Dopo di ciò l’iniziale popolazione di modelli viene aggiornata grazie ad un processo di inversione geostatistica guidato dal valore di correlazione tra dati predetti e dati osservati. Più in dettaglio in ogni iterazione, si individueranno all’interno di finestre temporali le porzioni dei modelli

(5)

di impedenza correnti che forniscono le migliori predizioni del dato. Tali porzioni verranno assemblate a formare il modello di impedenza migliore (“best”) per l’iterazione corrente che guiderà l’aggiornamento e la perturbazione della popolazione attuale di modelli e quindi la formazione della nuova popolazione per l’iterazione successiva. Tale processo di aggiornamento avverrà grazie al metodo del Collocated Co-Kriging in cui la variabile ausiliaria sarà il modello di impedenza “best” ricavato all’iterazione precedente. Tale metodo che di base assume distribuzioni Gaussiane è stato opportunamente modificato al fine di modellare proprietà distribuite in accordo ad una Gaussian-mixture. Infatti, al fine di preservare i vincoli hard e soft in tutti i modelli generati, l’aggiornamento sarà guidato non solo dalla variabile continua (impedenza acustica) ma anche dalla variabile discreta che rappresenta la facies che ad ogni iterazione viene stimata utilizzando sempre una classificazione Bayesiana.

Gli algoritmi di inversione geostatistica sono di solito associati ad un elevato costo computazionale di ciascuna iterazione e da una lenta convergenza verso modelli predetti con buon data fitting. Per tale motivo, l’inversione geostatistica implementata è stata ibridizzata con un ulteriore step di inversione analitica lineare che applicata iterazione dopo iterazione in corrispondenza delle porzioni di modello associate a data misfit più elevato, guiderà rapidamente il processo geostatistico iterativo verso modelli di impedenza che ben riproducono il dato stack osservato. Tutto il processo di inversione procederà fino al raggiungimento di un data matching ritenuto soddisfacente.

L’algoritmo implementato è stato testato su dati sintetici 2-D ricavati da un modello di sottosuolo realistico che rappresenta una successione torbiditica argilloso-sabbiosa con alcuni intervalli di sabbie sature in gas. In particolare, si analizzerà la robustezza del metodo di inversione proposto e come le predizioni fornite siano influenzate da diversi livelli di rumore nel dato (assunto Gaussiano sia correlato che scorrelato) e da errori nella stima della fase e dell’ampiezza dell’ondina sorgente. Si analizzerà anche come i risultati siano influenzati dal numero di facies assunte.

I test effettuati dimostrano, come atteso, che la bontà delle predizioni diminuisce all’aumentare del rumore nel dato, e all’aumentare dell’errore nella stima dell’ondina. Ma in ogni caso l’inversione implementata si è dimostrata una strategia promettente che fornisce risultati stabili e soddisfacenti anche in condizioni di basso rapporto segnale/noise e con errori significativi nella stima dell’ondina sorgente.

(6)

Capitolo 1

Introduzione

Dall’inizio di questo secolo, raggiungere giacimenti di olio e gas comporta costi molto elevati per la perforazione e la raccolta di dati di pozzo, per non parlare degli ingenti investimenti in ricerca e sviluppo volti ad implementare dei metodi di esplorazione geofisica più economici ed efficienti (Azevedo & Soares, 2017). Nell’ultimo decennio tali sviluppi tecnologici e scientifici hanno incrementato notevolmente la qualità dei dati geofisici raccolti (in particolare i dati di sismica a riflessione) ed hanno anche aumentato la raffinatezza, complessità ed efficienza dei metodi utilizzati per il loro processing, interpretazione ed inversione.

Uno degli obiettivi dell’inversione sismica è la caratterizzazione sismica del reservoir, cioè descrivere la variabilità spaziale delle proprietà elastiche e/o petrofisiche e delle facies lito-fluide nella regione di interesse (De Figueiredo et al., 2019). I metodi di esplorazione indiretta, come la riflessione sismica, sono spesso utilizzati per acquisire grandi volumi di dati per i giacimenti di idrocarburi (Waters, 1987). Negli anni ‘70 i geofisici hanno iniziato ad elaborare dati sismici, come le ampiezze post-stack e i coefficienti di riflessione, per prevedere i cambiamenti nella litologia e la presenza di fluidi (Hampson et al., 2001). Tentando di mettere in relazione le ampiezze sismiche con le proprietà delle rocce, fu introdotto il concetto di impedenza acustica come prodotto della velocità delle onde sismiche compressive (Vp) per la densità della roccia. La maggior parte dei metodi di inversione sismica trasformano le ampiezze di riflessione sismica in valori di impedenza, dai quali possono essere derivati modelli di litologia e porosità (Latimer et al., 2000). Poiché le impedenze acustiche sono fisicamente correlate con le ampiezze sismiche, queste possono essere approssimate dalla convoluzione della traccia di riflettività (contenente i coefficienti di riflessione) con un’ondina nota.

Questa relazione fisica ha permesso quindi di derivare i valori di impedenza acustica dalle ampiezze sismiche misurate in dominio post-stack. Successivi sviluppi hanno permesso poi di ricavare non solo i valori di impedenza acustica ma quelli delle velocità delle onde P, S e densità dalla variazione del coefficiente di riflessione al variare dell’angolo di incidenza.

L'obiettivo della modellazione inversa è quello di prevedere un insieme di parametri del modello da un insieme di dati osservati basati sulle relazioni teoriche tra i parametri osservabili e quelli non osservabili e sulle informazioni a priori (Tarantola, 2005).

(7)

Negli ultimi anni, inoltre, grazie a sofisticate tecniche di inversione è diventato possibile non solo stimare le proprietà elastiche e petrofisiche (porosità, saturazione in acqua ecc…) del sottosuolo, ma anche stimare le facies lito-fluide (quindi proprietà discrete) presenti nell’area di indagine.

L’interesse per l’inversione sismica è cresciuto negli ultimi anni, soprattutto perché permette di dedurre le proprietà petrofisiche nelle fasi iniziali degli studi sui giacimenti quando i dati dei pozzi sono scarsi e sono disponibili solo dati sismici.

Il problema dell’inversione sismica ha cominciato ad essere affrontato con metodologie deterministiche, tuttavia il contributo della geostatistica all’esplorazione e allo sfruttamento dei giacimenti petroliferi sta diventando importante ed è in grado di fornire risposte a molti dei problemi di caratterizzazione dei reservoirs. In particolare, la stima dei parametri elastici, petrofisici, o la stima delle facies dai dati sismici acquisiti è un problema mal posto, in cui diversi modelli riproducono il dato geofisico misurato. In tale contesto il vantaggio dei metodi geostatistici in confronto a quelli deterministici risiede nella possibilità di produrre sia un’immagine media che un insieme di immagini equiprobabili della distribuzione spaziale delle proprietà di interesse nel sottosuolo, attraverso le quali è possibile quantificare l’affidabilità del modello stimato e definire possibili scenari in accordo con i dati geofisici misurati (Deutsch & Journel, 1997; Almeida, 2010 a).

Un altro vantaggio delle tecniche geostatistiche è quello di poter integrare agevolmente all’interno del processo di inversione misure puntuali già acquisite nell’area di indagine (ad esempio misure di pozzo) considerate come hard constraint. Risulta quindi chiaro come l’inversione stocastica basata sulla geostatistica è un metodo competitivo per combinare i dati sismici e i dati di well-log al fine di ottenere predizioni affidabili.

In questo lavoro di tesi ci focalizzeremo sull’implementazione di un’inversione geostatistica iterativa che stimi sia l’impedenza acustica, sia le facies lito-fluide da dati sismici post-stack. Al fine di modellare correttamente l’influenza della variabile discreta (facies), sulla proprietà continua (impedenza acustica, Ip), si assumerà che i valori di impedenza seguano una distribuzione a priori Gaussian-mixture (Grana et al., 2012; Dubreuil et al., 2012; Grana et al., 2017). In altri termini ogni componente della mistura sarà associato ad una singola facies all’interno della quale l’impedenza viene assunta Gaussiana.

Essendo il problema in esame intrinsecamente mal posto sarà fondamentale imporre dei constraints (vincoli di well-log e di correlazione spaziale) all’interno dell’inversione in modo che i modelli predetti rispettino alcune caratteristiche statistiche e strutturali, limitando perciò il numero di soluzioni che si adattano al dato osservato. L’aggiornamento dei modelli di sottosuolo generati tramite i metodi geostatistici sarà guidato da un criterio di massimizzazione tra i dati predetti (calcolati sui modelli generati) ed il dato sismico effettivamente osservato.

(8)

Al fine di velocizzare tale processo iterativo si è inoltre inserito uno step intermedio di inversione lineare, computazionalmente molto veloce, nella seconda fase di simulazione sequenziale, per spronare l’algoritmo a produrre simulazioni che comportino fin da subito un’ottima correlazione tra dato sismico predetto e dato sismico osservato. L’inversione sarà applicata a dati sintetici sotto diverse condizioni di rumore, e simulando anche errori nella stima dell’ondina sorgente.

Nell’Appendice A descriviamo brevemente anche un altro algoritmo, implementato durante il lavoro di tesi, che consiste in un’inversione geostatistica per la stima congiunta di porosità e impedenza acustica, anch’esso in dominio post-stack. Questo algoritmo ci permetterà di considerare la naturale distribuzione non parametrica delle proprietà in esame.

(9)

Capitolo 2

Stato dell’arte – La Geostatistica

2.1 Cenni storici

I primi studi di carattere geostatistico risalgono agli inizi degli anni ’50 e sono riconducibili all’ingegnere Daniel Krige ed allo statistico Herbert Sichel. Il termine Geostatistica, coniato dall’ingegnere Georges Matheron, professore all’École Normale Supérieure des Mines de Paris, è stato utilizzato per indicare l’insieme delle metodologie per lo studio della Geologia o, più in generale, delle Scienze della Terra.

I dati delle Scienze della Terra sono tipicamente distribuiti nello spazio e/o nel tempo. La geostatistica fornisce un insieme di strumenti statistici per incorporare le coordinate spaziali e temporali dell’osservazione nell’elaborazione/predizione dei dati. Lo sviluppo della geostatistica è nato dalla necessità di una metodologia per valutare le riserve recuperabili nei giacimenti minerari. La priorità è stata data alla praticità, un marchio di fabbrica attuale della geostatistica che spiega il suo successo e la sua applicazione in campi diversi come l’estrazione mineraria, l’industria petrolifera, la scienza del suolo, l’oceanografia, l’idrogeologia, il telerilevamento e le scienze ambientali (Goovaerts, 1997), sfociando persino nel Marketing e nella Finanza. Fino alla fine degli anni ‘80, la geostatistica era vista essenzialmente come un mezzo per descrivere i modelli spaziali e per interpolare il valore dell’attributo di interesse in posizioni non campionate. La geostatistica è ora sempre più utilizzata per modellare l’incertezza sui valori sconosciuti attraverso la generazione di immagini alternative (realizzazioni) che onorano i dati e riproducono aspetti dei modelli di dipendenza spaziale o altre statistiche ritenute conseguenti al problema in questione. Un determinato scenario può essere applicato all’insieme delle realizzazioni, consentendo di valutare l’incertezza della risposta (Posa & De Iaco, 2009).

(10)

2.2 Obiettivi della Geostatistica

La geostatistica trova applicazione in tutti quei settori in cui la continuità spaziale dei fenomeni è un elemento determinante. In altre parole, gli strumenti geostatistici consentono di analizzare quei fenomeni che si manifestano con continuità nel dominio oggetto di indagine e che possono quindi essere osservati in ogni punto del dominio stesso. In generale è possibile utilizzare tali strumenti per analizzare i cosiddetti dati a struttura spaziale, ossia le misurazioni di una o più caratteristiche rilevate in corrispondenza di alcune posizioni di uno spazio o di un’area geografica.

Le caratteristiche fondamentali dei dati a struttura spaziale sono:

• La non ripetitività: in ogni posizione si dispone soltanto di una osservazione;

• La dipendenza: i valori che una caratteristica assume in diverse posizioni sono dipendenti, ovvero posizioni molto vicine sono, di solito, caratterizzate da valori molto simili, rispetto a valori osservati in posizioni più distanti.

Ciò che differenzia la Statistica classica dalla Geostatistica è che quest’ultima consente di tenere conto della dipendenza spaziale tra le osservazioni.

L’analisi geostatistica di una o più variabili è composta da una serie di tecniche probabilistiche che, nell’ambito di un dominio o di un’area geografica di interesse consente di:

• Individuare posizioni che presentano valori anomali o, semplicemente, eccessivamente bassi o elevati rispetto ad una certa soglia di riferimento;

• Rilevare direzioni privilegiate lungo le quali si presenta una diminuzione oppure un aumento sistematico dei valori osservati;

• Valutare la correlazione spaziale tra i valori osservati, ovvero l’eventuale relazione lineare tra le misurazioni considerando che in generale, quanto più le posizioni in esame sono vicine, tanto più i valori osservati in tali posizioni sono simili;

• Definire un modello in grado di interpretare la distribuzione spaziale delle variabili in esame; • Fornire possibili scenari relativi alla distribuzione spaziale delle variabili in esame sul

dominio di interesse (simulazione).

Il classico flusso di lavoro dell’analisi geostatistica prevede quindi l’inserimento di dati a struttura spaziale e modelli di covarianza spaziale come input per i metodi di elaborazione che restituiscono come output possibili simulazioni e mappe di probabilità (figura 2.1):

(11)

Fig. 2.1 Classico flusso di lavoro di un’analisi geostatistica.

Occorre anche fare una distinzione su quelli che sono gli obiettivi inferenziali e quelli di simulazione. Nel primo caso l’informazione derivante da valori osservati in alcuni punti del dominio viene utilizzata per stimare la variabile in esame in posizioni non campionate. Tale obiettivo viene perseguito utilizzando tecniche di interpolazione stocastica (ad esempio il Kriging). Nel secondo caso gli strumenti geostatistici consentono di realizzare diverse mappe, alternative ed equiprobabili, del fenomeno sul dominio oggetto di indagine. Questi obiettivi vengono raggiunti tramite tecniche di simulazione stocastica, che richiedono esclusivamente la conoscenza di un modello di dipendenza spaziale.

2.3 Fasi dell’analisi Geostatistica

Le fasi principali in cui si articola un’analisi geostatistica, ai fini di conseguire obiettivi di natura inferenziale e quindi di stima della variabile in esame in posizioni non campionate, sono le seguenti:

• Campionamento spaziale, in cui si selezionano alcune posizioni all’interno dell’area di interesse e se ne estrae il valore noto della variabile in esame;

• Analisi descrittiva spaziale o strutturale nell’ambito della quale si stima la correlazione spaziale, valutando, a partire dalle osservazioni disponibili, il covariogramma o il variogramma, e successivamente si seleziona un modello di correlazione;

• Stima della variabile in posizioni non campionate mediante un metodo di interpolazione stocastica e valutazione dell’errore associato a tale stima;

• Rappresentazione grafica dell’evoluzione spaziale della variabile esaminata.

Input •Dati a struttura spaziale •Modello di dipendenza spaziale Elaborazioni •Strumenti Geostatistici Output •Simulazione •Mappe di probabilità

(12)

Capitolo 3

Materiali e metodi

3.1 Inversione Sismica

I problemi di inversione nella geofisica mirano a dedurre le proprietà fisiche della geologia del sottosuolo, i parametri del modello (𝑚 ∈ 𝑅𝑚), da un insieme di misure/osservazioni geofisiche indirette, i dati osservati (𝑑𝑜𝑏𝑠 ∈ 𝑅𝑛), che sono normalmente contaminate da errori di misura (𝑒) provenienti da diverse fonti. I dati osservati e le proprietà del sottosuolo di interesse sono collegati da un forward modelling (𝐹). Se i modelli di forward possono essere descritti matematicamente e i parametri del modello sono noti, i dati osservati possono essere calcolati come:

𝑑𝑜𝑏𝑠 = 𝐹(𝑚) + 𝑒 (3.1)

Nel nostro caso di inversione sismica, i dati osservati sono rappresentati dai dati di riflessione sismica e dai dati di well-log, se disponibili. È noto che la propagazione delle onde che attraversano la terra può essere spiegata attraverso un’equazione d’onda elastica ma, un approccio più semplice e comunemente usato è un’approssimazione acustica dell’equazione elastica.

Se poi ci focalizziamo solo sulle riflessioni primarie di onde P ad offset (o angolo di incidenza) nullo, F è definito come un modello convoluzionale ed 𝑚 è il vettore che definisce i valori di impedenza acustica. Il forward model può essere descritto come:

𝐴 = 𝑟 ∗ 𝑤 (3.2)

Dove 𝐴 è l’ampiezza sismica registrata in dominio post-stack ottenuta dalla convoluzione delle tracce di riflettività 𝑟 ad incidenza normale, che dipendono dai contrasti di impedenza acustica nel sottosuolo, con un’ondina sorgente 𝑤.

Il coefficiente di riflessione è uno dei concetti fisici fondamentali del metodo sismico. Fondamentalmente, ogni coefficiente di riflessione può essere pensato come la risposta dell’ondina sismica ad una variazione di impedenza acustica all’interno della Terra.

(13)

Matematicamente, per incidenza normale, la conversione da impedenza acustica a riflettività comporta la divisione delle differenze delle impedenze acustiche (Ip) per la somma delle stesse:

𝑟 =𝐼𝑝2− 𝐼𝑝1 𝐼𝑝1 + 𝐼𝑝2

(3.3)

dove i pedici 1 e 2 corrispondono ai valori di impedenza acustica che si trovano a due campioni (es. temporali) successivi.

I problemi di inversione sismica sono mal condizionati e con soluzioni non univoche a causa dei limiti intrinseci del metodo sismico stesso, e della relazione fisica che lega dato e modello: larghezza di banda limitata e risoluzione dei dati di riflessione sismica, rumore, errori di misura, approssimazioni numeriche ed approssimazioni fisiche sui modelli di forward coinvolti. Supponendo che il modello di forward sia valido, i modelli ottenuti alla fine di un processo di inversione sismica rappresentano un insieme di possibili modelli terrestri diversi che soddisfano in egual misura i dati di riflessione sismica osservati. Quello che si vuole ottenere utilizzando un forward modelling è un insieme di tracce sismiche sintetiche che possano essere confrontate con i dati sismici osservati in modo da poter identificare le differenze e cercare di minimizzare il mismatch. Questo mismatch può essere calcolato utilizzando, ad esempio, il coefficiente di correlazione di Pearson.

(14)

3.2 Gaussian-Mixture e Classificazione Bayesiana

La corretta predizione delle facies litologiche nella porzione di sottosuolo investigato è un passo fondamentale perché le variazioni di impedenza acustica tendono ad essere direttamente influenzate dalle diverse proprietà delle rocce a contatto. Uno degli approcci di inversione più comuni deriva le proprietà acustiche e/o elastiche sotto l’assunzione di una distribuzione gaussiana dei parametri acustici e/o elastici. Questa assunzione è spesso utilizzata perché permette di calcolare analiticamente e in modo rapido il modello predetto ed anche perché permette di utilizzare i più comuni metodi di simulazione geostatistica (Kriging). È noto però che il modello gaussiano di solito semplifichi eccessivamente l’effettiva distribuzione dei parametri del reservoir perché trascura l’influenza esercitata dalle facies lito-fluide. Da un punto di vista matematico questo significa che un modello gaussiano non cattura la multimodalità della distribuzione effettiva dei parametri e per questo motivo si usano distribuzioni più complesse (Grana & Della Rossa, 2010).

Nel contesto di questo lavoro di tesi, si è utilizzato un modello di Gaussian-Mixture per descrivere la dipendenza dell’impedenza acustica dalle facies, e a tal fine si è opportunamente modificato il metodo geostatistico utilizzato (Collocated Co-Kriging) per poter gestire tale distribuzione multimodale. Questa assunzione di base ha permesso dunque non solo di simulare la proprietà continua di impedenza ma anche di predire la variabile categorica rappresentata dalle facies lito-fluide.

Il processo di inversione geostatistica sarà quindi combinato con un metodo di classificazione di facies. In particolare, si utilizzerà una classificazione Bayesiana supervisionata. Nella classificazione supervisionata si utilizza un set di addestramento, costruito a partire dai dati del pozzo, per stabilire le proprietà statistiche attese all’interno di ogni lito-classe che si vuole considerare.

Nel reservoir oggetto di indagine di questo lavoro abbiamo due classi litologiche distinte, che chiameremo per semplicità ‘sand’ identificate da un alto valore di porosità e ‘shale’ a bassa porosità. Quello che vogliamo valutare è se possiamo utilizzare l’impedenza acustica per differenziare le due facies.

Dai dati disponibili di well-log costruiamo istogrammi di impedenza acustica per le due classi litologiche come mostrato in figura 3.1.

(15)

Fig. 3.1. Esempi di classificazione di due facies lito-fluide. La variabile z rappresenta l’impedenza acustica, 𝑓(𝑧|𝑐𝑖) sono

le distribuzioni di probabilità condizionate dalla classe e 𝑝(𝑐𝑖) sono le probabilità a priori delle classi litologiche.

Nella pratica, la variabilità della proprietà di interesse implica che si possa osservare una sovrapposizione tra gli intervalli dei valori di impedenza delle due lito-classi. Si può comprendere quindi che l’incertezza nel prevedere la litologia dall’impedenza sia direttamente proporzionale al grado di sovrapposizione tra i due intervalli (figura 3.2).

È naturale perciò esprimere la variabilità osservata in un quadro probabilistico. Modelliamo quindi le distribuzioni di probabilità condizionate dalla classe, che indichiamo come 𝑓(𝑧|𝑐𝑖), dove 𝑧 è l’impedenza acustica e 𝑐𝑖 è la i-esima facies associata.

Sotto l’assunzione di mistura gaussiana, le due PDF (Probability Density Function) condizionali sono distribuzioni gaussiane con media e varianza diverse tra loro. Esistono svariati modi per predire la litologia utilizzando l’impedenza, due di questi sono: il metodo di massima probabilità (ML) e il metodo che utilizza la classificazione di Bayes, usata nel nostro lavoro. Nella classificazione ML assumiamo implicitamente che la probabilità a priori di sand e shale sia la stessa, non si tiene dunque in conto della frequenza attesa delle due facies nell’area di indagine.

Fig. 3.2 Errore dovuto alla sovrapposizione delle PDF (Probability Density Function) delle due classi litologiche, 𝑓(𝑧|𝑐𝑖)

(16)

Nella pratica invece abbiamo spesso a disposizione i dati di well-log dai quali ricaviamo informazioni anche sulla frequenza di occorrenza delle litologie in esame. Tale informazione si può utilizzare per stabilire una distribuzione a priori di occorrenza delle facies p(c). In tal modo possiamo formulare il processo di classificazione attraverso un approccio probabilistico regolato dalla legge di Bayes:

𝑝(𝑐

𝑖

|𝑧) =

𝑓(𝑧|𝑐𝑖)𝑝(𝑐𝑖)

𝑝(𝑧)

(3.4)

dove

𝑝(𝑐𝑖|𝑧) è la distribuzione di probabilità della classe litologica condizionata dall’impedenza z, 𝑓(𝑧|𝑐𝑖) è la distribuzione di probabilità dell’impedenza condizionata dalla i-esima classe litologica, 𝑝(𝑐𝑖) è la distribuzione a priori della i-esima facies e 𝑝(𝑧) è un fattore di normalizzazione.

La componente 𝑝(𝑧) può anche essere omessa poiché serve soltanto ad assicurarsi che la somma delle probabilità a priori sia uguale a 1.

(17)

3.2 Variabile Aleatoria

Il concetto di variabile aleatoria gioca un ruolo centrale nel modelling geostatistico del reservoir. Non potendo descrivere con semplici funzioni deterministiche la complessità della variabilità spaziale delle proprietà di un reservoir e l’interdipendenza tra le stesse, si ricorre alla teoria dei campi casuali (RF - Random Field) in un quadro di riferimento geostatistico. Si ha la necessità di affidarsi ad un framework statistico anche perché sfortunatamente non è possibile campionare l’intera area di studio. Nella pratica, le informazioni dirette che abbiamo sul reservoir, provenienti dalle misurazioni dei log geofisici, sono limitate poiché le perforazioni campionano il giacimento in un numero molto ridotto di punti. Un campo casuale è definito come un insieme di variabili aleatorie dipendenti (RV – Random Variables) distribuite lungo un grid del reservoir. Una variabile aleatoria è definita come ciò che può assumere tutti i valori contenuti in una funzione di distribuzione di probabilità. Può essere continua se la possibile gamma di risultati è continua o discreta se i risultati sono limitati e senza alcun ordine specifico. Utilizzando il concetto di RV, il valore di una proprietà (ad esempio l’impedenza acustica o la porosità), in una determinata posizione del grid applicato al reservoir (figura 3.3), viene interpretato come una singola realizzazione, 𝑧(𝑥1), della RV 𝑍(𝑥1).

Fig. 3.3. Esempio di applicazione di un grid sul reservoir in cui ogni punto, o nodo, viene considerato come una realizzazione della variabile aleatoria di impedenza acustica.

(18)

Per modellare correttamente un processo stocastico non è necessario caratterizzare esplicitamente l'intero numero di variabili aleatorie associate. Per caratterizzare spazialmente una determinata proprietà occorre descrivere la media (Eq. 3.5) e la varianza (Eq 3.6):

𝐸{𝑍(𝑥𝑖)} = 𝑚(𝑥𝑖) = ∫ 𝑧𝑑𝐹𝑥𝑖(𝑧) +∞ −∞ (3.5) 𝑣𝑎𝑟{𝑍(𝑥𝑖)} = ∫ [𝑧 − 𝑚(𝑥𝑖)]2 +∞ −∞ 𝑑𝐹𝑥𝑖(𝑧) (3.6)

dove 𝐸(∙) indica il valore atteso di una variabile aleatoria, 𝑧 sono le realizzazioni e 𝐹𝑥𝑖 è la funzione di distribuzione di probabilità della variabile casuale 𝑍(𝑥𝑖).

Spesso in geostatistica vengono messe in relazione due o più variabili aleatorie appartenenti alla medesima posizione. La relazione tra queste due variabili è di solito riassunta utilizzando la loro covarianza o il coefficiente di correlazione.

Se si considerano due variabili casuali, 𝑍(𝑥1) e 𝑍(𝑥2), la covarianza tra le due variabili è data da:

𝐶(𝑍(𝑥1), 𝑍(𝑥2)) = 𝐸{𝑍(𝑥1)𝑍(𝑥2)} − 𝑚(𝑥1)𝑚(𝑥2) (3.7)

con 𝑚(𝑥1) e 𝑚(𝑥2) rispettivamente media della prima e della seconda variabile e:

𝐸{𝑍(𝑥1), 𝑍(𝑥2)} = ∫ ∫ 𝑥𝑦𝑑2𝐹 𝑥1,𝑥2(𝑥, 𝑦) +∞ −∞ +∞ −∞ (3.8)

dove 𝑥 e 𝑦 sono le realizzazioni rispettivamente della prima e della seconda variabile e 𝐹𝑥1,𝑥2(𝑥, 𝑦) è la funzione di distribuzione di probabilità bivariata:

(19)

Il coefficiente di correlazione 𝜌 è una misura adimensionale del grado di dipendenza lineare tra le due variabili 𝑍(𝑥1) e 𝑍(𝑥2), e si ottiene dividendo la covarianza 𝐶(𝑍(𝑥1), 𝑍(𝑥2)) per il prodotto delle rispettive deviazioni standard 𝜎𝑥1 della prima variabile e 𝜎𝑥2 della seconda variabile:

𝜌 =𝐶(𝑍(𝑥1), 𝑍(𝑥2)) 𝜎𝑥1𝜎𝑥2

(3.10)

Il valore di questo coefficiente può oscillare tra -1 (anti-correlazione perfetta) e 1 (correlazione perfetta), il valore 0 significa che le due variabili non mostrano alcuna correlazione lineare (figura 3.4).

Fig. 3.4 Da sinistra a destra: le due variabili mostrano una correlazione positiva; le due variabili mostrano una correlazione negativa; le due variabili non mostrano alcuna correlazione. 𝜌 = coefficiente di correlazione.

3.3 Assunto di Stazionarietà

I momenti di un campo aleatorio sono solitamente incogniti quindi si presenta spesso il problema inferenziale riguardante la loro stima. Sarebbero necessarie diverse realizzazioni (osservazioni) delle coppie di variabili aleatorie 𝑍(𝑥) e 𝑍(𝑥′) per effettuare un’inferenza statistica su tali momenti. Tuttavia, per la caratteristica di non ripetitività dei dati a struttura spaziale, risulta impossibile disporre di più osservazioni nelle stesse posizioni. Le assunzioni di stazionarietà consentono di risolvere il suddetto problema di natura inferenziale. Assumendo ad esempio la stazionarietà del secondo ordine, la covarianza, è possibile supporre che le funzioni di covariogramma o variogramma (capitolo 3.5) non dipendano dagli specifici punti 𝑥 e (𝑥 + ℎ), ma solamente dalla distanza tra i punti, ovvero il vettore ℎ. Queste assunzioni di stazionarietà stanno alla base degli algoritmi geostatistici utilizzati in questo lavoro di tesi.

(20)

3.4 Correlazione Spaziale

La correlazione spaziale è un concetto fondamentale nella geostatistica perché consente di fare predizioni in un punto del reservoir da osservazioni fatte in differenti posizioni.

Occorre introdurre tale concetto in modo da poter quantificare i vari gradi di variabilità laterale della proprietà di interesse. Un modo semplice per valutare qualitativamente la variabilità laterale è plottare i diagrammi di dispersione. Per farlo si considerano dei punti 𝑍(𝑥) e 𝑍(𝑥 + ℎ) corrispondenti a dei valori di impedenza acustica lungo il pozzo distanziati da un vettore h come mostrato in figura 3.5.

Fig. 3.5 A sinistra una rappresentazione spaziale di quattro pozzi che campionano una proprietà del sottosuolo; a destra il dettaglio di un pozzo con campioni misurati verticalmente lungo il pozzo stesso.

Possiamo visualizzare così degli h-scatterplot per tutte le coppie di punti che rappresentano la variabile in gioco separati dalla distanza adimensionale ℎ tra i punti del grid.

(21)

I grafici di figura 3.6 sono ottenuti mantenendo fisso il primo campione temporale di ogni colonna del modello numerico del reservoir in esame, e plottando questi in funzione di tutti i campioni temporali ad una certa distanza h crescente.

Osservando l’immagine 3.6, si nota una buona correlazione tra punti vicini, distanziati da ℎ = 1; al contrario all’aumentare della distanza ℎ aumenta la dispersione dei punti denotando un grado di similarità decrescente tra le variabili che implica quindi una diminuzione della correlazione.

Possiamo calcolare il coefficiente di correlazione tra le variabili cross-plottate in modo da misurare quantitativamente il grado di correlazione tra le impedenze in funzione dell’inter-distanza ℎ. Una funzione sperimentale di correlazione spaziale, chiamata correlogramma, si ottiene tracciando il coefficiente di correlazione in funzione di ℎ come mostrato nella figura 3.7.

Fig. 3.7 Andamento della correlazione spaziale sperimentale in funzione dell’inter-distanza h.

La distanza alla quale la correlazione spaziale diventa praticamente nulla si chiama intervallo di correlazione o lunghezza di correlazione e osservando l’immagine 3.7 si può affermare che già per una distanza ℎ = 3 la correlazione è quasi assente.

(22)

3.5 Variogramma

I geofisici hanno generalmente più familiarità con le funzioni di correlazione o covarianza mentre i geostatistici prediligono l’uso del variogramma. Nella maggior parte delle situazioni pratiche però sono pressoché equivalenti. Infatti, attraverso la semplice relazione mostrata nell’equazione 3.11 è possibile passare direttamente da un dominio all’altro:

𝛾(ℎ) = 𝜎2[1 − 𝜌(ℎ)] = 𝐶(0) − 𝐶(ℎ) (3.11)

dove 𝛾(ℎ) è il variogramma in funzione dell’inter-distanza ℎ, 𝜎2 è la varianza del dato disponibile e

𝜌(ℎ) è il correlogramma o funzione di correlazione anch’essa dipendente da ℎ. La relazione tra variogramma e correlogramma è sintetizzata in figura (3.8):

Fig. 3.8 Relazione tra Correlogramma 𝐶(ℎ) e Variogramma 𝛾(ℎ).

Nella pratica, il variogramma sperimentale è costruito tracciando la differenza quadratica media tra i valori dei dati in funzione della distanza ℎ:

𝛾(ℎ) =1

2𝐸[𝑍(𝑥 + ℎ) − 𝑍(𝑥)]

2 (3.12)

Per ogni spostamento ℎ, la media è presa su tutte le coppie di punti separati da tale distanza.

Il variogramma tende ad aumentare con l’aumentare della distanza perché misura il livello di somiglianza in funzione di ℎ:

(23)

• I variogrammi di variabili aleatorie stazionari raggiungono un livello di plateau ad una certa distanza h. Tale distanza corrisponde al campo di correlazione o lunghezza di correlazione. Oltre tale distanza i valori dei dati non sono correlati.

• Il livello del plateau è chiamato sill del variogramma. Corrisponde al livello di varianza del dato. Più è alto il sill, più grande è la varianza.

L’obiettivo principale durante la fase di modellizzazione del variogramma è approssimare con una funzione analiticamente trattabile il variogramma sperimentale costruito usando una serie discreta e limitata di campioni, corrispondenti ai campioni dei pozzi. Tale funzione deve descrivere al meglio il comportamento spaziale della proprietà di interesse per l’intera area di studio. Questo passaggio è della massima importanza nell’ambito del framework geostatistico, poiché consente la sintesi delle caratteristiche strutturali dei fenomeni spaziali in un modello di variogramma singolo che permette di calcolare in maniera analitica la matrice di covarianza del fenomeno in esame. I modelli di variogramma che permettono un’interpolazione dei variogrammi sperimentali sono abbastanza limitati. Quelli più utilizzati sono il modello sferico, il modello esponenziale, quello gaussiano ed infine quello di potenza. Il modello con il quale abbiamo riprodotto il variogramma sperimentale è quello gaussiano:

𝛾(ℎ) = 𝐶 [1 − exp (−ℎ

2

𝛼2 )] (3.13)

Dove 𝐶 è la varianza del dato, ℎ è l’asse spaziale o temporale della funzione di autocorrelazione, e 𝛼 è il parametro che definisce la dipendenza spazio/temporale.

(24)

3.6 Stima di Kriging

Le tecniche basate sul Kriging sono ampiamente utilizzate per l’interpolazione delle proprietà dei reservoirs. Il Kriging si presenta in varie forme: Simple Kriging (SK), Ordinary Kriging (OK), Kriging con Drift esterno e Co-Kriging (CK) per citarne alcuni. Alcuni di questi come il Kriging Semplice o il Co-Kriging sono particolarmente adatti per integrare informazioni sismiche nel modelling dei reservoirs. Questi metodi sono di particolare interesse perché evidenziano l’importanza di un corretto condizionamento dei dati sismici prima di utilizzarli per la caratterizzazione quantitativa dei reservoirs (Doyen, 2007).

3.6.1 Simple Kriging

L’idea di base del Kriging implicata nel contesto della previsione di una proprietà della roccia 𝑥0, come l’impedenza acustica o la porosità, in un punto 𝑢0 della griglia, può essere sintetizzata nella figura 3.9:

Fig. 3.9 Stima di Simple Kriging della proprietà nella posizione 𝑢0. 𝑥0𝑠𝑘= proprietà sconosciuta nella posizione 𝑢0; 𝑚𝑥

= media costante della variabile x; 𝑤𝑖= pesi di Kriging; 𝑥𝑖 = valori noti alla posizione i-esima; 𝑛 = numero di punti noti

(pozzi).

Nell’approccio tramite Simple Kriging si ottiene una stima, 𝑥0𝑠𝑘, della proprietà della roccia incognita

come combinazione lineare ponderata dei valori dei dati del pozzo, 𝑥𝑖. Nella figura 𝑚𝑥 rappresenta il

valore atteso della variabile 𝑥, cioè la media, che nel Simple Kriging è assunta stazionaria e nota. Per ottenere la stima di Kriging dobbiamo calcolare i pesi, 𝑤𝑖, dei diversi valori dei dati noti. Lo scopo della selezione di questi pesi si traduce nel minimizzare una funzione di errore quadratico medio

(25)

(MSE = Mean Squared Error, 𝑀𝑆𝐸 = 𝐸[𝑥0 – 𝑥0𝑠𝑘]2) nella posizione 𝑢0, parametrizzata in termini di 𝐶, la funzione di covarianza spaziale della variabile 𝑥.

𝑀𝑆𝐸(𝑤1, … , 𝑤𝑛) = 𝐶(0) − 2 ∑ 𝑤𝑖𝐶0𝑖 𝑖 + ∑ 𝑤𝑖𝑤𝑗𝐶𝑖𝑗 𝑖,𝑗 (3.14) dove: 𝐶𝑖𝑗 = 𝐶(ℎ𝑖𝑗) = 𝐶(𝑢𝑖− 𝑢𝑗) (3.15)

Questi pesi, corrispondenti alla soluzione ottimale, si ottengono risolvendo un sistema lineare di equazioni chiamato Sistema di Kriging. Un esempio di sistema di Kriging è mostrato in figura 3.10 in cui sono tre i punti noti che permettono di fare una stima:

Fig. 3.10 Esempio di sistema di Simple Kriging con tre punti noti 𝑥1, 𝑥2 𝑒 𝑥3 per la stima della variabile 𝑥0. 𝐶𝑖𝑗=

covarianza tra punti noti; 𝑤= pesi di Kriging; 𝐶0𝑗= covarianza tra i punti noti e la posizione 𝑢0; 𝜎2= varianza della

proprietà in esame.

Gli elementi che compongono la matrice di Kriging simmetrica 𝐶𝑖𝑗, a sinistra dell’equazione, rappresentano covarianze spaziali valutate per i vettori distanza ℎ𝑖𝑗 tra i punti noti 𝑖𝑗. Gli elementi

sulla diagonale principale della matrice di Kriging corrispondono invece alla varianza di 𝑥, 𝜎𝑥2 = 𝜎2.

Il vettore di Kriging, sul lato destro dell’equazione matriciale, contiene le covarianze spaziali calcolate per i vettori distanza tra i tre punti noti e la posizione 𝑢0, dove si va a predire la proprietà. La matrice di Kriging possiede quindi informazioni sulla correlazione della proprietà che si vuole simulare, mentre il vettore di Kriging fornisce informazioni sulla correlazione spaziale tra la

(26)

posizione in cui si effettua la stima e le posizioni dei dati disponibili. È interessante notare che l’intero sistema di Kriging dipende solo dalla configurazione dei dati rispetto alla posizione in cui si vuole stimare la variabile e non dai valori dei dati stessi.

Per risolvere il sistema di Kriging occorre invertire la matrice di Kriging e moltiplicarla per il vettore di Kriging così da ottenere come soluzione il vettore dei pesi. Affinché sia invertibile, la matrice deve essere definita positiva. Per garantire stabilità numerica si può utilizzare la pseudo-inversa di Moore-Penrose, quindi un partizionamento della matrice da invertire, per far si che i valori singolari molto piccoli associati alla matrice non vengano tenuti in considerazione. Una delle più importanti proprietà della matrice pseudo-inversa è che esiste sempre e di conseguenza anche la soluzione pseudo-inversa esisterà sempre.

3.6.2 Finestra di ricerca

Una delle possibili tecniche per applicare il Kriging è quella di prendere in considerazione tutti i punti dei dati disponibili nel sistema di Kriging per ogni cella/nodo della griglia. Questo metodo può essere utile e comodo perché implica un’unica costruzione della matrice di Kriging e di conseguenza occorre invertirla una tantum. Si necessita comunque della costruzione del vettore di Kriging, ma questa modalità consente un importante risparmio in costi di CPU per le griglie grandi in quanto la maggior parte del tempo impiegato viene speso per eseguire i calcoli di inversione della matrice di Kriging. Un altro vantaggio di questa applicazione è la riduzione al minimo del rischio di artefatti di Kriging. Tuttavia, nella pratica, l’applicazione di una finestra unica è limitata dal numero di punti di controllo (poche centinaia), altrimenti la matrice da invertire diventerebbe troppo grande e mal condizionata. Un altro limite di applicabilità di questo metodo è dovuto al presupposto di base di stazionarietà e di validità del modello di covarianza spaziale a grandi distanze.

Un’altra strategia molto valida, che viene applicata per dati molto grandi o per motivi di stazionarietà, prevede l’utilizzo di una finestra mobile. I punti dei dati vengono inseriti nel sistema di Kriging solo se rientrano in una regione di ricerca locale, definita ad esempio da un’ellisse o da un rettangolo (figura 3.11), centrata sul punto in cui si vuole andare ad effettuare la stima.

Fig. 3.11 Esempio di finestre mobili, che racchiudono le misure note (cerchi neri) utilizzate di volta in volta nella simulazione.

(27)

Con una finestra in movimento, la configurazione dei dati cambia ogni volta che stimiamo 𝑥0 in un nuovo punto della griglia 𝑢0. Le fasi di costruzione e di inversione vengono ripetute in ogni punto per trovare il set di pesi ottimale. In questo senso il Kriging è una tecnica adattiva in quanto i pesi si adattano alla configurazione locale dei dati. Nel momento in cui si ha assenza di correlazione spaziale, cioè la finestra mobile non include alcun valore noto, la stima più probabile sarà data dalla media della variabile che si vuole simulare, e l’incertezza sarà data dalla varianza attesa di tale variabile. Tale situazione si verifica quando la distanza tra la posizione di stima e tutti i punti noti è maggiore dell’intervallo di correlazione e tutti i pesi di Kriging diventano uguali a zero.

Infine, nel caso in cui si abbia un unico punto noto da poter correlare, la stima di Kriging si riduce ad una regressione lineare tradizionale dei minimi quadrati con un coefficiente di correlazione dipendente dall’inter-distanza tra il punto noto e la posizione di stima (figura 3.12).

Fig. 3.12 Sistema di Simple Kriging quando è presente solo un punto noto da correlare. 𝜎2= varianza della proprietà in

esame; 𝑤 = peso di Kriging; 𝑚𝑥= media della proprietà in esame; 𝜌(ℎ) = coefficiente di correlazione tra i due punti

distanti ℎ; 𝑥1= valore noto della proprietà in esame; 𝐶0𝑖= covarianza tra il valore della posizione note e quella in cui si effettua la stima.

Come ulteriore prodotto, il Kriging fornisce una misura dell’errore di predizione chiamato Varianza di Kriging o Errore Quadratico Medio predetto (figura 3.13). Essa corrisponde al valore della superficie di errore quadratico nel punto di minimo, che permette la determinazione dei valori dei pesi di Kriging.

(28)

Fig. 3.13 Superficie di Errore Quadratico Medio (MSE) o Varianza di Kriging quando n=2.𝜎𝑥2=varianza della proprietà

in esame; 𝑤𝑖=pesi di Kriging; 𝐶𝑖0= covarianza tra punti noti e posizione in cui si effettua la stima.

La varianza di Kriging non può essere interpretata come misura quantitativa del valore di incertezza ma fornisce piuttosto un intervallo di confidenza per il valore stimato, fornisce quindi una misura relativa alla qualità dell’interpolazione in diverse regioni del reservoir. Questo perché la varianza di Kriging dipende dal modello di covarianza spaziale che contiene già al suo interno un’incertezza, specialmente se il controllo dei punti noti è debole.

Tale varianza sarà quindi zero in corrispondenza del pozzo mentre a distanza maggiore del campo di correlazione, la varianza di Kriging sarà uguale alla varianza attesa della proprietà che si sta simulando (figura 3.14).

Fig. 3.14 Interpretazione della varianza di Kriging come intervallo di confidenza per i valori stimati. 𝑥𝑠𝑘=valore della

(29)

3.6.3 Stima di Co-Kriging

Il Co-Kriging, sviluppato anch’esso negli anni Sessanta da Matheron, è un’estensione multivariata del Kriging Semplice. L’obiettivo di questo algoritmo è quello di predire una proprietà sconosciuta in una certa posizione combinando le misure di quella stessa proprietà nota in altre posizioni con le misure di un’altra variabile, che si presuppone sia correlata in qualche modo con la prima. La variabile che viene predetta con questo metodo (ad esempio l’impedenza acustica) viene chiamata variabile primaria mentre l’altra, che viene usata per migliorare la stima della proprietà primaria alla quale si assume correlata, è chiamata variabile secondaria. L’utilizzo di questo algoritmo è particolarmente indicato quando la variabile primaria è significativamente sotto-campionata rispetto alla variabile secondaria. Risulta quindi di particolare utilità nel contesto del modelling terrestre guidato dalla sismica, dove attributi geofisici più densamente e regolarmente campionati sono combinati con dati di pozzo, più scarsamente campionati, della proprietà di interesse. Per facilitare la notazione consideriamo un’unica variabile secondaria ma il Co-Kriging può essere esteso a più variabili secondarie. Nella sua forma più generale il Co-Kriging può essere espresso come una regressione lineare generalizzata che combina 𝑛 misure della variabile primaria (pozzo), con 𝑚 dati della variabile secondaria (figura 3.15).

Fig. 3.15 Stima di Co-Kriging della proprietà sconosciuta nella posizione 𝑢0. 𝑥0𝑐𝑘= proprietà sconosciuta nella posizione

𝑢0; 𝑚𝑥, 𝑚𝑧= medie costanti delle variabili x e z; 𝑤𝑖, 𝜈𝑖= pesi di Co-Kriging; 𝑥𝑖 = dato primario alla posizione i-esima;

𝑧𝑗=dato secondario alla posizione j-esima; 𝑛, 𝑚 = numero di punti noti della variabile primaria e secondaria

(30)

Come visto per il Kriging Semplice, i pesi di regressione sono determinati risolvendo una serie di equazioni normali derivanti dalla minimizzazione dell’errore quadratico medio di predizione 𝐸[𝑥0− 𝑥0𝑐𝑘]2.

Tuttavia, nella pratica, la forma generalizzata del Co-Kriging è usata di rado perché richiede l’estrapolazione di tre funzioni di covarianza:

• Auto-covarianza della variabile primaria 𝐶𝑥𝑥; • Auto-covarianza della variabile secondaria 𝐶𝑧𝑧;

• Cross-covarianza tra variabile primaria e secondaria 𝐶𝑥𝑧, assunta di solito uguale a 𝐶𝑧𝑥.

3.6.4 Stima di Collocated Co-Kriging

Nel 1992, Xu et al., hanno sviluppato una semplificazione molto utile chiamata Collocated Co-Kriging (figura 3.16). In questa formulazione la geo-regressione include soltanto 𝑧0, la proprietà

secondaria misurata nel punto in cui si vuole effettuare la stima della variabile primaria.

Fig. 3.16 Stima di Collocated Co-Kriging 𝑑𝑒𝑙𝑙𝑎 proprietà sconosciuta nella posizione 𝑢0; 𝑥0𝑐𝑐𝑘= proprietà sconosciuta

nella posizione 𝑢0; 𝑚𝑥, 𝑚𝑧 = medie costanti delle variabili x e z; 𝑤𝑖, 𝜈= pesi di Co-Kriging; 𝑥𝑖 = dato primario alla

posizione i-esima; 𝑧0=dato secondario alla posizione 𝑢0; 𝑛 = numero di punti noti della variabile primaria.

Ciò porta ad una ulteriore semplificazione, sotto un’assunzione addizionale di modello di correlazione spaziale di tipo Markoviano, in quanto la funzione di cross-covarianza si riduce ad una versione scalata della funzione di auto-covarianza della variabile primaria come mostrato in figura 3.17.

(31)

La soluzione del sistema delle equazioni normali semplificate del Collocated Co-Kriging richiede quindi solo la conoscenza di:

• Auto-covarianza della variabile primaria; • Varianza della variabile secondaria;

• Coefficiente di correlazione locale tra variabile primaria e variabile secondaria.

Fig. 3.17 Dall’alto verso il basso: sistema di equazioni normali semplificate; calcolo della Varianza di Kriging e assunzione di Markov che porta alla semplificazione della stima. 𝜎𝑥2= varianza della variabile primaria; 𝜎

𝑧2= varianza

della variabile secondaria; 𝑤𝑖= vettore dei pesi; 𝜈 = peso della variabile secondaria; 𝜌𝑥𝑧= coefficienti di correlazione locale tra variabile primaria e secondaria; 𝐶𝑥𝑥= auto-covarianza della variabile primaria; 𝜎𝑠𝑘2= varianza di Simple

Kriging.

L’approccio tramite Collocated Co-Kriging comporta ancora la soluzione di un insieme di equazioni normali rispetto al Kriging ma risulta essere più stabile rispetto all’implementazione generale dove il sistema comporta dati secondari ridondanti ravvicinati e perciò spesso mal condizionati.

Nell’implementazione del Collocated Co-Kriging, utilizzato in questo caso per la stima della variabile continua di impedenza acustica, si è reso necessario apportare delle modifiche per poter simulare tale proprietà sotto un’assunzione di distribuzione Gaussian-mixture. L’algoritmo modificato risulta così in grado di considerare al suo interno anche l’influenza di una variabile discreta rappresentata dalle facies litologiche. Dalla cooperazione delle tre variabili primaria, secondaria e discreta si ottengono stime congiunte di impedenza acustica, continua, e facies litologiche, discrete, in modo tale che la prima proprietà si affidi alla seconda per aggiornarsi e migliorare la ricostruzione del modello reale di riferimento.

(32)

3.7 Inversione Geostatistica

Presentiamo ora il workflow di inversione geostatistica implementato per la caratterizzazione sismica di un reservoir, suddividendolo per chiarezza in due step principali eseguiti in successione:

• Caratterizzazione spaziale e temporale della proprietà di interesse dai dati osservati e simulazione stocastica degli starting models, utilizzando l’algoritmo di Simple Kriging; • Co-simulazione congiunta, utilizzando l’algoritmo di Collocated Co-Kriging, di modelli di

impedenza acustica e facies lito-fluide eseguita in maniera iterativa e guidata da una funzione di correlazione tra dato osservato e dato sintetico che deve essere massimizzata.

Primo step:

I dati osservati di cui si dispone, di solito, all’inizio di un’inversione geostatistica post-stack sono il dato sismico osservato (figure 3.18 e 3.19) e i dati di well-log che comprendono in questo caso informazioni riguardanti l’impedenza acustica e la litologia. Si focalizza l’attenzione su inversioni sintetiche in cui il modello vero simula una situazione realistica di depositi torbiditici con sequenze shale-sand.

Fig. 3.18 Esempio di dato sismico osservato afflitto da rumore gaussiano scorrelato con rapporto segnale/noise di 5 dB. Passo di campionamento spaziale di 25 m e passo di campionamento temporale di 2 ms.

(33)

Fig. 3.19 A sinistra è mostrato il dato sismico osservato privo di noise; a destra viene raffigurato il rumore gaussiano correlato che viene imposto sul dato osservato ottenendo un rapporto segnale/noise di 5 dB. In entrambi i casi è stato utilizzato un gain = 150. Passo di campionamento spaziale di 25 m e passo di campionamento temporale di 2 ms.

Il dato sismico osservato è stato ottenuto convolvendo le tracce di riflettività del modello di impedenza acustica reale con un’ondina di Ricker, figura 3.20, con frequenza di picco di 50 Hz e fase zero. Il passo di campionamento spaziale è di 25 metri mentre quello temporale è stato fissato a 2 ms.

Fig. 3.20 L’immagine mostra in alto l’ondina di Ricker utilizzata per generare il dato osservato con frequenza di picco di 50 Hz; in basso il relativo spettro di ampiezza.

(34)

Assumiamo nel nostro studio di avere a disposizione due pozzi rispettivamente ad una coordinata spaziale di 350 m e 725 m, figura 3.21.

Fig.3.21 In alto i dati di impedenza acustica e in basso le informazioni sulle facies litologiche dei due pozzi disponibili.

Le informazioni estrapolate dai pozzi vengono catalogate come hard-constraints durante entrambi gli step di inversione geostatistica. Ciò equivale a dire che i modelli predetti saranno costretti a rispettare perfettamente queste informazioni.

Occorre ora andare a definire quelli che sono i soft-constraints e per farlo analizziamo le informazioni di impedenza acustica presenti nei pozzi. Da questi dati è possibile definire il primo e il secondo momento statistico, rispettivamente media e varianza, poiché sono input indispensabili per l’inversione.

(35)

Come affermato in precedenza, le prime fasi principali della geostatistica prevedono l’analisi della variabilità spaziale della proprietà in esame. Essendo in possesso di pozzi esclusivamente verticali possiamo andare a definire la variabilità verticale direttamente dai dati di impedenza acustica. Per farlo ci avvaliamo della funzione di autocorrelazione applicata ad entrambi i pozzi e di seguito mediata per avere un’unica funzione rappresentante le principali caratteristiche, come mostrato in figura 3.22.

Fig. 3.22 Funzioni di autocorrelazione, con ampiezze normalizzate, delle impedenze acustiche lungo i pozzi in alto e funzione di autocorrelazione mediata in basso.

Per valutare la variabilità laterale della proprietà ci affidiamo invece al dato sismico poiché si assume che pozzi orizzontali non siano disponibili. Applichiamo stavolta la funzione di autocorrelazione ad ogni campione temporale del dato sismico, in senso quindi orizzontale, e mediamo le funzioni di autocorrelazione così ottenute per averne una unica da prendere come riferimento (figura 3.23).

(36)

Fig. 3.23 Funzione di autocorrelazione laterale, con ampiezza normalizzata, sul dato sismico osservato.

Grazie a queste funzioni di correlazione laterale e verticale, ed essendo a conoscenza che correlogrammi e variogrammi sono interscambiabili in un’analisi geostatistica, possiamo definire i modelli di variogramma spaziale e temporale, che servono da guida nell’inversione, per stabilire le interdipendenze tra tutti i punti del grid del reservoir.

Si assume quindi un variogramma gaussiano stazionario, equazione 3.13, spazialmente invariante, avente come parametro 𝛼 = 85 (figura 3.24) per la correlazione spaziale laterale e 𝛼 = 0,003 (figura 3.25) per la correlazione temporale verticale:

Fig. 3.24 Semivariogramma sperimentale laterale in blu; semivariogramma gaussiano in rosso e sill in verde, corrispondente al valore di varianza del dato sismico. ℎ corrisponde al vettore distanza tra le coppie di punti.

(37)

Fig. 3.25 In alto i variogrammi sperimentali verticali dei due pozzi e il variogramma gaussiano scelto; in basso il variogramma sperimentale laterale e il variogramma Gaussiano scelto. ℎ corrisponde al vettore distanza tra le coppie

di punti.

Si sottolinea il fatto che i variogrammi Gaussiani assunti appena mostrati costituiscono una semplificazione della dipendenza spaziale e temporale dell’impedenza del modello ‘vero’ di riferimento considerato nella fase di inversione. Sono semplificazioni della reale variazione di impedenza del modello ‘vero’ anche l’assunzione di stazionarietà dei variogrammi e della covarianza a priori. Queste semplificazioni vengono sempre fatte nella pratica in quanto non abbiamo abbastanza informazioni per determinare con precisione come la covarianza e il variogramma variano spazialmente, sia perché la reale variazione delle proprietà del sottosuolo è spesso talmente complessa che diventerebbe troppo complicato modellarla correttamente.

I variogrammi Gaussiani appena definiti sono utilizzati ora per andare a definire la matrice simmetrica di covarianza del modello di figura 3.26. Questa matrice rappresenta i gradi di interdipendenza di ogni punto con tutti gli altri punti del grid del reservoir. Per costruirla applichiamo un primo prodotto di Kronecker tra la varianza calcolata dai dati dei pozzi e il variogramma Gaussiano verticale, dopodiché applichiamo un secondo prodotto di Kronecker tra la matrice appena calcolata e il

(38)

variogramma Gaussiano laterale. Come si può intuire, il massimo della dipendenza sarà lungo la diagonale principale dove abbiamo il valore della varianza nota mentre, allontanandoci dalla diagonale principale, diminuirà il grado di interdipendenza.

Fig. 3.26 A sinistra la matrice di covarianza del modello; a destra un suo ingrandimento. Il valore massimo corrispondente alla varianza del dato di impedenza acustica disponibile si trova sulla diagonale principale della matrice. Gli elementi fuori dalla diagonale indicano il pattern di covarianza spaziale e temporale che codifica il variogramma Gaussiano assunto.

Una volta impostati sia gli “hard” che i “soft” constraints si procede alla prima fase di simulazione geostatistica per generare i primi modelli di partenza (starting models) che saranno successivamente aggiornati durante il processo di inversione iterativo al fine di matchare i dati osservati. Gli step seguenti servono nella generazione di tali starting models:

1. Stabiliamo la finestra mobile rettangolare da utilizzarsi nella simulazione geostatistica per la ricerca dei valori noti da poter correlare ad ogni iterazione. Si utilizzano come riferimento il correlogramma Gaussiano sia temporale che spaziale, impostando una soglia corrispondente al range di correlazione (figura 3.27). In questo modo evitiamo che rientrino nella finestra dei valori troppo lontani per influenzare la proprietà nel punto attualmente considerato;

(39)

2. Creiamo un percorso casuale come in figura 3.28 (che varia ad ogni iterazione) da seguire per effettuare la stima di Kriging che comprenda ogni posizione del grid del reservoir, selezionata in modo unico, escluse le posizioni note relative ai pozzi;

Fig. 3.28 Esempio di percorso casuale seguito dall’algoritmo per la stima della proprietà.

3. Se la finestra mobile, che ha come posizione centrale il punto in cui si sta stimando la proprietà, non ha individuato punti noti al suo interno, si prende come riferimento il valore della media delle impedenze note.

4. Si utilizza quindi questo valore medio per estrarre il valore predetto da una distribuzione di probabilità Gaussiana che ha come varianza la varianza delle impedenze note. Si inserisce il valore predetto nelle impedenze note a priori e si passa all’iterazione successiva;

5. Se sono stati individuati valori noti, impostiamo il sistema di Kriging composto da:

a. Matrice di Kriging 𝐶𝑖𝑗: costruita estrapolando dalla matrice di covarianza del modello le covarianze spaziali valutate per i vettori distanza tra i punti noti (𝑖𝑗);

b. Vettore di Kriging 𝐶0𝑖: costruito estrapolando dalla matrice di covarianza del modello le covarianze spaziali calcolate per i vettori distanza tra i punti noti (𝑖) e la posizione dove si effettua la stima;

6. Invertiamo e moltiplichiamo la pseudo inversa della Matrice di Kriging per il Vettore di Kriging ottenendo così il vettore dei pesi;

7. Calcoliamo un valore di impedenza predetta tramite la formula di Simple Kriging e la corrispondente varianza di Kriging;

8. Estraiamo un valore casuale da una distribuzione di probabilità Gaussiana che ha come media il valore di impedenza predetto con SK e come varianza, la varianza di Kriging;

9. Il valore di impedenza appena estratto viene inserito tra i valori noti a priori per le successive iterazioni;

(40)

10. Applichiamo tale procedimento a tutti i punti del grid per ottenere un modello di impedenza predetto;

11. Ripetiamo il procedimento dal punto 3 per un numero di volte stabilito dall’utente (nel nostro caso 10) generando così un insieme di modelli predetti che rispettano i vincoli soft e hard imposti;

Fig. 3.29 Convoluzione delle tracce di riflettività dei modelli generati con un’ondina sorgente per ottenere i sismogrammi sintetici.

12. Una volta generati i modelli di impedenza, si convolvono le tracce di riflettività con un’ondina e si generano i corrispondenti sismogrammi sintetici (figura 3.29) necessari nel secondo step di inversione geostatistica;

13. Si applica la classificazione Bayesiana (figure 3.30 e 3.31) delle facies per generare dai modelli di impedenza acustica i rispettivi modelli di facies lito-fluide anch’essi indispensabili per il secondo step di inversione. Per farlo occorrono:

a. Vettore di addestramento che contiene le impedenze note dei pozzi; b. Vettore contenente le rispettive facies lito-fluide;

c. Probabilità a priori delle facies calcolate in base all’occorrenza di queste all’interno dei pozzi;

(41)

Fig. 3.31 L’immagine mostra la classificazione bayesiana delle facies lito-fluide dai modelli di impedenza generati con Simple Kriging.

I modelli di impedenza appena ottenuti possono essere mediati in un unico modello più rappresentativo e statisticamente più significativo. Da questo modello si genera il sismogramma sintetico che viene poi correlato al dato sismico osservato. Il coefficiente di correlazione globale sul modello medio viene solamente utilizzato durante le iterazioni del secondo step per monitorare l’andamento dell’inversione e verificarne la convergenza ma non influenza il processo di aggiornamento dei vari modelli.

Fin qui si è reso necessario utilizzare una matrice di covarianza del modello unica poiché il Simple Kriging assume una distribuzione della proprietà Gaussiana in tutto il modello, ignorando di conseguenza le facies. Nel secondo step di inversione però aggiorniamo i modelli prendendo in considerazione le facies litologiche ed una distribuzione della proprietà gaussiana all’interno di ciascuna facies, in accordo quindi con una Gaussian-mixture. Per questo motivo è necessario sostituire la matrice di covarianza precedentemente calcolata con altre matrici di covarianza che rappresentino la covarianza spaziale e temporale delle rispettive facies, in questo caso una per le ‘sand’ e una per le ‘shale’.

Prima di procedere con il secondo step di inversione occorre quindi andare a definire tali matrici. Definiamo una matrice di covarianza per le ‘sand’, nella figura 3.32 in alto, calcolando dai valori di impedenza dei well-log relativi alle sabbie il valor medio e la varianza che, dopo aver applicato un doppio prodotto di Kronecker con i variogrammi Gaussiani impostati in precedenza, permettono la creazione di tale matrice. Medesimo procedimento viene svolto per definire la matrice di covarianza delle ‘shale’, nella figura 3.32 in basso.

(42)

Fig. 3.32 Matrici di covarianza del modello per ‘sand’ in alto e ‘shale’ in basso.

Si conclude quindi il primo step di inversione ottenendo come output i modelli di impedenza acustica predetti, i modelli di facies associati ed infine i rispettivi sismogrammi sintetici. Questi ouput costituiscono i nuovi input per il secondo step di inversione.

Secondo step:

I seguenti passaggi descrivono il metodo di co-simulazione congiunta di impedenza e facies lito-fluide rispettando i medesimi vincoli “hard” e “soft” imposti nel primo step di inversione, con la differenza che ogni modello di impedenza viene simulato sotto l’ulteriore guida della variabile discreta, rappresentata dalle facies.

1. I modelli generati fin qui con Simple Kriging verranno aggiornati iterazione dopo iterazione. L’idea è quella di utilizzare le “porzioni” migliori dei modelli predetti dell’iterazione corrente al fine di guidare l’aggiornamento dei modelli di impedenza per l’iterazione successiva, sempre rispettando i vincoli hard e soft imposti. A tal fine si utilizzerà il Collocated Co-Kriging come di seguito descritto. Occorre per prima cosa andare a definire ad ogni iterazione

(43)

la variabile secondaria del Collocated Co-Kriging che guiderà l’aggiornamento dei vari modelli predetti:

a. Si suddivide in finestre temporali, di uguale lunghezza adeguata, il sismogramma osservato e tutti i sismogrammi predetti generati. La lunghezza temporale della finestra deve essere pari ad almeno la lunghezza dell’ondina;

b. Si applica la funzione di correlazione trace-by-trace, finestra per finestra, tra dato sismico osservato e sintetici, in modo da poter identificare le porzioni del modello che meglio fittano il dato osservato (figura 3.33);

Fig. 3.33 Schema di correlazione in finestre (1,2,3) tra tracce del sismogramma osservato e rispettive tracce dei sismogrammi sintetici predetti.

c. Si salvano le relative posizioni delle porzioni migliori in modo da poter estrarre le corrispondenti sezioni dai modelli di impedenza generati nel primo step, come mostrato in figura 3.34.

Riferimenti

Documenti correlati

La variabile di destinazione di un’assegnazione può avere tipo diverso dal tipo dell’espressione. int

 Le parole chiave char char, int int, float float, double double, ed enum enum descrivono i tipi base; short short, long long, signed signed, unsigned unsigned sono i

© 2001 Pier Luca Montessoro - Davide Pierattoni (vedere nota di copyright a pag. 2) 2 Questo insieme di trasparenze (detto nel seguito slide) è protetto dalle leggi sul copyright

– una variabile di tipo char può avere o meno il segno, ma in ogni caso i caratteri stampabili sono

Panoramica del dato infortunistico e delle malattie professionali Settore Pesca.. D.ssa

[r]

[r]

In questo caso il numero non nullo delle righe della matrice ridotta a scalini è uguale al numero delle incognite pivotali e allora il sistema ha UNA SOLA SOLUZIONE.. Da notare