DAGA-FWI

In questa sezione si vuole applicare il DAGA ad un problema geosico caratterizzato da un'elevata complessità ottimizzativa e dal grande costo computazionale: la full-waveform inversion.

4.3.1 Denizione del problema

La full-waveform inversion (FWI) è una strategia di data-tting fortemente non lineare che permette di ottenere una stima accurata delle proprietà del sottosuolo a partire da dati sismici a riessione [18, 19].

La FWI prevede, a partire da un modello plausibile del sottosuolo, il ranamento progressivo di tale modello attraverso un processo iterativo articolato nei seguenti punti:

• il calcolo di un dato sintetico risolvendo numericamente l'equazione d'onda, simulandone la propagazione nel modello denito nell'iterazio- ne precedente (forward modelling),

• la valutazione del data mist, ovvero della norma Lp _{della dierenza}

fra il dato reale e quello simulato,

• la generazione di modelli più promettenti basandosi sui valori di mist calcolati.

La FWI può essere eettuata sia in approssimazione acustica del mezzo investigato, sia in approssimazione elastica, o anche anisotropica. Ovviamen- te il costo computazionale e la dicoltà di convergenza dell'algoritmo (legata sia al malcondizionamento del problema sia al numero dei minimi locali della funzione oggetto) aumentano nel passare dal primo caso all'ultimo.

Per simulare la propagazione dell'onda nel sottosuolo è necessario forni- re all'algoritmo, oltre al modello del sottosuolo, anche la geometria dell'acquisizione e le caratteristiche dell'ondina sorgente utilizzata per generare il dato.

La conseguente valutazione del data mist permette, teoricamente, di tenere in considerazione tutto il contenuto informativo dei dati sismici a

riessione registrati (i.e. diving waves, riessioni primarie, multiple, onde convertite, etc). Da ciò consegue che il modello migliore ottenibile tramite l'inversione avrà un'elevata risoluzione ed un'elevata somiglianza con il modello reale.

Dalla descrizione data della FWI risulta ovvia l'applicazione di un algoritmo di ricerca locale per conseguire un'accurata ottimizzazione del modello rappresentante il sottosuolo [20, 21]. Il principale drawback di questo approccio risiede nella scelta del modello iniziale. La FWI è un problema fortemente non lineare e mal condizionato, caratterizzato da una funzione oggetto mul- timodale. Pertanto la scelta di un modello non sucientemente accurato, ovvero non contenuto in nessun intorno convesso del minimo globale nella topologia indotta dalla funzione oggetto, comporterà inevitabilmente la convergenza verso un minimo locale, e dunque il fallimento dell'inversione.

Per ovviare a questa problematica è stato studiato un approccio ibrido, che prevede l'applicazione di un metodo di ottimizzazione globale al ne di generare uno starting model per la successiva fase di ranamento tramite metodi ottimizzativi locali [22, 2, 14, 23, 24]. Il vantaggio principale di questo approccio è dato dalla maggiore capacità esplorativa degli algoritmi di ricerca globale, che risentono in misura minore della presenza di minimi locali. Di contro l'ottimizzazione globale richiede molte più risorse compu- tazionali, che crescono esponenzialmente con la dimensionalità del problema in considerazione (fenomeno spesso citato in letteratura come curse of dimensionality).

Per questo problema è stato provato che gli algoritmi genetici costituiscono una valida soluzione per la fase di ricerca globale [14]. La generazione di un modello smooth può essere essere eseguita con successo limitando la dimensionalità dello spazio dei modelli investigato dai GA adottando due griglie di inversione [25]:

• una prima griglia sparsa costituita da pochi punti i cui valori rappresentano i cromosomi dell'algoritmo genetico utilizzato per l'ottimizzazione, • una griglia tta, ottenuta tramite interpolazione bilineare della griglia sparsa, utilizzata per la fase di forward modelling, per calcolare i valori

di data mist ottenuti a partire dai modelli di velocità, ovvero i valori di tting dei cromosomi associati ai modelli.

Questa strategia permette una convergenza rapida verso modelli di velocità a bassa frequenza, caratterizzati da una maggiore accuratezza delle soluzioni individuate.

4.3.2 Criteri di comparabilità dei risultati

Nei test presentati nella sezione 4.3.3 è stata applicata un'inversione FWI acustica 2D per determinare un modello smooth di velocità di propagazione di onde P nel sottosuolo, scegliendo i GA come algoritmi di inversione globale. Nello specico sono stati applicati gli algoritmi DAGA e NGA al ne di confrontarne le performaces.

Per le inversioni è stato scelto un dato iniziale sintetico generato a partire da una porzione del modello di velocità Marmousi.

Il Marmousi è un modello di velocità sintetico creato nel 1998 dall'Institut Français du Pétrole (IFP) [26]. Il modello è stato sviluppato basandosi su dati sismici e geologici acquisiti in oshore Angola. Le geometrie e il modello di velocità sono tali da generare un dato sismico sintetico estremamente complesso. Ciò rende il Marmousi un valido modello per testare l'ecacia di algoritmi globali nell'ambito della FWI.

In gura 4.19 è riportato il modello di velocità di propagazione delle onde P. L'inversione è stata limitata alla porzione di marmousi delimitata dal rettangolo rosso, per limitare il costo computazionale dell'inversione. Il passo di campionamento spaziale della griglia del Marmousi è di 24m sia per le ascisse che per le ordinate. Per evitare problematiche legate alla dispersione numerica spaziale è stato scelto di reinterpolare il modello su di una griglia più tta, dimezzando il passo di campionamento spaziale lungo l'asse x.

Nei test sono state simulate due inversioni partendo da due dati dierenti: • un primo dato è stato generato con 17 sorgenti equispaziate poste a 24m di profondità rispetto alla supercie, simulate con un'ondina sorgente a fase zero con frequenza centrale di 7Hz e frequenza massima

Figura 4.19: Modello di velocità Marmousi in cui è evidenziata la porzione oggetto delle inversioni

di 20Hz. Tutte le energizzazioni sono state registrate da 50 ricevitori equidistanziati posti alla stessa profondità delle sorgenti,

• un secondo dato è stato generato con la stessa congurazione di sorgenti e ricevitori ma simulando l'energizzazione tramite un ondina a fase zero con frequenza centrale di 15Hz e frequenza massima di 35Hz.

In gura 4.20 sono mostrati gli spettri di frequenza delle due ondine sorgente. Lo spettro di frequenze dell'ondina sorgente determina la risoluzione degli shot gather e, di conseguenza, aumenta la complessità dell'inversione in quanto un maggiore contenuto in frequenze determina una maggiore proba- bilità di incorrere in fenomeni di cycle skipping, quindi una funzione oggetto caratterizzata da un maggior numero di minimi locali. Dunque il risultato atteso è che il primo test presenti dicoltà minori, e una convergenza più ecace per entrambi gli algoritmi rispetto al secondo test.

In gura 4.21 è evidenziato un dettaglio dello strato d'acqua di 48m in cui sono mostrate le sorgenti e i ricevitori, comuni alle due acquisizioni, posti entrambi a 24m di profondità.

Figura 4.20: Spettri di frequenza: a) dell'ondina sorgente utilizzata per il primo test, b) di quella usata per il secondo test.

I dati sintetici osservati sono stati generati applicando un forward modelling alle dierenze nite al modello iniziale. In gura 4.23 sono riportati a titolo esemplicativo gli shot gather relativi alla prima (o end) e alla sesta sorgente (split spread) utilizzati per le due inversioni.

In gura 4.22 è evidenziata la griglia sparsa, i cui nodi sono indicati dalle croci nere. Sui nodi della griglia tta sono stati mappati i valori di velocità del modello reale.

Figura 4.21: Distribuzione delle sorgenti e dei ricevitori dell'acquisizione

Figura 4.22: Modello di velocità oggetto dell'inversione. Le croci nere rappresentano la griglia di inversione coarse.

a) b)

c) d)

Figura 4.23: common shot gather del dato sintetico osservato: a) acquisizione della 1o sorgente con ondina a 7Hz, b)acquisizione della 6o sorgente

con ondina a 7Hz, c) acquisizione della 1o _{sorgente con ondina a 15Hz, d)}

Per quanto riguarda la fase di ottimizzazione tramite algoritmi genetici, è stato scelto:

• di utilizzare due griglie di inversione:

una griglia sparsa di 5·11 punti costituenti le incognite dello spazio dei modelli esplorato dai GA,

una griglia tta di 35·199 punti costituenti la griglia reinterpolata bilinearmente su cui eseguire il forward modelling,

• di calcolare il data mist tramite norma L2 della dierenza fra dato

osservato (generato sinteticamente, come precedentemente illustrato) e i dati predetti (i.e. calcolati a partire dai modelli generati dall'algoritmo di inversione), dopo aver eseguito una normalizzazione traccia traccia sui dati.

I test esposti nel paragrafo successivo sono stati eseguiti utilizzando un codice parallelo di ottimizzazione globale FWI scritto dal dott. Galuzzi Bru- no durante il suo dottorato di ricerca, riadattandolo opportunamente per permettere l'inserimento delle funzioni caratterizzanti il DAGA. Il codice è suddiviso in due parti:

• la fase propria di inversione, scritta in codice Matlab, in cui vengono applicati gli operatori dell'algoritmo genetico al set di soluzioni correnti. Questa operazione viene eettuata sull'host master,

• la valutazione della funzione oggetto, tramite calcolo del data mist come la dierenza in norma L2 _{fra il dato reale e il dato sintetico,}

generato a partire dai singoli modelli di velocità tramite forward modelling. Questa fase, implementata in codice C++, è la più esosa computazionalmente, pertanto è stata parallelizzata sugli host slave tramite un protocollo di accesso remoto SSH per lanciare le inversioni, ed un protocollo di trasferimento dati SCP, per inviare i risultati all'host master.

4.3.3 Analisi dei risultati

I due test sono stati eseguiti sullo stesso modello e con la stessa distribuzione di sorgenti e ricevitori. L'ondina sorgente del primo test ha una frequenza centrale di 7Hz e quella del secondo test di 15Hz. Ne consegue una maggiore complessità computazionale per il secondo test.

I parametri delle due inversioni sono riportati in tabella 4.18.

Il campionamento temporale dell'acquisizione è di 2ms per il primo test, ed è stato ridotto ad 1ms nel secondo test per limitare fenomeni di dispersione numerica.

Il tempo di registrazione simulata dai ricevitori è di 2s per il primo test. Tale tempo è stato ridotto a 1.7s nel secondo caso. Questa scelta limita marginalmente il maggiore tempo di calcolo del forward modelling per il secondo test, ma non inuisce sulle informazioni contenute nel sismogramma: si può infatti notare come nell'acquisizione o end del dato osservato in gura 4.22 (c) siano stati registrati primi arrivi a tutti gli oset, nonostante il minore tempo di acquisizione.

I valori di data mist sono stati ottenuti come norma L2 _{delle dierenze}

fra il dato sintetico osservato e i dati generati a partire dai modelli prodotti reinterpolando bilinearmente i cromosomi dell'algoritmo genetico.

L'NGA e il DAGA sono stati lanciati con gli stessi parametri di inversione. Per rendere comparabili i test è stata utilizzata la stessa popolazione iniziale per entrambe le inversioni (NGA e DAGA). Lo spazio dei modelli, su cui i cromosomi sono stati generati con probabilità uniforme, è stato costruito intorno al modello 1d, ottenuto come media sulle righe delle velocità del modello reale, in un range di [−300m/s, +300m/s] (mostrato in gura 4.25).

In gura 4.24 sono mostrate:

• le curve di errore ottenute come norma L2 _{della dierenza fra il da-}

to osservato e quello predetto a partire dal modello migliore di ogni generazione, in funzione della generazione:

in a) la curva di data mist per il 1o _test,

Parametri 1o _{test 2}o _test

Parametri FWI Ondina

ϕondina zero zero F centrale dell' ondina 7 Hz 15 Hz F max dell' ondina 20 Hz 35 Hz Sorgenti # Source 17 17 ∆x Source 144 m 144 m Ricevitori # Rec 50 50 ∆x Rec 48 m 48 m t Rec 2 s 2 s ∆t Rec 2 ms 1 ms data mist Norma L2 L2 Parametri GA

Dimensione del problema 55 55 # Popolazione iniziale 330 330 # Sottopopolazioni 3 3 # Massimo di generazioni 400 300 Tasso di selezione 0.8 0.8 Parametri DAGA # Rimpiazzi 14 14 probabilità catastrofe 0.2 0.2

Tabella 4.18: Parametri del test

• le curve di errore ottenute come norma L2 _{della dierenza fra il modello}

migliore di ogni generazione ed il modello reale, riscalate in funzione del numero dei parametri:

in b) la curva di model mist per il 1o test

in d) la curva di model mist per il 2o _test.

Si nota la non perfetta correlazione fra il data mist (unico valore utilizzato per determinare il tness dei cromosomi delle varie generazioni, come

a) b)

c) d)

Figura 4.24: Curve di errore in funzione delle iterazioni dell'algoritmo evidenziato dalla curva monotòna decrescente) e il model mist (calcolato a posteriori e caratterizzato da una curva non decrescente).

In entrambi i casi le curve di data mist sono molto vicine, ed entrambe convergono ad un valore prossimo allo zero.

Per quanto riguarda le curve di model mist è possibile osservare come nel 2o _{test le curve assumano valori maggiori rispetto al 1}o _{test a causa}

del maggior contenuto in frequenze nel dato e di conseguenza una maggiore presenza di fenomeni di cycle skipping. Anche i modelli nali risultano essere meno accurati di quelli ottenuti nel 1o _{test. Nel secondo test è evidenziata la}

maggiore capacità esplorativa del DAGA rispetto all'NGA: a parità di valori di data mist, i modelli ottenuti con il DAGA assumono valori di model mist sensibilmente inferiori rispetto a quelli trovati dal NGA.

La gura 4.25 mostra una comparazione fra il modello reale e i modelli ottenuti dalle inversioni DAGA e NGA nei due test.

Dai risultati ottenuti risulta evidente che nel 1o _{test i due algoritmi con-}

vergano a soluzioni simili prossime al minimo globale. Questo risultato è concorde con quanto osservato nel caso di funzioni analitiche caratterizza- te da una topologia della funzione oggetto sucientemente semplice, in cui l'algoritmo NGA mostrava buone capacità di convergenza. Il limitato range di frequenze considerato (0 − 20Hz) unitamente ai risultati del test fanno presupporre una topologia abbastanza semplice, ovvero caratterizzata da un numero piuttosto limitato e/o ben distribuito di minimi locali. In conclusione si può aermare che entrambe le inversioni abbiano avuto successo, in quanto i modelli prodotti costituiscono un valido starting model per un ranamento ed arricchimento sulle alte frequenze tramite un metodo di inversione locale. Questa seconda parte di inversione esula dagli scopi di questa tesi, pertan- to non è stata eseguita e non sono disponibili i risultati ad alta frequenza ottenuti ranando i modelli generati con il DAGA e il NGA.

L'analisi dei modelli ottenuti nel 2o _{test conferma quanto osservato nelle}

curve di errore, ovvero che i valori di model mist assumono valori maggiori rispetto all'inversione precedente. In questo caso il modello ottenuto con il DAGA è qualitativamente migliore e rappresenta uno starting model certa- mente più valido per un'inversione locale. La maggiore dicoltà incontrata dagli algoritmi e la maggiore ricchezza in alte frequenze del dato sismico (0 − 35Hz) fa presupporre una topologia più complessa caratterizzata da un elevato numero di minimi locali e/o una loro distribuzione irregolare.

In gura 4.26 e 4.27 è mostrato un dettaglio del confronto fra i dati reali (in rosso) e quelli generati a partire dai modelli di velocità ottenuti con le inversioni DAGA e NGA (in nero). Si può osservare il buon tting della porzione di dato corrispondente ai primi arrivi (rifrazione e diving waves).

Si ritiene che, basandosi sui risultati ottenuti, sia possibile ranare i parametri del DAGA per ottenere risultati migliori, ovvero che vi sia ancora margine di miglioramento per l'algoritmo proposto.

Modello reale modello 1D di partenza

Modello nale del NGA per il 1o test Modello nale del NGA per il 2o test

Modello nale del DAGA per il 1o _{test Modello nale del DAGA per il 2}o _test

a) b)

c) d)

Figura 4.26: Confronto fra il dato osservato (in rosso) e quello generato a partire dalla soluzione del DAGA (in nero): a) Common shot gather relativo alla 1o _{sorgente, generato con ondina a 7Hz, b) Common shot gather relativo}

alla 6o _{sorgente, generato con ondina a 7Hz, c) Common shot gather relativo}

alla 1osorgente, generato con ondina a 15Hz, d) Common shot gather relativo

a) b)

c) d)

Figura 4.27: Confronto fra il dato osservato (in rosso) e quello generato a partire dalla soluzione del NGA (in nero): a) Common shot gather relativo alla 1o _{sorgente, generato con ondina a 7Hz, b) Common shot gather relativo}

alla 6o _{sorgente, generato con ondina a 7Hz, c) Common shot gather relativo}

alla 1osorgente, generato con ondina a 15Hz, d) Common shot gather relativo

Capitolo 5

Aggiunta di vincoli laterali

Al ne di limitare i tempi di calcolo per problemi computazionalmente esosi, quali la FWI, è possibile cercare una strategia che limiti la porzione di spazio dei modelli esplorato, escludendo dall'ottimizzazione modelli sicamente non plausibili, o in porzioni di spazio estremamente distanti dal minimo globale. Non conoscendo la posizione del minimo globale non è possibile escludere a priori nessuna porzione dello spazio, dunque è da evitare qualsiasi metodo che imponga vincoli analitici. Ne consegue che le strategie analizzate non debbano limitare l'esplorazione dello spazio, bensì direzionarla in base alle informazioni a priori considerate.

Inoltre la struttura dei GA prevede che le incognite del problema siano variabili totalmente scorrelate fra loro. Tale assunzione non è vera, ad esem- pio, per modelli che rappresentano le velocità del sottosuolo, essendo queste spazialmente correlate. Si chiede quindi che le strategie proposte consentano l'inserimento di informazioni a priori che vincolino spazialmente le incognite delle inversioni.

5.1 Metodi proposti

Un possibile approccio al problema in analisi consiste nell'inserire un termine di penalizzazione ai valori della funzione oggetto, tale da favorire i modelli

che soddisno la condizione richiesta a discapito di modelli che presentino dati completamente scorrelati fra loro.

Dunque è stata sviluppata una strategia di inversione che aggiunge ai valori della funzione oggetto un secondo termine adeguatamente pesato:

objtot = objGA + W · objnew

in cui:

• objtot è il valore totale della funzione oggetto utilizzato dall'algoritmo

genetico per un determinato elemento di una data generazione,

• objGA è il valore della funzione oggetto che verrebbe usato da un nor-

male algoritmo genetico (e.g. il data mist per la FWI), • objnew è il termine di penalizzazione introdotto,

• W è il peso assegnato al termine di penalizzazione: valori dierenti di peso determinano quanto la nuova informazione penalizzi le soluzioni esaminate.

Una problematica fondamentale è legata all'adabilità delle informazioni a priori scelte, spesso non totalmente corrispondenti al modello reale. Le soluzioni proposte prevedono la scelta di un peso adattivo sulle generazioni secondo una funzione decrescente, in modo tale da:

• massimizzare l'eetto di tale informazione nelle prime generazioni, quando viene esplorata una grande porzione di spazio in cerca delle regioni di minimo,

• ridurne l'eetto col crescere delle generazioni, quando le soluzioni già contengono informazioni sulla geologia del sottosuolo.

La funzione del peso W (gen) in funzione delle generazioni è W(gen) =

W(0) + (W (end) − W (0)) · 1 − genmax− gen + 1 genmax

Figura 5.1: Confronto fra la curva di peso e una sua formulazione più semplice in cui W (0) rappresenta il peso del penalty term nella prima generazione, W(end) nell'ultima e oW è l'ordine della curva risultante (mostrata in rosso in gura 5.1), gen è la generazione corrente e genmax è il massimo numero di

generazioni imposto dall'utente.

La scelta di questa formulazione è legata al suo andamento: confrontando- la con una formulazione sublineare monotòna decrescente più semplice come

oWpgen/gen

max, la curva scelta mostra un andamento più adatto alle richie-

ste, come evidenziato dalla gura 5.1, in cui genmax = 1000, W (0) = 0.25,

W(end) = 0 e oW = 8. Si osserva infatti come la curva rossa abbia un andamento più lento sulle prime generazioni, in cui si desidera che il penalty term inuisca sull'inversione direzionandone l'esplorazione, mentre dopo cir- ca 400 generazioni il peso assume un valore prossimo a W (end). La curva blu evidenzia un comportamento speculare, e dunque non adatto alla strategia proposta.

Lo scopo della soluzione proposta è di modicare la topologia indotta sullo spazio dei modelli aggiungendo un minimo ttizio che, grazie all'adattività

del termine di peso, migrerà col procedere delle generazioni verso porzioni di spazio sempre più prossime al minimo globale.

Sono stati individuati tre possibili criteri per introdurre i valori di penalty term (i.e. objnew, denito precedentemente), a partire da un modello a priori

quanto più accurato possibile:

• La semplicità del modello, ovvero la dierenza fra i modelli generati dai GA rispetto al modello a priori. La scelta di questa informazione dire- ziona univocamente l'esplorazione verso il minimo ttizio della funzione

Nel documento Algoritmi genetici per l'inversione di dati sismici a riflessione: attenuazione del genetic drift e analisi preliminari sull'aggiunta di vincoli laterali (pagine 74-110)

4.3.1 Denizione del problema

4.3.2 Criteri di comparabilità dei risultati

4.3.3 Analisi dei risultati

Capitolo 5

Aggiunta di vincoli laterali

5.1 Metodi proposti

4.3.1 Denizione del problema