• Non ci sono risultati.

GENERAZIONE DI SERIE DI DATI

Nel documento Parte II 1.MISURAZIONE (pagine 99-105)

TIPI DI INCERTEZZA

1. Approccio diretto: La distribuzione dei livello nello spazio e nel tempo H(x,t), come pure la ricarica e il coefficiente di immagazzinamento sono noti, e

2.3 GENERAZIONE DI SERIE DI DATI

I valori delle teste idrauliche possono contenere errori. Questi possono essere: errori di misura dovuti a difetti nella strumentazione, errori nelle coordinate geometriche, errori legati all’assunzione di stazionarietà nella misura dei livelli ecc.. E’ difficile stimare e contenere tali errori.

I valori di trasmissività sono noti in corrispondenza dei pozzi dove sono stati effettuati test di pompaggio. Anche queste misure contengono errori. Questi posso essere: errori nella valutazione delle depressioni indotte durante il test di pompaggio, interpretazioni errate nell’interpretazione dei risultati dei modelli analitici, ecc... Un grande problema è, in particolare, la stima del volume dell’acquifero che partecipa al test. Se il test dura poco, la scala è nell’ordine di qualche metro. Se il test dura molto, si arriva addirittura alla scala del chilometro. Ancora oggi è difficile stimare la dimensione del volume di influenza anche se si conosce perfettamente la durata del test. In ogni caso, l’interpretazione del test assume l’omogeneità e l’isotropia del campo di trasmissività all’interno di tale volume.

2.3 GENERAZIONE DI SERIE DI DATI

La geostatistica include l’abilità di simulare il campo di interesse in termini stocastici. Una simulazione stocastica consiste nella generazione di un grande numero di campi equiprobabili, chiamati realizzazioni, che utilizzano i dati disponibili e le loro caratteristiche statistiche. La generazione di serie artificiali di dati è un metodo molto utilizzato in molti campi delle scienze della terra. Ad esempio è molto utilizzato nel campo dell’idrologia per simulare l’effetto di deflussi naturali sul funzionamento di opere idrauliche. Lo scopo è quello di riuscire ad avere a disposizione molte serie di deflussi ugualmente verosimili come anticipazioni del futuro così da permettere al progettista di ottenere delle previsioni statistiche sul funzionamento dell’opera.

Sono due i tipi di simulazione possibili:

5 p.d.f= funzione di distribuzione della probabilità.

1. Simulazioni non condizionate: Si tratta di simulazioni che riproducono delle misure statistiche semplici6 di un campo senza considerare i dati osservati.

2. Simulazioni condizionate: La simulazione genera delle realizzazioni che incorporano la struttura di correlazione dei dati, usano i dati e utilizzano la tecnica dell’interpolazione lineare del kriging.

2.3.1 SIMULAZIONE COL METODO MONTE-CARLO

L’approccio di Monte Carlo è stato intensamente utilizzato per trattare problemi di flusso nel sottosuolo per un acquifero eterogeneo. Esso non tenta di trattare i problemi in termini di risoluzione di equazioni differenziali stocastiche, ma computa soluzioni deterministiche per un numero di realizzazioni generate numericamente e analizza la collezione delle realizzazioni per stimare medie e varianze e, possibilmente, le funzioni di distribuzione dei parametri in studio. Si tratta di una tecnica potente di simulazione che richiede un quantitativo di assunzioni minore rispetto ad altri metodi di analisi dell’incertezza.

Gli strumenti necessari sono i seguenti:

1) Un generatore di un campo casuale. Il generatore è una procedura matematica che genera realizzazioni delle variabili input. Nel caso della conducibilità idraulica, tale procedura è sviluppata per dare molte funzioni Y1(x),Y2(x). Queste funzioni sono generate in modo tale che:

1/N Σi Yi(x) ≈ 0 e

1/N Σi Yi(x) Yi(x’) ≈ exp(-|x-x’|) quando N è grande.

2) Un risolutore dei problemi di flusso e di trasporto. Per ognuno dei Yi(x) si può risolvere un problema deterministico, date le condizioni al contorno, per ottenere, ad esempio, il valore della testa Ηi(x).

3) Strumenti per l’analisi statistica dei dati e per l’elaborazione dei risultati finali.

Il modo di procedere è il seguente.

Le equazioni sono innanzitutto trasformate in forma numerica e la soluzione (ad es. il livello H per l’eq. del flusso e la concentrazione C del soluto per l’eq. del trasporto) è cercata sotto forma di un vettore di valori nei nodi di una griglia spaziale. I coefficienti variabili rappresentanti le proprietà del sistema sono anch’essi rappresentati da vettori dei loro valori in corrispondenza dei nodi. Nella prima fase della simulazione, una realizzazione del vettore casuale (ad es. la conducibilità idraulica Kj con j= 1…M) è generato dal computer. Poi viene generato Yj= ln Kj. Nella seconda fase, per la realizzazione data (ovvero per un fissato valore di K) viene determinato H (o C) risolvendo il problema del flusso in termini deterministici.

Questa operazione è ripetuta M volte per ottenere un set di soluzioni che sono considerati come un set di realizzazioni. Basandosi su questa informazione, può essere calcolato qualsiasi momento di interesse.

A differenza di una soluzione analitica, due tipi di approssimazioni sono implicite nel processo:

1. la sostituzione delle funzioni continue con un set discreto di dimensione N. Poiché una funzione casuale può oscillare notevolmente, il problema delle scelta della dimensione della griglia che assicura una desiderata accuratezza è un punto delicato.

2. la simulazione delle variabili casuali attraverso un numero finito di campioni.

Le simulazioni di Monte Carlo sono applicate per il flusso e il trasporto in una formazione eterogenea in 1D e 2D. Il metodo è concettualmente semplice e potente perché può essere utilizzato per risolvere problemi con condizioni al contorno complessi e grandi variazioni nelle variabili in ingresso. Esso, tuttavia, presenta delle limitazioni che ne restringono l’utilizzo:

1. i tempi computazionali impediscono uno sfruttamento per i casi più complicati in 3D e questo per il fatto che, per ottenere una certa accuratezza, è necessario avere griglie fitte;

2. si hanno problemi di convergenza per varianze elevate (σ2y).

Bisogna considerare che nella pratica, a causa degli alti costi per generare realizzazioni di campi casuali e in particolare per risolvere i problemi di flusso e di trasporto, il numero N di realizzazioni quasi mai eccede le centinaia. La penalità dell’uso di un piccolo valore di N è

che i risultati sono affetti dall’errore di campionamento. Questo è dovuto al fatto che il valor medio derivante da un numero finito di realizzazioni è diverso da quello ottenuto quando N tende all’infinito. Può essere dimostrato che la deviazione standard dell’errore di campionamento è proporzionale a 1/√N cosicché, dopo un certo punto, l’errore decresce lentamente.

PROCEDIMENTO DI MONTE-CARLO

1) GENERARE GEOSTATISTICAMENTE LE REALIZZAZIONI DELLA CONDUCIBILITA’ IDRAULICA O DEFINIRE PARAMETRI INCERTI E IL LORO TIPO DI DISTRIBUZIONE.

2) EFFETTUARE DELLE SIMULAZIONI DEL FLUSSO CON UN MODELLO GIA’ CALIBRATO.

3) CONTROLLARE I RISULTATI DI OGNI SIMULAZIONE FACENDO UN CONFRONTO CON LA BASE CALIBRATA DI PARTENZA E DETERMINARE QUALI REALIZZAZIONI SONO ACCETTABILI7. 4) CONSIDERARE SOLO LE REALIZZAZIONI SCELTE NEL PRECEDENTE PUNTO E RISOLVERE IL MODELLO DI FLUSSO.

5) EFFETTUARE UNA SIMULAZIONE DI TRASPORTO PER OGNI MODELLO DI FLUSSO ACCETTATO.

2.3.2 METODO DELLA FUNZIONE DI RIPARTIZIONE INVERSA

Alla base dei metodi di Monte Carlo vi è la generazione di numeri casuali. I metodi di simulazione traggono l’elemento di casualità dalla disponibilità di una successione di variabili casuali distribuite uniformemente tra 0 e 1 e tra loro indipendenti.

[ ]

0 ( ) 0, ,..., ,... con 1 0,1

t i i i

U= = U =U U U U U

Il problema che si deve affrontare, prima di condurre un esperimento di simulazione, è la determinazione di un algoritmo in grado di generare numeri casuali. In realtà, una sequenza casuale di valori si può ottenere misurando gli output di modelli fisici (un dado per esempio) in grado di generare una sequenza di valori non prevedibile. Il metodo più diffuso consiste però nella generazione di sequenze deterministiche che abbiano proprietà simili ad una sequenza casuale. Si può quindi definire uno dei concetti che stanno alla base della simulazione.

7 Siccome il metodo di M.C. dà i valori ai parametri casualmente, esso può generare dei risultati non realistici che devono essere esclusi. Ad esempio, nel caso di una generazione di dati di pioggia, i dati da scartare sono

{ } { }

( ) Pr Pr : ( )

[0,1]

F xx X x w X w x

R R

= ≤ = ≤

Ω ≡ ⎯⎯→ ⊂

Una sequenza di numeri pseudo-casuali è una sequenza deterministica di numeri appartenenti all’intervallo [0;1, che hanno le stesse proprietà statistiche di una sequenza casuale di numeri.

Il metodo di simulazione noto come Funzione di Ripartizione Inversa utilizza una delle caratteristiche costitutive della definizione di funzione di ripartizione di una variabile casuale.

Gli algoritmi di simulazione per variabili casuali specifiche sono ricondotti ad un principio generale ben noto in statistica.

Si tratta del metodo più generale di simulazione e richiede che la funzione di densità di probabilità sia integrabile e che la funzione di ripartizione sia invertibile.

FIG 9. Inverso della Funzione di Ripartizione.

Data le generazione di numeri casuali (o pseudo-casuali) uniformemente distribuiti in [0,1] e la successiva trasformazione dell’i-esimo valore generato mediante la funzione di ripartizione inversa, si ottengono valori casuali estratti dalla distribuzione f(x).

2

Si tratta di una distribuzione di probabilità simmetrica che casualmente genera dei numeri tra 0 e 1.Vale la formula:

La funzione densità di probabilità normale di media µ e varianza σ2 è data dall’espressione:

2

La funzione di distribuzione della densità di probabilità della log-normale si può ottenere dalle precedente sostituendo y = ln x. Si ottiene:

Data una distribuzione normale (o log-normale), essa va innanzitutto standardizzata:

Zi = (Xi –Xi)/σ essendo:

Xi = il valor medio σ = la deviazione standard

Zi = la variabile standardizzata

I generatori casuali che fanno parte di questa categoria forniscono il valore di Zi. Date la media e la varianza, si può immediatamente calcolare Xi:

Xi =Xi + Zσ

Questo è appunto il calcolo che compie ripetutamente la procedura di Monte Carlo, permettendo di ottenere una distribuzione degli Xi.

DISTRIBUZIONE TRIANGOLARE

La distribuzione triangolare è caratterizzata dal valore più probabile e dai valori massimi e minimi. La distribuzione appare come nella figura sottostante.

FIG 10. Distribuzioni normale e log-normale. FIG 11. Distribuzione triangolare.

Nel documento Parte II 1.MISURAZIONE (pagine 99-105)