• Non ci sono risultati.

CAPITOLO QUARTO Correlazione Sospensione/Riflettanza

N/A
N/A
Protected

Academic year: 2021

Condividi "CAPITOLO QUARTO Correlazione Sospensione/Riflettanza"

Copied!
23
0
0

Testo completo

(1)

CAPITOLO QUARTO

Correlazione Sospensione/Riflettanza

In questo capitolo ci occuperemo di descrivere le procedure utilizzate per studiare la correlazione lineare tra i valori di riflettanza estratti dalle immagini Landsat e i dati di carico solido sospeso interessati. Prendendo come riferimento lavori preesistenti (Nanu 1997), si assume la misura puntuale della stazione come rappresentativa di una zona di grandezza pari a 0,45 ha (corrispondente circa ad un valore di 5 pixels nelle nostre immagini).

La correlazione tra concentrazione di carico solido sospeso e valori di radiazione delle bande 1,2,3 dei sensori TM 5 e ETM 7 sono ben documentati (Baban 1995).

Il principio fisico su cui si costruisce questa relazione dipende dalle caratteristiche spettrali dell’acqua e dei sedimenti in essa contenuti. Il principio del telerilevamento dice che per differenti lunghezze d’onda dello spettro elettromagnetico ciascun tipo di oggetto riflette e/o emette una certa quantità di energia che è funzione delle caratteristiche fisiche, geometriche e composizionali dell’oggetto stesso. Definaimo come rilettanza la formula 4a

Riflettanza ρ = E

r

/E

i Formula 4a

con i valori di

Ei = energia incidente Er = energia riflessa

e per λ.λ.λ.λ. la lunghezza d’onda della radiazione elettromagnetica, possiamo leggere la

(2)

Figura 4a

Come si può notare ogni elemento considerato nel grafico possiede un suo rapporto

ρ

λ. λ. λ. λ. definito firma spettrale. Nel caso dell’acqua si può osservare che per valori di λ λ λ λ

superiori a 0,8 m la radiazione viene completamente assorbita. Al contrario per valori inferiori la radiazione riesce parzialmente a penetrare diminuendo la sua intensità con l’aumento della profondità. In questo intervallo di λ λ λ λ le lunghezze d'onda che vengono

assorbite maggiormente sono in ordine il rosso il blu e il verde. Questo andamento spettrale si riferisce all’acqua completamente pura. Nel caso di presenza di materiale solido sospeso le particelle in soluzione riflettono parte della radiazione che attraversa la colonna d’acqua. In particolare, maggiore sarà la concentrazione di materiale solido sospeso maggiore sarà la percentuale di radiazione riflessa. Nel caso dei sensori TM e ETM le bande numero 1,2 e 3 registrano la radiazione negli intervalli specificati in tabella 4° e sono quelle più efficaci per l’analisi del trasporto solido (Nellis 1993).

(3)

Per rendere evidente questo fenomeno si sono scelte 3 immagini Landsat che mostrano i valori di assorbimento di una singola banda.

Figura 4b Immagine Landsat 01_02_15 FCC RGB 222

(4)

Figura 4d Immagine Landsat 01_02_15 FCC RGB 444

L’immagine scelta si riferisce alla foce dell’ Arno in un periodo di elevato apporto sedimentario. Nella prima immagine si può osservare il plume di sedimenti che dalla foce vengono dispersi in mare. La banda 2 penetra in profondità nella colonna d’acqua e raggiunge i sedimenti che stanno precipitando. Maggiore è la luminosità dell’immagine maggiore è la concentrazione dei sedimenti. Nella seconda immagine la finestra di indagine della banda (0,63-0,69 m) si sposta verso valori più vicini a 0,8 m che è il limite di assorbimento dell’acqua e i sedimenti diventano meno visibili. Nell’ultimo caso siamo oltre il valore 0,8 m e la radiazione incidente viene completamente assorbita.

La correlazione tra aumento della concentrazione dei sedimenti e aumento della radiazione riflessa varia a seconda di molti fattori. L’intensità dell’illuminazione, l’incidenza dei raggi solari, le caratteristiche dell‘acqua e altri fattori ambientali e strumentali rendono il valore del rapporto variabile. Per questo motivo esso va ricavato volta per volta partendo dai valori di carico solido sospeso registrati in una determinata immagine. Il procedimento per costruire il modello di regressione viene spiegato di seguito.

Si cerca sulle immagini Landsat l’ubicazione delle stazioni di prelievo dei dati di carico solido sospeso. Da queste aree di interesse si procede all’estrazione dei valori di riflettanza delle prime tre bande. Ognuno di questi dati verrà confrontato con il corrispettivo valore di

(5)

sicurezza che il corpo d’acqua fotografato dal satellite in quel giorno possedesse il valore di carico solido sospeso campionato. Nel seguente capitolo verrà spiegata la procedura di conversione delle Immagini Landsat da valori di DN a valori di riflettanza. Questo processo si rende necessario per diminuire gli effetti ambientali di ripresa e per poter confrontare immagini campionate in periodi temporali differenti.

4.1 Dati di Riflettanza

La possibilità di rilevare e quantificare i cambiamenti che avvengono sulla superficie della Terra, è condizionata dalla capacità dei sensori installati sulle piattaforme satellitari, di produrre misure calibrate e coerenti delle caratteristiche ambientali riprese dallo strumento (Chander, 2003). Il confronto tra dati acquisiti da dispositivi aventi caratteristiche differenti, ovvero risalenti a date diverse, è possibile previa conversione dei valori digitali dei pixels nei parametri di radianza (LSAT) e di riflettanza alla cima dell’atmosfera

( TOA). Il calcolo dell’energia rilevata dallo strumento costituisce un passo fondamentale

per riferire, ad un’unica scala radiometrica, i dati spettrali delle immagini acquisite da differenti satelliti. Partendo dall’energia radiante sino ad arrivare alla conversione in una scala a 8bit il percorso si suddivide in:

1: Misura della radianza e formazione del dato grezzo

2: Trasformazione del dato grezzo nei valori digitali di radianza assoluta mediante

calcoli a 32 Bit in Virgola mobile

3: Conversione della radianza assoluta ( 32 bit )in una scala a 8 bit per ottenere i valori

digitali calibrati.

Per ottenere il valore dell’energia misurata dal satellite, espressa in [W/m2.sr.µm], occorre procedere a ritroso dal numero digitale calibrato QCAL al dato grezzo a 32 bit del Level 1

(Chander, 2003). La radianza calcolata dai DN dei pixels può essere trasformata, a sua volta, tramite uno specifico coefficiente di conversione in riflettanza alla cima dell’atmosfera. I vantaggi nell’utilizzo di quest’ultima grandezza, quando vengono analizzate immagini satellitari acquisite da sensori con diverse specifiche tecniche, sono i seguenti:

(6)

• viene compensata la variabilità dovuta agli angoli di zenith solare, che cambiano a seconda delle date di registrazione delle immagini analizzate

• viene ridotta l’influenza delle condizioni di ripresa proprie di ogni sensore che comporta calibrazioni differenti per ogni scena

• si riducono le diversità tra i valori di irradianza solare esoatmosferica per ciascuna banda.

Il metodo seguito per estrapolare il valore di riflettanza a partire dai DN delle immagini Landsat a disposizione, si basa sull’utilizzo dell’equazione 4.1, i cui termini costituenti sono:

il coefficiente di conversione tra radianza e riflettanza (K ) la radianza al sensore (Lsat)

l’energia dovuta allo scattering atmosferico (Lhaze)

Equazione 4.1 per il calcolo della riflettanza all’inizio dell’atmosfera ogni termine è in funzione di .

Nell’equazione 4.1 compare anche il contributo energetico dovuto al fenomeno dello scattering (diffusione) atmosferico che deriva dall’interazione tra radiazione riflessa e/o emessa ed atmosfera.

Il coefficiente di conversione K, la cui espressione matematica viene riportata nell’equazione 4.1, a sua volta comprende i seguenti parametri:

• l’irradianza esoatmosferica del Sole (ESUN ), che rappresenta il flusso radiante solare alla cima dell’atmosfera, mediato sulle lunghezze d’onda di ciascun canale; i valori di ESUN , per ogni banda Landsat TM e ETM, sono elencati nella tabella 4.1

• la distanza Sole – Terra (d2) in unità astronomiche ottenibili, per qualsiasi giorno

dell’anno, interpolando i valori della tabella 4.2, ovvero utilizzando opportuni manuali nautici

• l’angolo di zenith solare ( s), espresso in gradi, è il reciproco dell’angolo di elevazione

(7)

Tabella 4.1: irradianza solare media alla cima dell’atmosfera per le bande Landsat TM ed ETM (http://ltpwww.gsfc.nasa.gov/IAS/handbook/handbook)

Tabella 4.2: distanza tra la Terra e il Sole espressa in unità astronomiche (http://ltpwww.gsfc.nasa.gov/IAS/handbook/handbook)



Equazione 4.2: fattore di conversione tra radianza e riflettanza

Le bande elencate nella tabella 4.2 sono quelle che permettono di calcolare la riflettanza dai dati di energia al sensore, infatti i canali mancanti dell’infrarosso termico (6 e 8), possono essere impiegati solo per stimare l’emissione di calore dalla superficie terrestre. L’energia al sensore (LSAT) dell’equazione 4.2, deriva dalla conversione dei valori DN dei

(8)

quelli DN è generalmente del tipo lineare, e prende il nome di risposta radiometrica del sensore.

Le specifiche per la calibrazione delle immagini Landsat a disposizione sono state ricostruite dal sito ufficiale della missione Landsat 7 (http://landsat7.usgs.gov). Tali parametri vengono registrati in appositi file CPF (Calibration Parameter File) contenenti: • il guadagno strumentale in ogni banda (Gain)

• la radianza massima e minima registrabili per ogni canale, sia in condizioni di basso che di alto guadagno strumentale.

La tabella 4.3 mostra i valori di radianza massima (LMAX) e minima (LMIN) per ogni

canale Landsat TM ed ETM, nelle due condizioni di basso e alto guadagno rispettivamente. La scelta tra alto o basso guadagno strumentale è vincolata alla quantità di radiazione solare che illumina la scena registrata dall’apparato, infatti, nei casi di elevata illuminazione il sensore può andare incontro alla saturazione. L’impostazione del guadagno strumentale nel caso di superfici con copertura vegetale che non siano: deserti, ghiacciai e barriere coralline, è generalmente quella elencata di seguito:

• per le bande 1, 2, 3, 5, 7 il guadagno è alto

• per la banda 4 il guadagno è alto fintanto che l’angolo di elevazione solare si mantiene al di sotto di 45°, superata questa soglia, per evitare la saturazione della vegetazione densa (cioè avente una riflettanza superiore a 0,66), il guadagno diventa quello basso.

La radianza al sensore per ogni singolo pixel è calcolabile secondo l’equazione 4.3 i cui i termini C0 (offset) e C1 (gain) sono elencati nelle tabelle 4.6 e 4.7, per ogni banda TM ed

ETM, insieme ai rispettivi valori di guadagno strumentale.

(9)



Tabella 4.3: valori di radianza massima e minima nelle condizioni di alto e basso guadagno strumentale





Tabella 4.4: coefficienti di calibrazione delle immagini Landsat impiegate in questa tesi, LMAX eLMIN

corrispondono alla radianza massima e minima nella condizione di basso guadagno strumentale





Tabella 4.5: coefficienti di calibrazione delle immagini Landsat impiegate in questa tesi, LMAX eLMIN

corrispondono alla radianza massima e minima nella condizione di alto guadagno strumentale.

Il termine LHAZE dell’equazione 4.1 rappresenta il surplus energetico, in arrivo al satellite,

dovuto allo scattering atmosferico che consiste nella diffusione della luce riflessa dalla superficie terrestre. Questo fenomeno deriva dall’interazione tra la radiazione elettromagnetica e le molecole gassose ed il particolato in sospensione nell’aria.

(10)

In base alle dimensioni delle particelle che lo determinano, lo scattering atmosferico viene distinto in:

rayleigh scattering, in cui vengono interessate le lunghezze d’onda più piccole di 1 µm,

specialmente quelle appartenenti al visibile come il blu, da cui il colore blu del cielo

mie scattering, dovuto alle particelle più o meno sferiche, la cui taglia può essere uguale o

superiore alle lunghezze d’onda interessate (polvere e vapore d’acqua) che vanno dall’ultravioletto vicino, all’infrarosso vicino.

Il rayleigh scattering è responsabile di una significativa perdita di contrasto nelle bande Landsat TM ed ETM del visibile, causando un diffuso annebbiamento dell’immagine, detto

haze. Il contributo dello scattering atmosferico è stato stimato utilizzando la tecnica della

sottrazione per il punto nero (Dark Object Subtraction o più brevemente DOS) (Chavez, 1988). Tale procedura è stata sviluppata per correggere le alterazioni che la radiazione riflessa dalla superficie terrestre subisce durante l’attraversamento dell’atmosfera (path

radiance). In particolare il DOS si basa sul principio che la radianza misurata dal sensore

(LSAT) è pari alla somma dell’energia effettivamente riflessa (LE) e di quella derivante dall’interazione con le particelle atmosferiche (LHAZE). L’equazione 4.4 esprime tale concetto in termini matematici.





Equazione 4.4 effetto dello scattering atmosferico sulla radianza misurata al sensore.

La tecnica del DOS ipotizza che il pixel più scuro, all’interno dell’immagine non corretta, abbia un valore di riflettanza pari a 1%. In assenza di scattering atmosferico l’energia rilevata al sensore per tale pixel (L1%) è quella espressa dall’equazione 4.5.



(11)

La radianza al sensore ricavata utilizzando il DN del pixel più scuro viene mostrata nell’equazione 4.6. Tale relazione si ottiene dall’equazione 4.5 sostituendo, al posto del

DN generico, il DNMIN del valore digitale più piccolo rispetto a quello assunto da tutti i pixels dell’immagine da correggere.

Equazione 4.6: radianza al sensore ricavata dal pixel più scuro

Il risultato finale, conseguito applicato il modello del DOS, viene riportato nell’equazione 4.7 che permette di stimare il surplus dovuto allo scattering atmosferico (LHAZE).

Equazione 4.7: surplus di radianza dovuto allo scattering atmosferico stimato con la tecnica del Dark Object Subtraction (DOS).

La conversione dei valori digitali in riflettanza alla cima dell’atmosfera è stata effettuata impiegando il programma Microsoft EXCEL. La procedura di calcolo seguita viene mostrata nello schema della figura 4.1. I valori digitali da processare sono stati estrapolati da regioni di interesse particolari mediante un’apposita funzione di Envi Immagine 3.6, che permette di salvare i principali dati di ciascun pixel in file di testo. I parametri di calibrazione delle tabelle 4.4 e 4.5, compresi i coefficienti di conversione per ogni banda (K), sono stati calcolati e successivamente confrontati con i corrispettivi valori presenti nei file LEA di ciascuna Landsat (ESA) a disposizione. Questa operazione ha permesso di evitare possibili errori di trascrizione dei valori numerici dai file LEA ai fogli elettronici usati per la conversione dei DN in riflettanza. La verifica della validità dei dati conseguiti applicando la procedura della figura 4.1, è stata effettuata scegliendo come riferimento i dati di riflettanza pubblicati da Chuvieco (1999), relativi al sensore Landsat TM – 5.

(12)

Figura 4.1: procedura impiegata per convertire i DN in valori di riflettanza alla cima dell’atmosfera, corretti con la tecnica del “Dark Object Subtraction” (riquadro rosso)

I risultati di suddetto studio sono mostrati nella figura 4.2 dove, per diverse tipologie di coperture superficiali, vengono riportati gli andamenti dei valori medi di riflettanza ricavati dall’analisi di diverse regioni di interesse (ROI) estratte da 20 immagini Landsat TM relative al Portogallo(Chuvieco 1999).



Figura 4.2: riflettanza di alcune categorie di superfici rilevate mediante 20 Landsat TM – 5 del Portogallo (Chuvieco, 1999)

(13)

Campionamento:

Nel paragrafo precedente si è mostrato il processo di conversione delle immagini Landsat da valori DN in valori di riflettanza. In questo paragrafo si mostrerà l’atto pratico dell’acquisizione dei valori di riflettanza delle tre bande spettrali. La scelta di queste bande è dovuta a studi precedenti che testimoniano la correlazione esistente tra questi valori e quelli di carico solido sospeso all’interno dei corpi d’acqua.

Prima di tutto si carica l’immagine contenente la stazione interessata da campionare. Successivamente si procede alla localizzazione del sito di prelievo dei dati di carico solido sospesi. Per accelerare questo processo si sono creati dei particolari file che delineano sull’immagine le aree campione chiamate AOI (paragrafo 3.3). Per ogni stazione si è creata una AOI che veniva caricata al momento della ricerca della zona interessata. Il reperimento dei dati si esegue utilizzando una funzione del programma ERDAS chiamata

Inquire Cursor. Questo strumento si compone di due parti:

Un cursore:visualizzato sull’immagine come un incrocio di rette perpendicolari Una finestra: contenente tute le caratteristiche del Pixel selezionato dal cursore.

(14)

In questo modo è possibile, spostando il cursore e leggendo i valori nella finestra, ottenere i dati di riflettanza dalle varie stazioni. Nella figura 4.3 viene mostrato il processo di visualizzazione delle tre bande attraverso lo strumento Inquire Cursor.

Tutti i dati raccolti sono stati memorizzati in formato EXCEL e confrontati con i dati di carico solido sospeso ottenuti dagli enti sopraccitati (capitolo 2).

4.2 Regressione lineare

In questo paragrafo ci occuperemo dei modelli di regressione lineare utilizzati per calcolare la correlazione esistente tra i valori di riflettanza ottenuti dalle immagini Landsat e i dati di carico solido sospeso presenti nei corpi d’acqua interessati. Prima di proseguire con il caso specifico si affronteranno le procedure matematiche-statistiche necessarie per comprendere i risultati ottenuti.

I diagrammi di dispersione forniscono una descrizione visiva, completa e dettagliata della relazione esistente tra due variabili; tuttavia, la sua interpretazione rimane soggettiva. La funzione matematica che può esprimere in modo oggettivo la relazione di causa-effetto tra due variabili è chiamata equazione di regressione o funzione di regressione della variabile Y sulla variabile X.

Il significato del termine regressione è quello di funzione che esprime matematicamente la relazione tra la variabile attesa o predetta o teorica, indicata con Y, e la variabile empirica

od attuale, indicata con X.

Formula 4.8

dove il secondo membro è un polinomio intero di X.

L'approssimazione della curva teorica ai dati sperimentali è tanto migliore quanto più elevato è il numero di termini del polinomio: con n punti, una curva di grado n-1 passa per

(15)

Quasi sempre l'interpretazione dell’equazione di regressione è tanto più attendibile e generale quanto più la curva è semplice, come quelle di primo o di secondo grado. Regressioni di ordine superiore sono quasi sempre legate alle variazioni casuali; sono effetti delle situazioni specifiche del campione raccolto e solo molto raramente esprimono relazioni reali, non accidentali, tra le due variabili.

La regressione lineare semplice

La relazione matematica più semplice tra due variabili è la regressione lineare semplice, rappresentata dalla retta.

Formula 4.9 dove

- Y i è il valore stimato per il valore X dell'osservazione i,

- Xi è il valore empirico di X per l'osservazione i,

- a è l'intercetta della retta di regressione,

b è il coefficiente angolare ed indica la quantità di cui varia Y al variare di una unità di X.

La rappresentazione grafica evidenzia che il termine costante a, chiamato intercetta, fissa

la posizione della retta rispetto all’asse delle ordinate: - a è il valore di Y, quando X è uguale a 0.

Come evidenzia il diagramma cartesiano 4.1, ogni punto sperimentale ha una componente di errore ei, che rappresenta lo scarto verticale del valore osservato dalla retta (quindi tra la Y osservata e quella proiettata perpendicolarmente sulla retta). Utilizzare un qualsiasi

punto sperimentale per stimare a porterebbe ad avere tante stime diverse quanti sono i

punti sperimentali, tutti affetti appunto da un errore diverso. Di conseguenza, come punto di riferimento per stimare a e costruire la retta, viene utilizzato il punto identificato dai

valori medi di Y e di X ( e .), che rappresenta il baricentro della distribuzione (dal

(16)

Grafico 4.1

Nel calcolo della retta di regressione, l'intercetta a è stimata a partire da b e dalle medie

delle variabili X e Y sulla base della relazione:

Formula 4.10

Di conseguenza, l'unica reale incognita è il valore del coefficiente angolare b.

Per calcolare la retta che meglio approssima la distribuzione dei punti, è utile partire dall'osservazione che ogni punto osservato Yi si discosta dalla retta di una certa quantità ei

detta errore o residuo.

Formula 4.11

Ognuno di questi valori ei può essere positivo oppure negativo:

- positivo quando il punto Yi sperimentale è sopra la retta (come nella figura precedente),

(17)

Per costruire la retta che descrive la distribuzione dei punti, i principi ai quali riferirsi possono essere differenti e da essi derivano metodi diversi.

Nel metodo dei minimi quadrati la retta scelta è quella che riduce al minimo la somma dei quadrati degli scarti di ogni punto dalla sua proiezione verticale (parallelo all’asse delle Y).

E’ un valore del tutto identico alla devianza e permette analisi accurate.

In modo più formale, indicando con - Yi il valore osservato od empirico e con

- il corrispondente valore sulla retta,

si stima come migliore interpolante, quella che minimizza la sommatoria del quadrato degli scarti dei valori osservati (Yi ) rispetto a quelli stimati sulla retta ( )

Formula 4.12 Poichè Formula 4.13 è possibile scrivere Formula 4.14 da essa Formula 4.15

Eguagliando a zero le derivate parziali, si trova il valore di b che minimizza tale

(18)

Formula 4.16

Dopo semplificazione, il valore di b risulta uguale al rapporto della covarianza di e

.con la devianza di X, che è più facile ricordare come

Formula 4.17

La covarianza di due variabili stima come (X e Y) variano congiuntamente, rispetto al loro

valore medio. E' definita come la sommatoria dei prodotti degli scarti di X rispetto alla sua

media e di Y rispetto alla sua media:

Formula 4.18

Come per la devianza, anche la codevianza ha una formula empirica abbreviata che permette un calcolo più rapido a partire dai dati campionari.

Formula 4.19

In conclusione, il coefficiente angolare b è calcolato dalle coppie dei dati sperimentali X e Y come:

Formula 4.20

(19)

Formula 4.21

Dopo aver calcolato b, si stima a:

Formula 4.22

Noti i valori dell'intercetta a e del coefficiente angolare b, è possibile procedere alla

rappresentazione grafica della retta.

Anche a questo scopo, è importante ricordare che la retta passa sempre dal baricentro del diagramma di dispersione, individuato dal punto d'incontro delle due medie campionarie

e .

Di conseguenza, è sufficiente calcolare il valore di corrispondente ad uno solo e qualsiasi valore di Xi (ovviamente diverso dalla media), per tracciare la retta che passa per

questo punto calcolato e per il punto d'incontro tra le due medie.

Se non sono stati commessi errori di calcolo, qualsiasi altro punto stimato nella rappresentazione grafica deve risultare collocato esattamente sulla retta tracciata.

Valore predittivo della regressione

La retta di regressione è spesso usata a scopi predittivi, per stimare una variabile conoscendo il valore dell’altra. Ma è necessario procedere con cautela: in questa operazione spesso viene dimenticato che, sotto l’aspetto statistico, qualsiasi previsione o stima di Y è valida solamente entro il campo di variazione sperimentale della variabile

indipendente X.

Questo campo di variazione comprende solo i valori osservati della X, usati per la stima

della regressione. Per valori minori o maggiori, non è assolutamente dimostrato che la relazione trovata tra le due variabili persista e sia dello stesso tipo.

(20)

Il coefficiente di determinazione: R2 E R2adj.

Il coefficiente di determinazione o correlazione (coefficient of determination) R2 (R

square indicato in alcuni testi e in molti programmi informatici anche con R oppure r2) è

la proporzione di variazione totale che è spiegata dalla variabile dipendente. E’ il rapporto della devianza dovuta alla regressione sulla devianza totale:

Formula 4.23

Espresso a volte in percentuale, più spesso con un indice che varia da 0 a 1, R2 serve per misurare quanto della variabile dipendente Y sia predetto dalla variabile indipendente X e

quindi per valutare l’utilità dell’equazione di regressione ai fini della previsione sui valori della Y.

Il valore del coefficiente di determinazione è tanto più elevato quanto più la retta passa vicino ai punti, fino a raggiungere 1 quando tutti i punti sperimentali sono collocati

esattamente sulla retta. In tale caso, infatti, ogni Yi può essere predetto con precisione

totale dal corrispondente valore di Xi. Nella ricerca ambientale, è prassi diffusa che la

determinazione possa essere ritenuta buona, (in linguaggio tecnico, il modello ha un buon

fitting con in valori sperimentali), quando R2 supera 0,6 (o 60%).

R2 è una misura che ha scopi descrittivi del campione raccolto; non è legata ad inferenze

statistiche, ma a scopi pratici, specifici dell'uso della regressione come metodo per prevedere Y conoscendo X.

Benché i testi di statistica evidenzino la funzione descrittiva di R2, sia a scopi predittivi, sia per la significatività, in alcune condizioni ad esso viene attribuito anche un significato inferenziale.

Il valore di R2 è riferito ai dati del campione, ma in varie situazioni viene utilizzato per indicare l’errore che si commette nello stimare Y sulla base di generici valori di X; quindi

non è utilizzato solo per descrivere il caso sperimentale, ma è esteso come capacità predittiva alla relazione tra le due variabili.

(21)

Quando si costruisce un modello di distribuzione dei dati (in questo caso i valori di Y

conoscendo il valore di X), è importante valutare se i dati del campione sono in accordo

con la teoria. In altri termini si deve verificare la bontà dell’adattamento (goodness of fit).

Per il modello lineare, è stato proposto un R2 corretto, chiamato R2 aggiustato (R2adjusted

o R2adj) ottenuto dalla formula generale:

Formula 4.24 dove

- N è il numero di coppie di dati od individui misurati

- p è il numero di variabili (nel caso della regressione lineare semplice p = 1).

Nel caso della regressione lineare semplice, la formula semplificata diventa:

Formula 4.25

Modello lineare:

In questo capitolo verranno mostrati i risultati della regressione lineare semplice applicata ai dati, precedentemente raccolti,di riflettanza e di carico solido sospeso.

Tutte le elaborazioni matematiche e statistiche sono state eseguite con il programma EXCEL. Per valutare quale delle tre bande possedeva una migliore correlazione con i dati di carico solido sospeso si sono costruiti tre diversi grafici di regressione lineare.

Per ognuna di queste regressioni si sono calcolati i coefficienti :

a :

intercetta o coefficiente di traslazione

b :

coefficiente angolare della funzione

R2 : utilizzato come stimatore a scopi predittivi e per la significatività. R2

adj : che da un ‘informazione dal punto di vista inferenziale.

Ogni grafico viene presentato assieme alla funzione retta di regressione calcolata partendo dai dati sopra citati.

(22)

Qui di seguito verranno mostrati i risultati delle regressioni lineari semplici corredati dai valori di R2 e R2

adj .

Correlazione Lineare Banda 1

y = 0,0005x + 0,0381 R2 = 0,7163 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10 0,11 0,12 0 10 20 30 40 50 60 70 80 90 100

Carico solido Sospeso mg/l

R ifl et ta nz a B an da 1 1

Grafico 4.2: Retta di regressione Banda 1 / Carico solido sospeso

R2=0,7163 / R2

adj=0,6879

a

= 0,0381/

b

= 0,0005

Correlazione Lineare Banda 2

y = 0,0008x + 0,0445 R2 = 0,6748 0,00 0,02 0,04 0,06 0,08 0,10 0,12 0,14 0 10 20 30 40 50 60 70 80 90 100

Carico solido sospeso mg/l

R ifl et ta nz a B an da 2 1

Grafico 4.3: Retta di regressione Banda 2 / Carico solido sospeso

R2=0,6748 / R2

(23)

Correlazione Lineare Banda3 y = 0,0082x + 0,5628 R2 = 0,6874 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 0 10 20 30 40 50 60 70 80 90 100

Carico solido sospeso mg/l

R ifl et ta nz a B an da 3 1 G rafico 4.4: Retta di regressione Banda 3 / Carico solido sospeso

R2=0,6874 / R2adj=0.6561

a

= 0,5628 /

b

= 0,0082

Dai dati ottenuti si ricava una formula per il calcolo del carico solido sospeso partendo da valori di riflettanza della prima banda (migliore R):

Solidi sospesi (mg/l) = 2000 x (Riflett B1) – 76,2

Con questa formula verranno calcolati i valori di carico solido sospeso nella località di Bocca d’Arno.

Figura

Figura 4c Immagine Landsat 01_02_15  FCC  RGB 333
Figura 4d Immagine Landsat 01_02_15  FCC  RGB 444
Tabella 4.1: irradianza solare media alla cima dell’atmosfera per le bande Landsat TM ed ETM  (http://ltpwww.gsfc.nasa.gov/IAS/handbook/handbook)
Tabella 4.3: valori di radianza massima e minima nelle condizioni di alto e basso guadagno strumentale
+3

Riferimenti

Documenti correlati

Previous studies indicate that pretreatment of human hepatoma cells with coffee (117) and biscuit (118) melanoidins exerts remarkable protection against oxidative

attorno al modello possono essere individuate due fasce di ampiezza

Il metodo della Regressione Lineare (o metodo di stima ai Minimi Quadrati) si occupa di individuare, all’interno di un certo ambito di funzioni, una relazione fra le

Supponiamo ora di avere una differente incertezza per ciascuna misura sulle y e che non esista incertezza sulla misura dell’osservabile x. La nuova relazione non è altro che

L’algoritmo di regressione lineare da’ sempre come risultato una retta, indipendemente dal fatto che i punti si collochino o meno sulla una retta stessa.. E’ necessario

per esaminare l’eventuale relazione di dipendenza che esiste tra due variabili casuali e’ utile rappresentare in un grafico ciascuna delle coppie (x i y i )... Dimostrazione

Quindi, salvo che si esegua una standardizzazione di entrambe le variabili, ρ (Y, X) non `e legato tanto all’inclinazione della retta di regressione quanto piuttosto alla precisione

Gli eventi che non possono mai verificarsi si dicono eventi impossibili (come l evento 2). Questi ultimi si dicono eventi aleatori. Osservazione: Aleatorio deriva dal latino alea,