Capitolo 3
Stima spettrale delle immagini
3.1 Stima spettrale bidimensionale
3.1.1 Metodi di stima
Il problema della stima spettrale può essere affrontato in due modi [6]: secondo il metodo classico, che consiste nello stimare lo spettro dai dati osservati, senza ricorrere a modelli; oppure seguendo le tecniche che utilizzano un approccio di tipo parametrico, che consiste nell’ipotizzare un modello, stimarne i parametri dai dati e verificare la validità del modello adottato. Queste tecniche trovano largo impiego nel caso in cui i dati disponibili siano pochi, in quanto permettono di ottenere, anche in queste condizioni, stime soddisfacenti (purché il modello assunto sia corretto). I metodi classici di stima dello spettro si basano sulla trasformata di Fourier della sequenza dei campioni o sulla relativa funzione di autocorrelazione [7]; queste tecniche di stima assicurano buone prestazioni nel caso in cui i campioni disponibili siano numerosi e richiedono la sola ipotesi di stazionarietà della sequenza degli osservati.
Fatte queste considerazioni si può facilmente intuire come i metodi classici siano da preferire per lo studio delle immagini, dove si hanno a disposizione
molti dati (numero di pixel) e dove, in generale, non si possono fare a priori stringenti ipotesi relative al modello di generazione dei campioni.
3.1.2 Il periodogramma
Questo metodo di stima si basa essenzialmente sulla trasformata di Fourier della sequenza dei dati che, nel caso in cui si analizzino delle immagini [8], può essere assimilata ad una matricex m n con m = 0, 1, …,(M-1) e n = 0, [ , ] 1, …,(N-1). Si fa riferimento, di conseguenza, alla versione bidimensionale del periodogramma: 1 2 2 1 1 2 ( ) 1 2 0 0 1 ˆ ( , )PER [ , ] M N j f m f n m n P f f x m n e MN π − − − + = = =
∑ ∑
(3.1) Osservando che: 1 2 1 1 2 ( ) 1 2 0 0 ( , ) [ , ] M N j f m f n m n X f f x m n e π − − − + = = =∑ ∑
(3.2) è la trasformata bidimensionale della sequenza dei dati, si può riscrivere la 3.1 come: 2 1 2 1 2 1 ˆ ( , )PER ( , ) P f f X f f MN = (3.3) Si potrebbe auspicare che nel caso di molti dati, al limite N → ∞ e M → ∞, la stima tramite periodogramma tendesse al valore reale della densità spettrale di potenza Pxx :1 2 1 2
ˆ ( , )PER xx( , )
P f f →P f f (3.4) Purtroppo si verifica che questo non è vero, infatti, sebbene la media tenda asintoticamente al valore di Pxx, la varianza non tende a zero all’aumentare
dei dati.
Pur avendo messo in luce la non consistenza di questo stimatore, la tecnica di stima tramite il periodogramma resta di grande interesse pratico, infatti, dalla relazione (3.3) si può facilmente intuire la semplicità computazionale
3.1.3 Metodo di Bartlett: media dei periodogrammi
Una semplice strategia adottata per ridurre la varianza della stima consiste nel mediare su un certo numero di stime indipendenti. Poiché la varianza non migliora all’aumentare della lunghezza dei dati, si può pensare di suddividere la sequenza di partenza in porzioni non sovrapposte, calcolare il periodogramma di ogni porzione ed infine eseguire la media di tutti i periodogrammi.
Lavorando sulle immagini, si suppone di avere a disposizione K 2
sottofinestre indipendenti (vale a dire non sovrapposte), ciascuna di dimensione RxS (Fig. 3.1): 0, 1,..., ( -1) [ , ] [ , ] con 0, 1,..., ( -1) x y l l x y m R x m n x m l K n l K n S = = + + = (3.5) al variare di: 0, 1,..., ( -1) 0, 1,..., ( -1) x y l K l K = = (3.6) 1 2 3 K 2 3 K M campioni N campioni R S lx y l
La stima secondo il procedimento di Bartlett risulta: 1 1 ( ) 1 2 2 1 2 0 0 1 ˆ ( , ) ˆ x y( , ) x y K K l l BART PER l l P f f P f f K − − = = =
∑ ∑
(3.7) dove ˆ(l lx y)( ,1 2) PERP f f rappresenta il periodogramma calcolato sulla sottofinestra identificata dalla coppia ( , )l l , definito come: x y
1 2 2 1 1 ( ) 2 ( ) 1 2 0 0 1 ˆ x y( , ) [ , ] x y R S l l j f m f n PER l l m n P f f x m n e RS π − − − + = = =
∑ ∑
(3.8)Diminuire le dimensioni delle finestre contenenti i dati sotto analisi comporta un calo della risoluzione dello spettro stimato; per capire meglio questo fenomeno si prenda in considerazione il valor medio dello stimatore modificato secondo Bartlett:
{
}
1 1{
} {
}
( ) ( ) 1 2 2 1 2 1 2 0 0 1 ˆ ( , ) ˆ x y( , ) ˆ x y( , ) x y K K l l l lBART PER PER
l l P f f P f f P f f K − − = = Ε =
∑ ∑
Ε = Ε (3.9)Tramite alcuni passaggi aritmetici si può giungere all’espressione:
{
PˆBART( ,f f1 2)}
WB( ,f f1 2) Sx( ,f f1 2)Ε = ⊗ ⊗ (3.10) Dalla precedente relazione si osserva che il valor medio dello stimatore può essere visto come la doppia convoluzione periodica tra la funzione
1 2
( , )
B
W f f e la densità spettrale di potenza Sx( ,f f1 2) relativa alla matrice dei dati. Attraverso una diretta estensione della teoria monodimensionale della stima spettrale è possibile interpretare la funzione WB( ,f f1 2) come trasformata 2D di Fourier della finestra:
1 1 per ( , ) 0 altrove k R k l w k l R S l S ≤ − − = ≤ (3.11)
dal momento che la finestra è separabile, la trasformata di Fourier sarà il prodotto delle trasformate 1-D:
2 2
1 1 sin( π f R) sin(π f R)
Dopo aver rappresentato un profilo della trasformata della finestra di Bartlett in Fig. 3.2 e la trasformata della finestra 2-D in Fig. 3.3, si intuisce che la finestratura ha come controindicazione l’allargamento (smearing) dello spettro stimato, che è di scarsa rilevanza solo se WB( ,f f1 2) è molto stretta nei confronti di X f f( ,1 2), cioè se la finestra è sufficientemente lunga. Dalla figura relativa al profilo si vede che la banda a -3dB del lobo principale di
1 2
( , )
B
W f f è all’incirca pari a 1
RS ; non possiamo risolvere dettagli inferiori a
questo valore. -0.50 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 1 2 3 4 5 6 7 8 f1 WB (f1 )
Fig 3.2 – Profilo relativo alla trasformata della finestra 2-D di Bartlett (R=4, S=2)
A tale svantaggio fa riscontro una riduzione della varianza di un fattore K , 2
di conseguenza:
{
}
{
( )}
1 2 2 1 2
1
ˆ ˆ
var PBART( ,f f ) var PPERl ( ,f f )
K
= (3.13) Tale risultato è corretto solo se i periodogrammi sono incorrelati. In generale, nell’approccio comune, le sottofinestre di dati sono ottenute a partire da
1 Banda a -3 dB
RS
blocchi contigui di una stessa realizzazione, come mostrato in Fig. 3.1, cosa che rende le finestre difficilmente incorrelate tra loro. Si avrà di conseguenza una riduzione della varianza di un fattore inferiore a K . 2
Fig 3.3 – Trasformata di Fourier della finestra di Bartlett 2-D (R=4, S=2)
In conclusione, analizzando la matrice dati originaria di dimensione MxN in sottofinestre di dimensioni RxS, si ha una conseguente perdita di risoluzione pari a MN
RS . Nel caso sopra esposto, in cui le dimensioni della sottofinestra
sono K volte inferiori a quelle della matrice di partenza si avrà una risoluzioneK volte più piccola. 2
Si tratterà in ogni caso di scegliere un valore di K che sia un buon compromesso tra la perdita di risoluzione e la diminuzione della varianza.
3.1.4 Metodo di Welch: media dei periodogrammi modificati
Questo metodo di stima (Welch 1967) deriva direttamente da quello proposto da Bartlett al quale sono apportate sostanzialmente due modifiche.
La prima consiste nel permettere una parziale sovrapposizione dei sottoblocchi di analisi in modo da avere più periodogrammi da mediare. Considerando di analizzare la stessa matrice dati di prima, i sottoblocchi (Fig. 3.4) saranno così rideterminati:
0, 1,..., ( -1) [ , ] [ , ] con 0, 1,..., ( -1) x y i i x y m R x m n x m i D n i D n S = = + + = (3.14) al variare di: 0, 1,..., ( -1) 0, 1,..., ( -1) x y i K i K = = (3.15) 1 2 ... ... ... ... ... K 2 ... ... ... ... ... K R S D D
Fig 3.4 – Finestratura con eventuale sovrapposizione
Si nota che per D=R (nel caso di finestre quadrate, vale a dire per R=S) la sovrapposizione tra le finestre è nulla e queste risulteranno in numero pari alle sottofinestre del metodo di Bartlett.
La seconda modifica viene apportata da Welch al fine di ridurre il leakage
effect; questo fenomeno si può ben capire analizzando gli effetti della
finestratura nel dominio della frequenza. L’operazione di troncamento dei dati comporta una distorsione nel dominio frequenziale a causa dei lobi secondari presenti nella trasformata della funzione usata per la finestratura; vi è di conseguenza una dispersione dell’energia al di fuori della banda del segnale.
L’idea di Welch per raggiungere una riduzione dei lobi laterali è quella di moltiplicare i singoli sottoblocchi dei dati per una finestra w[m,n] che ha il compito di smussare (smoothing) le brusche transizioni sui bordi.
Ogni singolo periodogramma modificato sarà così espresso:
1 2 2 1 1 ( ) 2 ( ) 1 2 0 0 1 ˆ x y ( , ) [ , ] [ , ] x y R S i i j f m f n WELCH i i m n P f f w m n x m n e RS π − − − + = = =
∑ ∑
(3.16) dove w m n è la finestra normalizzata, cioè tale che: [ , ]1 1 2 0 0 [ , ] 1 R S m n w m n − − = = =
∑ ∑
(3.17) La stima della densità spettrale di potenza secondo il metodo di Welch si ottiene come media dei periodogrammi modificati:1 1 ( ) 1 2 2 1 2 0 0 1 ˆ ( , ) ˆ x y ( , ) x y K K i i WELCH WELCH i i P f f P f f K − − = = =
∑ ∑
(3.18) La varianza di questi stimatori, come si è visto anche sopra (3.13), decresce al crescere del numero dei periodogrammi mediati; se i successivi periodogrammi fossero incorrelati la varianza risulterebbe inversamente proporzionale a K , di fatto tale riduzione sarà inferiore a causa della 23.2 Stima spettrale applicata alle immagini SAR
del mare
Riprendendo i concetti esposti nel paragrafo 2.6, si può assumere che il modulo quadro dello spettro di potenza F I x y
{
( , )}
2relativo alla distribuzione dell’intensità luminosa nell’immagine SAR sia direttamente proporzionale allo spettro direzionale della superficie marina, a meno del rumore introdotto dalle elaborazioni effettuate dal sistema di acquisizione:{
}
2(
)
2( , ) I , ( , )
F I x y = F K θ ∝ Ψ K θ (3.19)
Spostando l’attenzione sulla geometria della superficie, questa può essere descritta analiticamente da un processo stocastico. Indicando con z l’altezza della superficie rispetto ad un livello medio di riferimento e fissate le coordinate spazio temporali ( , , )x y t , si ottiene la variabile aleatoria ( , , )z x y t . Tale ipotesi è ragionevole se si assume una situazione di regime (mare completamente sviluppato) in cui non vi è scambio di energia tra le onde del mare ed il vento superficiale. Se il tempo di osservazione Tobs è piccolo (dell’ordine del secondo o della frazione del secondo) è ragionevole assumere che la superficie tempo-variante del mare sia un processo stocastico stazionario almeno in senso lato (WSS-wide sense stationary). Dal momento che le fluttuazioni di intensità dell’immagine SAR sono proporzionali alle fluttuazioni dell’altezza delle onde della superficie, si può affermare che tutte le precedenti tecniche di stima spettrale sono applicabili alla matrice di campioni rappresentata dall’immagine SAR, la quale, per le osservazioni fatte, rispetta la condizione di stazionarietà indispensabile per l’applicabilità dei metodi.
3.2.1 Applicazione del metodo di Welch
Al fine di conseguire una stima dello spettro di potenza delle immagini SAR relative alla superficie marina, si farà uso della tecnica proposta da Welch. La dimensione del sottoblocco di dati viene fissata a 256X256 campioni per tutte le analisi, questo ci permette di ridurre la varianza della stima mediante un’operazione di media delle stime ottenute sui vari sottoblocchi, e di conseguire così una densità spettrale rappresentata su un numero di campioni sufficiente per le successive elaborazioni.
L’operazione di suddivisione in sottoblocchi a partire dalla matrice di partenza, può essere vista come il prodotto con una funzione a gradino bidimensionale di valore unitario solo nel campo di definizione (dimensioni del sottoblocco) e nulla altrove; questa procedura, come esposto in precedenza, comporta una distorsione in frequenza causata dai lobi laterali pronunciati presenti nella trasformata di Fourier bidimensionale della funzione che esegue il troncamento dei dati. Al fine di ridurre tali distorsioni, la suddivisione dell’immagine di partenza in sottoinsiemi verrà realizzata tramite una finestratura con funzioni aventi fronti di salita meno ripidi.
3.2.2 Scelta delle finestre
Si prendono in considerazione due tra le possibili finestre monodimensionali presenti nella letteratura, precisamente la finestra di Hanning e quella di Tukey. (Fig. 3.5, Fig. 3.6). Si può osservare che queste differiscono nel modo in cui si raccordano ai bordi; nel caso di Hanning la finestra parte da zero e cresce con un fronte di salita molto lento, mentre nel caso di Tukey la pendenza è più marcata e si ha una zona molto ampia in cui la finestra ha valore unitario.
0 20 40 60 80 100 120 140 0 0.2 0.4 0.6 0.8 1 n Hann(n)
Fig 3.5 – Finestra di Hanning (monodimensionale)
0 20 40 60 80 100 120 140 0 0.2 0.4 0.6 0.8 1 n Tukey(n)
Fig 3.6 – Finestra di Tukey (monodimensionale)
Dal momento che i nostri set di dati sono immagini, siamo interessati ad una versione in due dimensioni delle precedenti finestre. In generale le immagini sotto analisi sono prive di simmetrie particolari, di conseguenza le funzioni che andranno a segmentare la matrice dati saranno costruite in modo da ridurre le transizioni laterali in ugual misura sulle due dimensioni dell’immagine, mantenendone così la proporzionalità.
La costruzione della finestra avviene facendo scorrere nelle due direzioni (righe e colonne della matrice) il profilo relativo alla finestra monodimensionale considerata, come mostrato schematicamente nella Figura 3.7.
Fig. 3.7 – Principio seguito nella costruzione della finestra bidimensionale (caso di Tukey)
Mettendo in pratica questa tecnica ed utilizzando come profili le finestre di Hanning e di Tukey, si ottengono le funzioni da utilizzare nella suddivisione dell’immagine di partenza (Fig. 3.8, Fig. 3.9).
Fig. 3.8 – (a) Finestra di Hanning bidimensionale,
(a)
(b)
Fig. 3.9 – (a) Finestra di Tukey bidimensionale, (b) Finestra di Tukey bidimensionale vista dall’alto
3.2.3 Spettro Direzionale
Si procede all’applicazione del metodo di Welch utilizzando finestre non sovrapposte di dimensione 256X256 campioni. La stima della densità spettrale di potenza relativa ad ogni finestra (identificata dall’indice di posizione
{ }
i ix y ) di dimensioni RxS, sarà:2 1 1 ( ) 2 ( ) 0 0 1 ˆ x y ( , ) [ , ] [ , ] x y x y R S i i j f m f n x y i i m n P f f w m n x m n e RS π − − − + = = =
∑ ∑
(3.20)dove w m n è la finestra bidimensionale utilizzata. Relativamente a questo [ , ] sottoblocco si può anche osservare che:
2 ( ) 1 I ˆ x y ( , ) ( , ) x y i i x y i i x y P f f X f f RS = (3.21) (a)
dove con I ( ,1 2)
x y
i i
X f f si indica la trasformata di Fourier del blocco di dati in esame, “finestrato” tramite la funzione scelta.
La stima della densità spettrale di potenza complessiva, significativa di tutta l’immagine, è ottenuta tramite una media aritmetica delle d.s.p. delle singole finestre dati: 1 1 ( ) 2 0 0 1 ˆ( , ) ˆ x y ( , ) x y K K i i x y x y i i P f f P f f K − − = = =
∑ ∑
(3.22) Ricordando che lo spettro di potenza relativo all’immagine SAR è direttamente proporzionale allo spettro direzionale della superficie marina a meno del rumore (per le osservazioni fatte in 2.6), si conclude che il risultato ottenuto in (3.22) coincide, a meno di una costate moltiplicativa, con la stima della densità spettrale direzionale della superficie marina.La scelta di utilizzare la finestra di Hanning o quella di Tukey proposte nel precedente paragrafo, viene effettuata su basi prestazionali.
Al fine di chiarire al meglio le scelte adoperate, si riportano nel seguito gli spettri direzionali (Fig. 3.11, Fig. 3.12), ottenuti con l’ausilio delle due diverse finestre (Hanning e Tukey) applicate ad una porzione di 2048X2048 punti (riportata in Fig. 3.10) di un’immagine SAR della superficie marina acquisita dal sensore ERS1. L’immagine, come si può osservare, presenta una forte uniformità.
Fig. 3.11 – Stima dello spettro direzionale della superficie marina ottenuto con finestra di Hanning
Fig. 3.12 – Stima dello spettro direzionale della superficie marina ottenuto con finestra di Tukey
Nei due spettri riportati sopra si riconoscono in maniera evidente le diverse capacità di dettaglio. In particolare la “finestratura” di Hanning porta ad un grande decadimento della risoluzione dovuto essenzialmente ai fronti di salita della finestra che crescono troppo lentamente. Nelle successive analisi si farà uso della finestra di Tukey, la quale, come mostrato, dà notevoli benefici in termini di risoluzione dello spettro stimato.
3.2.4 Spettro Omnidirezionale
Osservando gli spettri direzionali della superficie marina, risulta evidente la spiccata simmetria circolare di questi. Questa impressione trova conferma anche a livello teorico, dove in molti casi risulta conveniente esprimere e rappresentare lo spettro marino in forma polare.
Al fine di passare da una rappresentazione in forma cartesiana ad una rappresentazione polare ci siamo serviti delle capacità di interpolazione offerte nell’ambiente di lavoro MatLab.
Si costruisce, a questo scopo, una mappa polare, come mostrato in Fig. 3.13:
Fig 3.13 – Mappa polare
In particolare l’asse delle frequenze radiali (f) di questa griglia (direzione radiale) sarà un vettore costituito da un numero di punti pari alla metà della dimensione su cui è rappresentato lo spettro direzionale, con valori che a partire da zero crescono con un passo ∆f pari a:
2 2 2 2 y x f f f ∆ ∆ ∆ = + (3.23) con fx 1 , fy 1 x y ∆ = ∆ =
∆ ∆ , dove ∆x e ∆y rappresentano le risoluzioni
muovendosi su tale perimetro, cambia il valore della variabile θ . Il vettore degli angoli sarà formato da valori crescenti a partire da 0o fino a 360o ed avrà una dimensione pari al numero di punti su cui si rappresenta lo spettro direzionale.
La mappa polare ottenuta sarà rappresentata in un sistema di coordinate cartesiane in cui sull’asse orizzontale si avranno i riferimenti angolari e sull’asse verticale i riferimenti frequenziali.
Si deve adesso eseguire la vera e propria interpolazione, che a partire dai punti che rappresentano lo spettro direzionale ci permetta di passare al nuovo sistema di riferimento. Per fare questo si utilizza la funzione bidimensionale
Interp2 presente in Matlab, la quale si appoggia su un algoritmo di
interpolazione bicubica (Fig. 3.14).
Fig 3.14 – Operazione di interpolazione
Il risultato dell’interpolazione cartesiano-polare sarà una serie di punti disposta su di una griglia analoga a quella di Fig. 3.13; si procede al salvataggio di questi dati in una matrice avente sulle righe i contributi relativi a numeri d’onda K crescenti, mentre sulle colonne si avranno i contributi relativi ad angoli crescenti. Si ricorda che il vettore dei numeri d’onda può essere calcolato direttamente dal vettore delle frequenze radiali, infatti:
2
i i
K = π f (3.24)
Per chiarire meglio questo tipo di rappresentazione si pensi che i punti appartenenti ad una circonferenza, e quindi ad un valore di f costante, andranno a formare la riga della matrice d’uscita associata al valore del numero d’onda relativo a quella particolare frequenza; il primo elemento di
questa riga sarà il contributo relativo a θ =0o, mentre l’elemento finale sarà quello relativo a valore di θ massimo ( 360 ); o .
Applicando questa procedura allo spettro direzionale di Fig. 3.12 si ottiene lo spettro direzionale in forma polare, rappresentato in coordinate cartesiane, di Fig. 3.15.
Fig 3.15 – Spettro direzionale in forma polare W K( , )θ
Confrontando le Figure 3.12 e 3.15, si può osservare come le zone relative ai massimi dello spettro direzionale, siano correttamente posizionate nella forma polare, mentre un’altra conferma viene dalle prime righe della Fig. 3.15 (piccoli valori della frequenza radiale f ) che evidenziano alti valori dello spettro proprio come accedeva nell’intorno dell’origine nella forma cartesiana.
Dalla conoscenza dello spettro direzionale W K( , )θ , espresso nello spazio dei numeri d’onda, è possibile calcolare lo spettro omnidirezionale S K ( ) relativo alla superficie del mare, infatti questo è definito come:
2 1 ( ) ( , ) S K πW K θ K dθ π =
∫
(3.25) K θ (gradi)Si faccia riferimento al nostro tipo di rappresentazione dello spettro direzionale in forma polare di Fig. 3.15, dove su ogni riga della matrice sono riportati i contributi dello spettro al variare di θ per un valore del numero d’onda K fissato. Da questa osservazione si capisce che il valore dello spettro omnidirezionale per un particolare valore di K, si traduce nella somma, opportunamente pesata, degli elementi appartenenti alla relativa riga dello spettro direzionale: 2 0 ( ) ( , ) 2 K S K W K π θ θ π = =
∑
(3.26) Nell’implementazione del calcolo dallo spettro omnidirezionale usata in questo lavoro, la somma non viene calcolata su tutto lo spettro, ma soltanto all’interno di una fascia orizzontale, centrata sul picco dello spettro direzionale (direzione della componente d’onda dominante), che si estende fino a 3dB sotto il valore del massimo; questa operazione ci consente di prelevare solo la zona dello spettro contenente informazione, eliminando così gran parte del rumore dovuto alle fluttuazioni di fondo (rumore introdotto dal sistema di acquisizione).Per chiarire al meglio quanto esposto, si mostra nel seguito lo spettro direzionale nel quale sono messe in evidenza le aree selezionate per l’analisi (Fig. 3.16), la corrispondente forma polare (Fig. 3.17) ed infine il conseguente spettro omnidirezionale (Fig. 3.18).
Fig 3.17 – Regione di analisi corrispondente sullo spettro direzionale in forma polare
Fig 3.18 – Spettro omnidirezionale S(K) K