Edge detection: il Filtro di Canny - Analisi e tuning del sistema di elaborazione di una macchi

Il problema che si deve risolvere con il modulo di edge detection è quello di suddividere l’immagine in più regioni in base al valore dell’intensità luminosa, in modo da isolare, il più precisamente possibile, i vari oggetti presenti nella ROI. Nel caso del tubo di vetro, il problema si riduce al ricercare i contorni

di eventuali corpi estranei immersi nel vetro stesso: le righe, le impurità, e in generale qualsiasi disomogeneità. I sistemi di edge detection basati su calcolo del gradiente partono dai seguenti presupposti teorici. Per contorno di un oggetto si intende: l’insieme delle curve visibili dell’oggetto e le regioni in cui la superficie vista dalla telecamera presenta una discontinuità a gradino, oppure discontinuità nell’orientamento della normale alla superficie. In condizioni di luce diffusa e oggetti di colore uniforme, l’orientamento delle superfici di tali oggetti ha la massima influenza sulla riflessione della luce stessa; quindi possiamo pensare che le discontinuità della superficie di un oggetto corrispondano a discontinuità dell’intensità luminosa. L’inten- sità luminosa I(x, y) rappresenta la potenza ottica per unità di superficie e si misura in W/m2_{. Possiamo quindi assumere vere le seguenti afferma-}

zioni: ad una variazione dell’intensità luminosa corrisponde una variazione dell’orientamento della superficie (e viceversa), e ad una discontinuità del- l’intensità luminosa corrisponde una discontinuità della superficie (e viceversa). Tali condizioni sono vere nell’ipotesi di luce diffusa e colori uniformi. Il procedimento avviene in due fasi:

Rilevazione dei contorni parte dall’immagine originale a livelli di grigio e produce un insieme di punti candidati ad appartenere ad un contorno Connessione consiste nel prendere un insieme di punti candidati, trovati

nella fase precedente, e interpolarli con una curva in modo da ottenere linee chiuse delimitanti aree distinte.

Da un punto di vista matematico il problema della rilevazione dei contorni è un problema mal posto: le soluzioni non sono robuste né certe. Un problema di questo metodo di ricerca dei contorni è che il rumore crea discontinuità nell’intensità luminosa delle immagini che possono creare errori nella scelta

dei punti candidati ad appartenere ad un contorno. Si veda, a titolo di esempio, la figura 2.7 che mostra un esempio monodimensionale.

Figura 2.7: Immagine di un cubo in 3 dimensioni (a) di cui si trova il punto h (nel caso monodimensionale) teorico (b) e nel caso reale dove l’intensit`a `e affetta da rumore (c). Esempio di filtro passa-alto per eliminare il rumore del caso reale (d)

A cusa del rumore la discontinuità di I(x) non è un gradino, ma un’altra curva che varia bruscamente. Il rumore potrebbe generare picchi di intensità laddove non siano realmente presenti dei contorni, e tale situazione portereb- be però a considerare il punto trovato come un punto candidato. Un modo di attenuare l’influenza del rumore è quella di filtrare l’immagine in modo tale da eliminare il più possibile il rumore, di solito filtrando le alte frequenze spaziali. In tal modo però, si ha l’attenuazione del rumore da una parte, e dall’altra la riduzione del contrasto fra zone chiare e zone scure, ovvero tutte le discontinuità, anche in presenza di contorni vengono appiattite. Il filtro che

viene utilizzato è un filtro con risposta all’impulso pari alla derivata di una gaussiana: il picco di intensità si avrà nel punto di massimo della gaussiana, e il compito dell’algoritmo sarà quello di cercare tali massimi. Ricordando che per la convoluzione vale:

dg(x)

dx ⊗ I(x) =

d(g(x) ⊗ I(x))

dx (2.4) Anzich`e utilizzare un filtro che ha come risposta all’impulso la derivata di una gaussiana si applica un filtro gaussiano all’immagine e poi si deriva il risultato. Quindi avremo un filtro cos`ı fatto:

h(x) = Z +∞ −∞ I(τ )g(x − τ) dτ = I(x) ⊗ g(x) (2.5) e nel discreto h[k] = +∞ X n=−∞ I(n) ∗ g(k − n) (2.6) Ossia i valori della gaussiana g(k) vengono ribaltati e ritardati e vano a pesare il valore dell’intensit`a. In frequenza il filtro effettua la seguente operazione:

H(f ) = F [I(x) ⊗ g(x)] = I(f) ∗ σ√π ∗ e−π2σ2f2 _(2.7)

Si noti che la trasformata di una gaussiana, è ancora una gaussiana, ma con ampiezza σ pari al reciproco dell’ampiezza della gaussiana di partenza. Variando σ si può variare la scala del filtro passa-basso: più è basso il SNR minore sarà la scala di filtraggio necessaria, in altre parole, più larga è la campana e maggiore sarà l’effetto di smoothing che si ottiene.

Generalizzando al caso reale di immagine bidimensionale, per individuare una discontinuit`a nella funzione di intensit`a luminosa I(x,y) che descrive l’immagine digitale, di sostituisce la derivata con il gradiente: il gradiente

`e un vettore che ha direzione complanare all’immagine e verso secondo la massima variazione di I(x,y):

∇I(a, y) = ∂I(x, y) ∂x ·~i +

∂I(x, y)

∂y · ~j (2.8) Il modulo del gradiente è nullo nelle zone di intensità luminosa costante e non nullo nelle zone di discontinuità. I punti in cui ricercare i contorni sono quelli dove il modulo del gradiente è massimo.

Il filtro di Canny

Uno dei filtri derivativi più noti e utilizzati per la ricerca dei contorni nelle immagini in scala di grigi, implementato sul sistema di visione, è il filtro di Canny. I motivi per cui si è scelto di utilizzare l’algoritmo di Canny sono riassumibili nei seguenti punti:

1. Buona capacità di individuazione: l’operatore ha una bassa probabilità di non individuare un bordo reale (elevata sensibilità) ed una bassa probabilità di individuare falsi bordi(elevata specificità)

2. Buona capacità di localizzazione: i punti evidenziati dall’operatore dovrebbero essere quanto più vicini possibile al centro del bordo reale 3. Unicità della risposta: l’operatore dovrebbe fornire una sola risposta in

corrispondenza di un bordo reale

Il filtro di Canny è ottimo e si basa su tre assunzioni: l’operatore di edge enhancement deve essere lineare, un edge è un gradino con ampiezza finita, il rumore è additivo, bianco, con distribuzione gaussiana. Il metodo di Canny è articolato in quattro passaggi:

1. filtro gaussiano 2. norma del gradiente

3. sogliatura con isteresi (thresholding) 4. thinning

La prima fase consiste nel applicare all’immagine un filtro gaussiano, che sfoca le immagini cos`ı da rimuovere alcuni dettagli ed eliminare una parte del rumore. Si applicano per convoluzione i due filtri Gx e Gy, che rappresentano le due derivate parziali viste sopra, all’immagine, cos`ı da ottenere le due componenti del gradiente. In pratica rappresentano le due derivate parziali della gaussiana in 2 dimensioni, la cui forma analitica `e la seguente

G(x, y) = _√ 1 2πσ2e

−x2+y2_2σ2 _(2.9)

Figura 2.8: Distribuzione gaussiana di 2 variabili, G(x,y) con media (0,0) e varianza σ = 1 (a), kernel 5x5 (b) e kernel monodimensionale per la direzione x (c)

Poiché l’immagine è rappresentata da valori digitali, la convoluzione viene fatta con un kernel, che rappresenta l’approssimazione dell’ordine desiderato della funzione gaussiana. In figura 2.8 riportiamo il kernel di apertura 5x5. Per rendere più veloce l’operazione, si riduce il kernel a 2 vettori, uno per la direzione x (rappresentato in figura 2.8(c)) e uno, identico ma trasposto, per la direzione y. Le due immagini ottenute da questa convoluzione, chiamia- mole Ix e Iy, vengono unite insieme per trovare la magnitudo (l’ampiezza) del gradiente tramite il calcolo della norma del vettore ~_∇

~∇I(x, y) =qI2

x + Iy2 (2.10)

L’immagine ottenuta dal_~_{∇I(x, y)}_{se vista come una superficie 3D con-} tiene valli (valley) e rilievi. Le curve dei massimi rilievi sono dette creste, o ridges. Per eliminare tutti i punti in cui il valore della norma `e elevato ma non rappresenta un massimo locale per essa, si applica un algoritmo di non- maximum suppression. Si tengono solo i ridges, mentre vengono soppressi tutti gli altri punti. Dopo la soppressione dei non massimi viene usato un meccanismo di sogliatura a isteresi, ovvero vengono fissate due soglie T1 > T2:

tutti i pixel che hanno _~_{∇I(x, y)}_{> T}1 sono edge, i valori compresi tra T1 e

T2 sono detti weak-edge. Un weak-edge diventa edge solo se `e contiguo ad

un edge. Questa fase di scelta degli edge viene detta thinning.

Nel documento Analisi e tuning del sistema di elaborazione di una macchina di ispezione per il controllo di qualità del tubo vetro (pagine 41-47)