Approcci basati sui descrittori

Model Matching

3.2.4 Approcci basati sui descrittori

Gli approcci descritti nelle sotto sezioni precedenti sono atti a velocizzare la rilevazione del modello introducendo metodologie specifiche per la selezione dei candidati nello spazio di ricerca. Un alternativa a questi approcci è quella di ridurre le dimensioni dello spazio di ricerca rendendo le features estratte più distintive. Si ottiene in questo modo che una feature nell’immagine può corri-spondere solo a una o comunque poche feature nel modello, riducendo di molto il numero di ipotesi da vagliare.

Negli ultimi 20 anni sono stati introdotti diversi descrittori con l’obiettivo di creare feature molto distintive. Il più conosciuto ed utilizzato da questi metodi è stato introdotto da Lowe sotto il nome di SIFT (Scale Invariant Feature Tran-sform) [43], il quale ha il vantaggio ulteriore di offrire una caratterizzazione della feature che sia indipendente dalla dimensione della stessa nell’immagine. Il calco-lo della similitudine viene condotto dal matching di due features. Per ogni feature nell’immagine, viene scelta la feature del modello il cui descrittore ha distanza inferiore. Grazie al fatto che le feature sono particolarmente distintive, è possibile considerare solamente le prime features, riducendo in questo modo lo spazio di ricerca sensibilmente. I descrittori delle SIFT si basano sulla caratterizzazione dell’intorno del punto di interesse estratto. Perché si possano ottenere delle fea-ture distintive, è necessario che il modello stesso contenga delle caratteristiche distintive, come ad esempio delle texture o delle forme particolari. Questo non è applicabile al caso in esame, in quanto si hanno dei prodotti geometricamente molto semplici e privi di textures. Inoltre, durante l’estrazione delle features nel-l’immagine ripresa dal sistema, è molto più probabile che vengano individuati dei punti di interesse dati dalla particolare configurazione dei prodotti nel contenito-re, piuttosto che nel prodotto stesso. Vengono quindi create molto features che non possono essere utilizzate per la localizzazione di un singolo prodotto. Infine, le SIFT sono solo parzialmente invarianti ai cambiamenti di illuminazione non soddisfacendo quindi un importante requisito per il nostro sistema.

In letteratura sono presenti diversi approcci similari alle SIFT, tra le quali possiamo citare SURF [10] (Speeded Up Robust Feature), GLOH [45] (Gradient Location and Orientation Histogram) e LESH [53] (Local Energy based Shape Hi-stogram). Tutti i metodi indicati soffrono per`o delle stesse problematiche elencate in precedenza per il caso in esame.

Alcuni studi si basano sui corner trovati all’interno dell’immagine. Nelle Patch-Duplets [41] [30] viene utilizzato l’Harris corner detector con precisione sub-pixel per l’estrazione dei punti di interesse. I descrittori sono quindi formati utilizzando delle coppie di punti di interesse. Nel dettaglio, il descrittore viene calcolato dalla rappresentazione a doppio angolo [33] delle orientazioni locali in un’area a forma rettangolare nell’intorno dei punti di interesse trovati. La dimen-sione e l’orientazione dell’area considerata è determinata in base al segmento di connessione tra i due punti. In fase di riconoscimento, si utilizzano la distanza tra i due punti trovati per ottenere la scala, la differenza di inclinazione per ottenere la rotazione e la distanza tra i punti mediani dei due segmenti per ottenere la traslazione. E’ quindi sufficiente il matching di una sola feature per ottenere la stima della similitudine. Lo studio condotto in [64] ha dimostrato l’applicabilità delle Patch-Duplets al bin picking di oggetti tridimensionali. Per il training del modello è d’altra parte necessario acquisire diverse immagini dell’oggetto nelle sue possibili orientazioni, operazione tediosa e che pone rallentamenti ai cambia-menti del processo di produzione. Non è possibile ottenere queste informazioni solo dal modello CAD dell’oggetto. Questo è dovuto ancora una volta al fatto che i descrittori dipendono dalle caratteristiche ottiche dell’immagine nelle zone nel-l’intorno dei punti di interesse piuttosto che dalle sole caratteristiche geometriche del modello.

3.3 L’algoritmo proposto

I contributi del presente studio rispetto a quanto disponibile in letteratura sono tre. In primo luogo, lo spazio di ricerca `e limitato dall’introduzione di fea-ture distintive per la rappresentazione del modello, il che garantisce una velocit`a di elaborazione nettamente superiore se confrontata con gli approcci di template matching, GHT, oppure geometric hashing descritti nella sezione 3.2. In secon-do luogo, il processo di estrazione delle features si basa solo su caratteristiche

geometriche che possano essere estratte anche da un modello fornito attraverso disegno CAD. In questo modo viene risolto il problema dato dall’assenza di tex-tures rilevanti all’interno del prodotto (si veda la sezione 3.2.4). Terzo, il processo di valutazione della bont`a della stima durante il matching non viene effettuato dal confronto dei descrittori, come avviene per le SIFT o gli altri metodi basati su descrittori, ma dal calcolo di una metrica direttamente sull’immagine acquisi-ta la quale risulacquisi-ta essere particolarmente robusacquisi-ta alle variazioni di luminosit`a e all’occlusione.

Figura 3.3: Passi dell’algoritmo.

L’algoritmo proposto è composto da quattro passi fondamentali rappresentati nel diagramma di immagine 3.3. In primo luogo vengono estratte le features di interesse nel modello e nell’immagine. Queste vengono quindi fatte corrispondere tra loro, in modo da ottenere come risultato le diverse pose possibili per il modello nell’immagine. Per ogni ipotesi verrà calcolato un valore di similitudine basata sulle caratteristiche dell’immagine. Le coppie posa-similitudine subiranno quindi un processo di clustering per determinare le pose candidate. Per ognuna di essere sarà infine eseguito un processo di minimizzazione dell’errore che consenta di migliorare la stima della posizione dell’oggetto nel sistema di riferimento della scena, ottenendo in questo modo il risultato dell’algoritmo. Nel seguito della sezione analizzeremo i quattro passi individuati separatamente.

Nel documento BIN PICKING ROBOT: ALGORITMI DI VISIONE E FRAMEWORK SOFTWARE (pagine 73-76)