Modello CRISP-DM applicato alla VISUAL INSPECTION

CAPITOLO 4 – CRISP-DM E IBM MAXIMO VISUAL INSPECTION

4.2 Modello CRISP-DM applicato alla VISUAL INSPECTION

Una volta compreso il processo CRISP-DM è possibile standardizzare una serie di passi che guidino durante la risoluzione di un problema di visual inspection industriale:

A. Business understanding: Capire il problema dal punto di vista reale contestualizzandolo agli aspetti di business richiesti dal cliente.

B. Raccolta di dati: L’applicazione del modello va fatta su un dataset generato con la medesima strumentazione. Se le immagini del dataset sono prese con la telecamera X e le immagini su cui verrà effettuato il test finale sono prese con la telecamera Y, il modello non potrà funzionare. Il dato su cui si costruisce il modello deve provenire dallo stesso luogo e deve essere raccolto nello stesso modo per evitare il problema della rappresentatività dei dati.

C. Pre processamento: Si tenta di applicare un processamento delle immagini con l’obiettivo di generare dati puliti e facilmente elaborabili. Una delle operazioni che viene solitamente eseguita è quella di separazione tra il bordo e il soggetto delle immagini. Per evitare di elaborare troppi pixel contemporaneamente, in presenza di immagini molto grandi è possibile dividere il tutto in sotto- immagini, elaborare la porzione della fotografia (individuando i difetti) e poi, a partire dalle coordinate, ricomporre l’immagine nel suo complesso. Per evitare che il bordo influenzi la buona riuscita del riconoscimento si applica solitamente un primo modello di object detection in grado di riconoscere il “template” ad alto livello dell’oggetto ed estrarre la regione che lo contiene, per poi passare ad un secondo modello solo per il riconoscimento delle difettosità che utilizza tali regioni individuate come proprio input.

158 D. Tagging dei difetti: Riunirsi con il personale tecnico per definire in maniera formale la

definizione di difetto per il cliente individuando il numero di difetti che si desidera riconoscere. In questa fase è fondamentale capire quali sono i criteri secondo la quale il cliente scarterebbe oppure no un pezzo. Ad esempio, nel caso in cui si dovessero verificare difettosità su una mela si potrebbe definire una classificazione OK/KO come la seguente:

Una mela va scartata se una o più combinazioni dei seguenti criteri sono vere:

- Tutti i difetti di lunghezza, larghezza o diametro > di 2cm

- Macchie di diametro > di 2cm o presenza di almeno due macchine di diametro < 2cm. - Superficie inquinata definita da 8 punti ravvicinati in una superficie di 4cm quadrati - Ammaccature presenti di dimensione > di 1cm sulla superficie dell’oggetto

Chiedere dei criteri geometrici al cliente è spesso una sfida complicata da superare poiché è difficile per l’umano trasmettere sottoforma di parametri matematici il proprio processo di pensiero e quella che alla fine è definibile come la propria esperienza. Per questo motivo si divide il processo di tagging in due parti:

- Il tecnico esperto effettua il tagging consapevole di tutte le difettosità con lo strumento di selezione rettangolare.

-Se il modello di machine learning è particolarmente bravo a riconoscere i difetti è possibile ricavare una serie di proprietà geometriche proprio dai difetti ed effettuare delle elaborazioni su questi difetti al fine di prendere la decisione fondamentale: lo scarto oppure no?

E. Costruire il modello: Si tenta di evitare l’overfitting creando gli insiemi di train e test dove ci si deve assicurare che il campione del training sia rappresentativo della popolazione di situazioni in cui mi troverò nella pratica. Se ci sono situazioni NON presenti il modello non potrà ricavarle. Lo spazio di conoscenza del training set deve essere denso nello spazio complessivo delle situazioni di difettosità tenendo però conto delle proporzioni tra pezzi difettosi oppure no.

Se ad esempio un’azienda produce 1000 tettucci al mese di cui 10 sono difettosi allora il rapporto tra oggetti difettosi e corretti del train set dovrà essere il medesimo! Analogamente anche

l’insieme di test dovrà avere le stesse proprietà del training e quindi mantenere il rapporto e le proporzioni tra pezzi difettosi e corretti in egual modo.

159 F. Valutazione: Il modello, dopo aver effettuato l’addestramento, possiederà delle confidenze e dei valori di precisione. Se però il cliente desidera un SI/NO dobbiamo trasformare questo valore statistico in funzione della metrica che si vuole massimizzare. Il valore di cut-off si definisce facendo esperimenti e cercando di massimizzare gli obiettivi di business. Il valore di cut-off per determinare la presenza di un difetto oppure no avviene in fase di planning e business

understanding. Per valutare i risultati del modello si adottano strategie di intersezione tra le aree delineate nella fase di tagging e generate dal modello addestrato. Da tali intersezioni è possibile definire i valori di precisione del modello. Il valore di cutoff del sistema dipende da ogni singolo difetto presente sull’immagine di input.

Esistendo a priori davvero tantissimi algoritmi e reti convolutive risulta complicato capire a priori qual è la rete migliore da adottare per il mio problema. Inizialmente si provano tante reti e diversi algoritmi per capire quali sono le risposte del sistema all’input. Alcuni algoritmi possono agire con un grid search con l’obiettivo di testare il modello in tutte le famiglie di configurazioni diverse possibili per ottenere la risposta migliore del sistema. Una volta scelto l’algoritmo si lavora sulla parametrizzazione dello stesso agendo sui parmetri di configurazione e gli iperparametri specifici della rete scelta.

Per il caso di studio reale che verrà analizzato in questo capitolo utilizzerò un software commerciale prodotto da IBM chiamato MAXIMO VISUAL INSPECTION.

Nel documento Analisi, Sviluppo e Sperimentazione di Sistemi di Visual Inspection in Contesti Industriali (pagine 157-159)