• Non ci sono risultati.

Computer Vision: Overview della tecnologia

1 Identificazione delle azioni da intraprendere per colmare i Gap

3.3 Trend futur

3.3.1 Computer Vision: Overview della tecnologia

La Computer Vision è un campo dell'informatica che consente ai computer di vedere, identificare ed elaborare le immagini nello stesso modo in cui funziona la visione umana e quindi fornire un output appropriato. Ha la missione di impartire intelligenza e istinti umani a un computer. L'obiettivo della Computer Vision non è solo quello di vedere, ma deve essere anche in grado di elaborare e fornire risultati utili basati sull'osservazione. Deve quindi consentire ai computer di eseguire lo stesso tipo di attività degli esseri umani con la stessa efficienza. Questa tematica è strettamente collegata all'intelligenza artificiale, in quanto il computer deve interpretare ciò che vede e quindi eseguire un'analisi appropriata o agire di conseguenza. Quindi per capire meglio come funziona questa tecnologia à doveroso spendere due parole sull’intelligenza artificiale, il Machine Learning e Deep Learning (Figura 10). L'intelligenza artificiale è praticamente un'intelligenza dimostrata da una macchina che la conduce a una soluzione ottimale o subottimale dato un problema. La AI coinvolge tutte quelle operazioni caratteristiche dell’intelletto umano ed eseguite da computer. Queste includono la pianificazione, la comprensione del linguaggio, il riconoscimento di oggetti e suoni, l’apprendimento e la risoluzione dei problemi. Mentre, il Machine Learning, o apprendimento automatico, è essenzialmente una strada per l’attuazione dell’intelligenza artificiale. Il termine ML è stato coniato dopo a quello dell’AI, ed è inteso come “la capacità di una macchina di

13 Essendo a mio avviso degli Use Cases molto interessanti, ma totalmente distanti dall’oggetto del Project Work, ho deciso comunque di riportali in Appendice.

39

apprendere senza essere programmata esplicitamente”. Il ML può essere definito come una specie di sottogruppo dell’AI che si concentra sulla capacità delle macchine di ricevere una serie di dati e di apprendere da soli, modificando gli algoritmi man mano che ricevono più informazioni su quello che stanno elaborando. Quindi, il Machine Learning è la pratica dell'uso di algoritmi per analizzare dati, imparare da essi e quindi fare una determinazione o una previsione su qualcosa. Mentre il Deep Learning, o apprendimento approfondito, è uno degli approcci al ML che ha preso spunto dalla struttura del cervello, ovvero l’interconnessione dei vari neuroni. Il DL utilizza enormi modelli di reti neurali con varie unità di elaborazione, sfrutta i progressi computazionali e tecniche di allenamento per apprendere modelli complessi attraverso una enorme quantità di dati. Il Deep Learning quindi è fondamentalmente un Machine Learning più evoluto. Ovvero, ci sono più livelli per elaborare le caratteristiche e, in generale, ogni livello estrae alcune informazioni preziose. La Figura 10 fornisce un riassunto dei tre concetti sopra esposti.

Figura 10 – AI, ML e DL

Quindi il ML e il DL sfruttano le reti neurali che sono algoritmi che imitano la struttura biologica del cervello. Nello specifico le nostre soluzioni utilizzano le reti neurali convoluzionali (ConvNests o CNN). Le CCN sono una categoria di reti neurali che si sono dimostrate molto efficaci in aree quali il riconoscimento e la classificazione delle immagini. ConvNets ha avuto successo nell'identificazione di volti, oggetti e segnaletica stradale oltre a potenziare la visione in robot e auto a guida autonoma. La Rete Neurale Convolutionali permettono classificare un'immagine (Figura 11), che viene data come input, in quattro categorie ad esse associate delle relative probabilità: bird, sunset, dog, cat. Come risulta evidente dalla figura sotto, quando si riceve un'immagine dell'uccellino come input, la rete

40

assegnerà correttamente la probabilità più alta per la bird rispetto alle altre tre categorie elencate.

Figura 11 – Rete Neurale Convoluzionale

La reale applicazione della Computer Vision nella ricerca di soluzioni innovative che andrò a proporre, come precedentemente annunciato, è resa possibile grazie progetto Smart-DH. Tale progetto/prodotto utilizza la CNN per identificare gli elementi caratteristici dei contenuti video come oggetti, attori, luoghi, emozioni e così via. Le soluzioni che andrò a proporre consentono di discriminare oggetti, persone, azioni, luoghi, misure, distanze e colori di tutto ciò che viene osservato. Il progetto Smart-DH è una soluzione che trova applicazione in diversi ambiti grazie alla sua architettura modulare modulare (Figura 12) che implementa tecniche di Computer Vision all'avanguardia:

ü i moduli possono essere facilmente composti attraverso la nostra architettura di microservizi per soddisfare qualsiasi esigenza;

ü la nostra architettura utilizza un sistema di processamento real-time delle informazioni in modo da fornire un output istantaneo;

ü i moduli possono essere riaddestrati con i dati collezionati dai clienti per risolvere problemi complessi e specifici;

ü utilizziamo tecniche di data enhancement e one-shot learning proprietare per rendere possibile il training con pochi dati di esempio

41

Figura 12 – Architettura della nostra soluzione

Nello specifico Smart-DH è composto da 5 microservi:

1) Face Recognition: il modulo di riconoscimento facciale consente di riconoscere l'identità delle persone (attori, lavoratore ...) all'interno di uno scatto o in un video. Grazie alla nostra architettura di sistema possiamo addestrare reti neurali per riconoscere nuovi volti in breve tempo.

2) Emotion Recognition: il modulo di riconoscimento delle emozioni consente di rilevare lo stato mentale della persona (felice, triste, affamato ...) all'interno di uno scatto o in un video.

3) Object Recognition: il modulo di riconoscimento oggetti consente di trovare e identificare oggetti di forme e colori diversi in una sequenza di immagini o video. 4) Place Recognition: il modulo di riconoscimento dei luoghi consente di riconoscere i

monumenti nazionali e internazionali all'interno di immagini o video.

5) Scene Recognition: il modulo riconoscimento di scena consente di riconoscere esattamente tutte le scene di un film.

6) Setting Recognition: il modulo di riconoscmimento del setting consenti di riconoscere l’ambientazione all’interno di un video o di un’immagine (interno, esterno, città, mare, foresta…).

Face

Recognition RecognitionPlaces RecognitionAction RecognitionEmotion (Monuments)

Object

Recognition RecognitionScene

Settings Recognition (Internal, external, city, forest…) Pose Estimation User Interface

42

7) Action Recognition: il modulo di riconoscimento delle azioni consente di riconoscere qualsiasi azione intrapresa all'interno di un video (esempio: mangiare, parlare, camminare, baciare, combattimento…)

8) Pose Estimation: il modulo della stima della posa consente di determinare e rilevare le figure umane e la loro posa in immagini e video. Permette di seguire ogni singolo movimento del corpo, fino a determinare il movimento delle dita delle mani e dei piedi. Questo modulo, a differenza di quello precedente consente un riconoscimento più specifico di ogni singolo movimento, consentendo quindi di capire anche se quel movimento viene svolo nella maniera corretta.

Use Case: Applicazione della Computer Vision nella logistica

L’attività di logistica in entrata, interne ed in uscita presentano attività strategiche per le aziende, in quanto se mal gestite possono condurre ad inefficienze e alla conseguente perdita di redditività. La velocità e la precisione sono due caratteristiche fondamentali per le operazioni logistiche odierne. La Computer Vision può facilmente gestire queste attività strategiche e consentire, alla catena di fornitura, di ottenere un’elevata precisione di verifica per la ricezione, la spedizione e il caricamento di pallet. La CV quindi permetterebbe di ottimizzare i processi di ricezione e spedizione delle merci garantendo così una notevole riduzione degli errori (e conseguenti costi) e un aumento dell’efficienza.

Quindi l’utilizzo della “visione artificiale” in ambito logistico potrebbe garantire l'adempimento completo e corretto durante le operazioni di produzione, distribuzione e vendita al dettaglio. Recapitolando, l’utilizzo dell’intelligenza artificiale in ambito logistico permetterebbe di:

ü Avere una verifica efficiente ed automatizzata della logistica in uscita ü Ridurre i costi operativi

ü Aumentare la redditività grazie a zero errori di spedizione ü Velocizzare il carico/scarico di merci

ü Ridurre i tempi di consegna degli ordini ü Acquisire in maniera automatica i dati

ü Automatizzare la corrispondenza e la verifica delle etichette con i dati nei sistemi WMS e ERP

ü Ridurre i tempi di scansione dei pallet in pochi secondi

ü Avere a disposizione una situazione visiva completa di tutte le attività svolte e degli errori registrati

43

I vantaggi sopra elencati sono ottenibili in quanto tutte quelle attività tediose e soggette ad errore possono essere facilmente sostituite dall’utilizzo di una telecamera ed algoritmi studiati

ad hoc.

Di seguito degli esempi pratici di come ottenere i vantaggi sopra elencati.

Le fotocamere, utilizzando nello specifico il modulo object recognition (ma anche dell’action detection per riconoscere e verificare la correttezza delle attività di carico/scarico e la scene recognition per individuare esattamente solo determinate parti di un video), riescono a rilevare e riconoscere automaticamente tutta la merce/pallet non solo attraverso i codici a barre/QR, ma anche attraverso informazioni (preventivamente catalogate e con cui vengono allenati gli algoritmi specifici) sulla forma/dimensione/colore/etichette. In particolare, attraverso il riconoscimento dei pacchi a seconda del colore è possibile effettuare uno smistamento più rapido; mentre, grazie al riconoscimento della forma, della dimensione e delle informazioni contenute nell’etichetta (data, destinatario, città …) è possibile ottenere informazioni utili al fine di ottimizzare il carico della merce sul camion. Infatti, oltre ad una gestione più efficiente dello spazio (grazie al riconoscimento delle dimensioni/forme della merce) sul camion a disposizione è possibile anche ottenere, in base alle informazioni captate grazie alla Computer Vision, informazioni circa la posizione esatta e il relativo camion (grazie all’intreccio delle informazioni ottenute da tutte le etichette relative alle spedizioni da effettuare) in cui i pacchi devono essere posizionati per ottimizzare lo scarico. Inoltre le ispezioni e le verifiche che utilizzato tali metodologie verrebbero condotte senza interrompere/ritardare il flusso logistico. Altra funzione importante è l’utilizzo delle immagini che vengono elaborate dai sistemi di Computer Vision. Infatti tutte le immagini possono essere memorizzate in una banca dati e recuperati qualora servissero come prova visiva della spedizione a seguito di reclami in merito a quantità, qualità (grazie alla possibilità di memorizzare l’esatto stato della condizione della superficie del pacco al momento della spedizione), colore e dimensione della merce.

Infine grazie all’integrazione di sistemi di Computer Visione con i processi di "smart picking" sarebbe possibile ridurre drasticamente i tempi i costi relativi ai metodi di prelievo manuale della merce. Infatti, grazie alle soluzioni messe a disposizione grazie alla Computer Vision è possibili identificare in pochissimi secondo la posizione dei pacchi (ma anche il numero di una determinata tipologia di pacchi) ed effettuare così un rapito prelievo/smistamento senza perdere tempo a rilevare oggetti particolarmente piccoli, con etichette che non si leggono o privi.

44

CONCLUSIONI

In questo elaborato sono state riportate le principali considerazioni relative all’esperienza condotta presso l’azienda Illogic Srl. Durante i mesi di tirocinio ho potuto vedere in prima persona i principali punti di forza dell’azienda. In particolare il core business incentrato sull’utilizzo delle nuove tecnologie e la consapevolezza che la cooperazione fra le aziende, università e centri di ricerca è la migliore strategia che consente di restare competitivi sul mercato e di sfruttare al meglio le tecnologie all’avanguardia. Lo stage mi ha consentito di vedere applicate le più recenti tecnologie, come la Realtà Aumentata/Virtuale/Assistita e l’Intelligenza Artificiale, e apprendere come esse possano essere utilizzate in campi e settori altamente distanti fra di loro e il grande valore aggiunto che apportano.

Svolgendo il tirocinio presso l’area di Management Consulting ho potuto ripercorrere a livello operativo tutte le principali attività di Project Management e del Management Consulting, verificando come i fondamenti teorici si ripercuotono effettivamente nelle attività giornaliere del consulente.

In specifico nel Project Work sono state riportate le principali fasi di un progetto di consulenza relativo al ridisegno di una rete distributiva per una casa editrice italiana a seguito di un’acquisizione aziendale. Ripercorrendo le principali fasi è stato evidente come effettivamente i fondamenti teorici si ripercuotono all’interno dell’intero ciclo di vita del progetto. Inoltre, avendo la possibilità di lavorare in un’azienda appartenente ad un ecosistema di aziende ho potuto sfruttare le sinergie e i punti di forza di ognuna di loro al fine di ricercare e sviluppare dei nuovi trend e le nuove opportunità di mercato. A dimostrazione di ciò, a seguito del progetto di consulenza infatti sono state applicate le emergenti tecnologie con lo scopo di dimostrare come effettivamente le aziende di consulenza possano beneficiare di esse per apportare valore ai propri clienti ed inoltre, consentano loro di rimanere competitive sul mercato. Nello specifico sono state descritte le possibili applicazioni che utilizzano l’intelligenza artificiale, in particolare la Computer Vision, nel settore della logistica. Infatti a seguito di una descrizione delle principali caratteristiche e le potenzialità della Computer Vision è stato descritto come è possibile ottenere dei vantaggi nella logistica come la verifica efficiente ed automatizzata della logistica in uscita, la riduzione dei costi operativi e dei tempi di consegna…

Quindi, a conclusione è possibile affermare che in un modo in continua evoluzione, non basta la sola applicazione della tecnologia, ma è necessaria la cooperazione fra aziende, Università e Centri di Ricerca al fine sfruttare i punti di forza e le sinergie.

45 BIBLIOGRAFIA

A Guide to the Project Management Body of Knowledge (PMBOK® Guide) (2008) - Fourth

Edition, Newtown Square, Pennsylvania, Project Management Institute, Inc.

T. Armbrüster (2006) - The Economics and Sociology of Management Consulting, Cambridge, Cambridge University Press

R. Atkinson (1999) - Project management: cost, time and quality, two best guesses and

phenomenon, its time to accept othersuccess criteria, International Journal of Project

Management, Vol. 17, No. 6, pp. 337-342

J. Bessant, H. Rush (1995) - Building bridges for innovation: the role of consultants in

technology transfer, Research Policy, Vol. 24, No. 1, pp. 97-114

A. Iovene (2015) - Grazie...le faremo sapere. Come affrontare i colloqui di selezione nelle

società di consulenza, Franco Angeli

H. Kerzner (2019) - Project management. A systems approach to planning, scheduling and

controlling, Hoboken, New Jersey, John Wiley & Sons, Inc.

Osservatorio Assoconsult, Management Consulting in Italia, 8° Rapporto, Roma, Rapporto annuale 2016-2017 A. N. Turner (1982) - Consulting Is More Than Giving Advice, Harvard Business Review, Vol. 60, No. 5, pp. 120-129

46 SITOGRAFIA http://illogic.xyz http://www.emagine.ai http://www.a-e-g.it https://www.pmi.org/pmbok-guide-standards/foundational/pmbok http://www.assoconsult.org https://www.leadershipmanagementmagazine.com/articoli/implementare-efficacemente- project-management/ https://www.dhllive.com/content/l%E2%80%99intelligenza-artificiale-nel-settore- logistico http://www.logisticamente.it/DirettamenteAziende/11255/il-futuro-della-logistica-tra- intelligenza-artificiale-e-robotica/ https://tecnologia.libero.it/la-logistica-al-tempo-dellindustria-4-0-tra-robot-e-ia-14174 https://www.logisticaefficiente.it/flexis/supplychain/produzione/impatto-machine- learning-su-produzione-e-logistica.html

47

APPENDICE

Use Case: Applicazioni di Computer Vision

Di seguito sono esposti gli Use Cases che hanno come protagonista la soluzione “Smart-DH” che utilizza la Computer Vision al fine di migliorare l’efficacia e l’efficienza in settori completamente diversi tra di loro. Lo sviluppo degli Use Cases riguarda tre settori completamente differenti: Media, Manufacturing e Retail. Questo al fine di mostrare come la soluzione Smart-DH abbia un campo di applicazione ampio e variegato. Ovviamente ci siamo soffermati su questi tre settori, ma l’applicazione non ha perimetri entro i quali devi stare grazie alla struttura modulare che la caratterizza. Per ogni settore sono stati evidenziati più campi di applicazione che verranno di seguito proposti e trattati. Nello specifico i diversi Use Cases sono stati così ripartiti:

ü Media

Ø Video Comprehension § Video Recognition § Video Asset Management § Video Intelligence

ü Manufacturing

Ø Quality Control Ø Workforce Safety

Ø Assembly Line Verification Ø Drafting of Technical Manuals ü Retail

Ø Checkout

Ø Customer Loyalty

Iniziamo con l’esposizione delle soluzioni applicato al settore dei Media. Le aziende dei media trattano ogni giorno un enorme catalogo di contenuti in costante crescita in termini di quantità e qualità per soddisfare le aspettative dei clienti. Ogni fotogramma di un film contiene varie informazioni che possono essere "catturate" e catalogate. Quindi, spesso è necessario trovare parte delle sequenze da riutilizzare in base alle esigenze (pubblicità, spezzoni di un film da riproporre, ...). Allo stato corrente quindi attori, volti, oggetti, luoghi, impostazioni sono tutte informazioni che, per essere etichettate, richiedono operazioni onerose da parte di un annotatore umano in grado di verificarle e salvarle.

48

Visto le problematiche dello stato corrente, Smart-DH potrebbe essere una soluzione efficacie per quanto riguarda tutte quelle attività che sono all’interno della comprensione dei video, nello specifico ci siamo soffermati in tre applicazioni:

ü Video Recognition: ovvero tutto quelle attività volte alla comprensione e all’interpretare efficacemente i concetti da qualsiasi flusso video. La nostra soluzione permette di riconoscere l'identità degli attori, le emozioni, le azioni, l'ambientazione del film e il rilevamento delle scene. In aggiunta consenti di fornire e comprendere tutti i metadati necessari per i contenuti video.

ü Video Content Asset Management: ovvero tutte quelle attività volte all'organizzazione e alla ricerca di contenuti video. La nostra soluzione quindi consente di trasformare il catalogo video in un servizio a valore aggiunto. Il contenuto video può quindi essere gestito in base a esigenze e categorie specifiche, sfruttando il valore dell'azienda. Ciò è possibile identificando diversi concetti in ogni scena e creando un'analisi semantica del video.

ü Video Intelligence: ovvero tutte quelle attività volta a cercare determinati elementi (attore, emozione, azione, oggetto, scena, …) all’interno di un video. La nostra soluzione consente di ottenere una panoramica visiva di tutti i contenuti, rivedere i dettagli e trovare ciò che è rilevante nei video.

Quindi Smart-DH è una soluzione semplice ed efficace per l'indicizzazione, la catalogazione e il recupero di qualsiasi tipo di informazione presente in un film. Ogni frame del film da indicizzare viene passato aa una rete neurale (Foto 13) che, essendo addestrata con diversi milioni di immagini, ci consente di classificare volti, azioni, luoghi, ecc. Grazie alla nostra soluzione, la comprensione dei contenuti video sarà più veloce e più precisa.

49

I nostri moduli di servizio identificano diversi concetti in ogni scena e creano un'analisi semantica del video. Funzionalità potenti per organizzare e cercare contenuti video digitali. Il contenuto digitale può quindi essere gestito in base a esigenze e categorie specifiche, sfruttando il valore aziendale.

Segmentazione degli argomenti video

Nello specifico caso dei Media, la nostra soluzione presenta quattro caratteristiche rilevanti: ü Annotazione Semantica: i nostri moduli di servizio identificano diversi concetti in ogni

scena e creano un'analisi semantica del video. Funzionalità potenti per organizzare e cercare contenuti video digitali. In questo modo il contenuto digitale può quindi essere gestito in base a esigenze e categorie specifiche, sfruttando il valore dell’azienda. ü Segmentazione del video: la nostra soluzione sfrutta la tecnologia di analisi delle

informazioni multimodali di deep learning per segmentare rapidamente e accuratamente un lungo video in più parti di temi diversi

ü Selezione copertina video: consente di selezionare le immagini più rappresentative e attraenti come cover basate sulla comprensione dei contenuti video online.

ü Sinossi del video: consente di estrarre video clip per fare sinossi video in base alla pertinenza del contenuto video e alle migliori immagini.

Elencate tutte le soluzioni pensate per il settore dei Media, e nello specifico alla comprensione dei video, è possibile elencare i vantaggi ottenibile dal nostro prodotto:

ü Semplicità e intuitività: in pochi passaggi è possibile analizzare un intero film, dividendolo in scene e identificando volti, oggetti, luoghi, impostazioni, ecc.

ü Unicità: il primo software che ti consente di estrarre tutte queste informazioni da un film ü Innovazione: uso combinato delle tecniche Machine Learning e Artificial Intelligence

per riconoscere volti, oggetti, luoghi, impostazioni, ecc.

ü Ricerca: in pochi clic è possibile individuare una scena digitando una semplice frase e verificare immediatamente le scene che corrispondono alla ricerca.

Un altro campo dove la Computer Vision può portare enormi vantaggi e soluzioni utili è nel settore Manufacturing. In particolare, può essere applicato nei seguenti campi di applicazione: controllo di qualità, sicurezza dei lavoratori, ispezione della linea di montaggio e stesura di manuali tecnici.

50

Iniziando dal controllo della qualità: al giorno d'oggi, il controllo di qualità è condotto da ispettori umani. Esso è un compito molto impegnativo, poiché la mancanza di attenzione dopo ore di lavoro è inevitabile e questa potrebbe avere gravi conseguenze. Quindi, fino ad oggi, la parte relativa al controllo della qualità durante il ciclo di produzione continua a essere un compito difficile a causa della sua dipendenza dalla comprensione visiva a livello umano.

Documenti correlati