• Non ci sono risultati.

Business Intelligence e Machine Learning

2) Monitoraggio SLA

7.1 Business Intelligence e Machine Learning

Il processo di classificazione focalizzato all’assegnazione, analisi e risoluzione dei ticket è un processo talvolta molto laborioso poiché è necessario analizzare nel dettaglio le caratteristiche dei problem per assegnare al meglio i ticket ai gruppi competenti e trovare possibili soluzioni.

Alcune problematiche che possono sorgere sono che:

1. le risorse all’HD durante le assegnazioni a gruppi di risorse specifiche possono assegnare gli argomenti alle categorie sbagliate, avendo ritardi significativi fino alla risoluzione.

2. la presenza di conoscenze specifiche per consentire una classificazione e analisi ottimale dei ticket aumenta il costo della formazione del personale.

3. ticket relativamente facili impegnano tempo e risoluzioni manuali estremamente noiose.

Pertanto, il modello proposto in questo elaborato prevede meccanismi di classificazione automatizzata degli incident. Tuttavia, la complessità dei problemi e dei dati rende difficile l'automazione utilizzando regole codificate a mano, e invece l’approccio proposto consiste nell'analizzare i dati da precedenti problematiche con abbinamento di tecniche di business intelligence e machine learning.

Nello specifico, il modello di gestione proposto prevede di utilizzare modelli predittivi basati su tecniche di machine learning che possano riuscire a facilitare la classificazione e prevedere la causa principale degli incident ed essere utilizzate per assistere i tecnici fornendo loro suggerimenti e potenzialmente risparmiando tempo nel processo di gestione dei ticket.

Questo è un metodo che può essere utilizzato sia dalle risorse ai primi livello di Help Desk in fase di creazione del ticket, sia all’interno dei gruppi di lavoro che si occupano della gestione di incident specifici per classificare ed assegnare internamente il ticket a gruppi/risorse specifiche.

In sintesi gli obiettivi dell’utilizzo delle tecniche di machine learning applicate al modello di gestione dei ticket sono:

82

 Prevenzione dei problemi: sfruttare i vantaggi dell’automazione, in modo che ai clienti possano essere risolti i ticket in modo automatico.

 Accelerazione della soluzione: supporto decisionale e assegnazione automatizzata.

 Apprendimento organizzativo: conservare la conoscenza dei dipendenti in azienda e scoprire miglioramenti nelle strutture organizzative.

7.1.1 Automazione delle classificazioni

A tale scopo risulta essenziale la raccolta dei dati messa in atto attraverso il modello di gestione finora descritto che prevede l’integrazione di informazioni ai ticket nel software di issue tracking interno. Nello specifico questo è possibile grazie alla registrazione per ciascun ticket classificato e risolto delle informazioni di alcuni campi categoriali come il tipo di apparecchiature relative al guasto, priorità, data e ora di completamento, la descrizione e un report della soluzione presente.

Successivamente è necessaria una pulizia (26), ovvero una selezione dei dati per estrarre esempi di cause dell’anomalia che potrebbero essere utilizzati per le attività di machine learning e di una fase di pre-elaborazione per trasformare i dati di testo in una forma che può essere fornita ai tradizionali algoritmi di machine learning.

Queste due fasi prevedono:

o Eliminazione di informazioni considerate superflue trasformando tutto il testo in minuscolo. Ciò riduce la complessità dei dati e il numero di funzionalità che verranno create successivamente, poiché la dimensione del vocabolario risulta ridotta.

o Conversione in tag degli orari, date e indirizzi e-mail in formati noti per orari, date e gli indirizzi email come <time>, <date> e <email>.

o Rimozione di spazi e caratteri speciali in eccesso.

o “Tokenizzazione”: dividere il testo in una sequenza di token necessari per il processo di estrazione delle caratteristiche. Questo può essere fatto semplicemente suddividendo il testo su uno spazio bianco per ottenere un elenco di parole.

o Stemming: trasformare diverse “inflessioni” di una stessa parola in una forma base.

I dati relativi ai problemi possono essere così analizzati utilizzando le tradizionali tecniche di business intelligence e modelli di machine learning più complessi per scoprire quali tipi di modelli è possibile estrarre dalle informazioni caricate.

Ecco gli step (40):

1. Approccio esplorativo preliminare per ottenere una prima comprensione delle informazioni dei ticket. Per questo scopo, è possibile utilizzare un modello di clustering gerarchico, che raggruppa informazioni simili dal ‘summary’ dei ticket in base alla distanza tra le parole all'interno del testo suggerendo possibili cluster.

Più precisamente è possibile creare un dendrogramma dalle principali parole utilizzate nel summary utilizzando il metodo di raggruppamento di Ward insieme a una distanza euclidea. Questo consiste nel raggruppare ad ogni passo due parole che rendono minima la perdita di varianza della distanza fra le parole del raggruppamento.

Figura 23. Dendogramma di esempio riportato nell’articolo: Business Intelligence for Business Processes: The Case of IT Incident Management (27)

2. Identificare il numero di argomenti e gruppi di supporto desiderati. Per eseguire la modellazione degli argomenti si ritiene, infatti, necessario scegliere in anticipo il numero di argomenti che comporta un compromesso tra esigenze aziendali e indicazioni statistiche. Ogni argomento dovrebbe riflettere le capacità e le competenze di un gruppo di servizio: un numero troppo piccolo di argomenti potrebbe portare a una semplificazione eccessiva del modello. Tuttavia, nel caso in

84 specializzati e tanti: questo potrebbe causare gravi problemi quando si bilancia il grado di utilizzo della capacità di ciascun gruppo nel tempo e potrebbe richiedere una riorganizzazione dello spazio ufficio, con conseguenti fattori di costo aggiuntivi.

Figura 24. Suddivisione delle parole chiave in 5 topic (Fonte: Business Intelligence for Business Processes: The Case of IT Incident Management)(27)

3. Utilizzare un modello per la modellazione delle categorie per estrarre gli argomenti all'interno dei ticket: sono ispezionate le parole più importanti di ogni argomento per determinare la categoria di uno specifico ticket e assegnarlo ad un gruppo HD di competenza o un sotto gruppo specializzato all’interno di uno stesso gruppo di lavoro. È possibile svolgere l’estrazione degli argomenti all’interno dei ticket attraverso l’ Allocazione Dirichlet latente, un modello di analisi del linguaggio naturale che permette di comprendere il significato semantico di un testo analizzando la somiglianza tra la distribuzione dei termini del documento con quella di un argomento specifico (topic).

4. Utilizzare/addestrare un modello predittivo di machine learning per dedurre