• Non ci sono risultati.

COMPLIANCE BY AUTOMATION - L’AUTOMAZIONE AGEVOLA LA RIORGANIZZAZIONE

MARCELLO CROVARA *

5. IL TEXT MINING IN INAIL

L’INAIL rappresenta una realtà nel settore della Pubblica Amministrazione forte di un’infrastruttura tecnologica tra le più evolute e che, con la sua attività pluriennale, sicuramente possiede al proprio interno innumerevoli fonti di informazioni in formato non strutturato. Pertanto non sarà difficile trovare un’area specifica dove fare una spe-rimentazione di queste nascenti tecniche di trattamento dell’informazione non struttura-ta, che potrebbe rivelarsi significativa per trasformarla in un servizio utile all’utenza, sia essa interna o esterna.

Per stabilire se esistono delle aree dove ha senso procedere ad applicare un processo di Text Mining si possono seguire due approcci alternativi:

• approccio bottom-up: partendo da un censimento delle fonti di documentazione testuale, chiedersi se esistono delle domande interessanti alle quali le informazioni contenute in queste fonti possono fornire una risposta; trovata quindi la fonte con elementi di interes-se inesplorato, utilizzare questa come bainteres-se per l’applicazione degli strumenti di Text Mining

• approccio top-down: partendo dalle applicazioni classiche di Text Mining già documen-tate in letteratura, chiedersi se esiste per l’INAIL uno scenario equivalente. Trovate le similitudini, verificare quindi se per quegli scenari esistono delle fonti documentali inuti-lizzate e su queste applicare gli strumenti di Text Mining.

L’INNOVAZIONE TECNOLOGICA E METODOLOGICA AL SERVIZIO DEL MONDO DEL LAVORO

58

Ad esempio, in un approccio bottom-up, non è difficile elencare le fonti testuali a disposi-zione del nostro istituto:

• verbali ispettivi

• relazioni/pareri contarp

• buone prassi e tecniche per la prevenzione

• banca dati normativa

• denunce di infortunio

• denunce di esercizio

• ecc.

Secondo un approccio top-down, invece:

• in un’ottica di CRM, i nostri clienti sono le aziende. Sebbene operiamo in un regime di monopolio (e quindi problematiche inerenti al mantenimento o all’acquisizione di quote di mercato non si pongono), tuttavia i nostri clienti utilizzano i nostri servizi, che voglia-mo siano i migliori possibili, sia per rendere più snelle le procedure, sia per dare una visione di efficienza della P.A., che ultimamente è messa sempre più in discussione. In particolare, i servizi informatizzati (PuntoCliente) sono la chiave per dare un’immagine di cordialità ed attenzione nei confronti dei clienti. Dunque, cosa possiamo fare per migliorare i servizi on-line? Quali sono le lamentele principali che ci vengono sollevate?

Quali sono i problemi tecnici maggiormente riscontrati? Analizzando le chiamate al call-center di PuntoCliente, o i sondaggi a risposta aperta, è possibile capire cosa si aspettano i nostri clienti, potendo così attuare delle scelte operative che portino ad azioni correttive e a miglioramenti dei prodotti offerti;

• in un’ottica di Competitive Intelligence, con il nuovo compito di cui l’Istituto è stato investito, vale a dire costituire un attore di riferimento nell’ambito della prevenzione, ci ritroviamo in sostanza nello scenario di dover conquistare un consenso ed un accredita-mento in un mercato in cui prima partecipavamo in modo marginale, solo attraverso pub-blicazioni e finanziamenti. Allora, per poter affrontare questa nuova sfida, cosa stanno facendo e cosa faranno i nostri “competitor” già presenti nel mercato? Analizziamo le loro pubblicazioni ed i loro interventi in convegni e seminari per verificare quali sono i loro punti di forza. Si potrà quindi decidere di specializzarci su altre tematiche, in modo da avere una differenziazione, o sulle stesse tematiche, per cercare collaborazioni che agevolino la penetrazione in questo settore.

• in un’ottica di Ricerca Documentale, ci si accorge che la marea di documentazione pro-dotta dalla CONTARP viene utilizzata solo nell’ambito dello specifico caso per cui viene prodotta: le conclusioni di tipo generale contenute in un parere/relazione potrebbe-ro essere utilmente estrapolate per andare a costituire un patrimonio informativo da con-dividere. Allora, perché non sottoporre tutti questo materiale a tecniche di Information Extraction o di Clustering, anche per dare spunti o conferme nell’ambito del corrente progetto di informatizzazione della Consulenza?

Un’altra possibile applicazione interessante, che potrebbe avere anche delle utili implica-zioni sia per l’utenza interna che per l’utenza esterna, è quella di applicare le tecniche di Text Mining per analizzare la descrizione delle cause e circostanze che accompagnano la denuncia di infortunio. Attraverso l’individuazione nel testo di parole chiave, di verbi,

azio-L’INNOVAZIONE TECNOLOGICA E METODOLOGICA AL SERVIZIO DEL MONDO DEL LAVORO

ni e nomi, e con il supporto eventuale di un’ontologia che descriva il dominio degli accadi-menti di infortunio, si potrebbe pensare di realizzare un codificatore ESAW, che in maniera automatica produca o quanto meno suggerisca la codifica da attribuire al caso sottoposto all’analisi. Riuscendo a realizzare una tale funzionalità che risponda anche a criteri di ergo-nomia ed usabilità, si potrebbe pensare, come passo successivo, di delegare all’azienda la codifica ESAW dell’infortunio, contestualmente alla compilazione della denuncia on-line.

In questo modo si ridurrebbe il carico di lavoro dei nostri operatori e sicuramente la codifi-ca sarà più corretta, essendo fatta da chi conosce esattamente come e soprattutto dove l’evento di infortunio si è verificato.

Problematica equivalente a quella della codifica ESAW è l’attribuzione della giusta voce di tariffa all’azienda sulla base della descrizione delle attività riportate nel modulo di denuncia di esercizio. Automatizzare tale processo attraverso l’analisi del testo ed eventualmente il supporto di una specifica ontologia di dominio renderebbe sicuramente omogenea la codifi-ca a livello nazionale (oggi demandata invece all’esperienza e alla sensibilità dell’operatore di linea), e tale omogeneità si rifletterebbe poi su una più precisa analisi del rischio.

Questi sono soltanto alcuni spunti, che vogliono dimostrare che basta solo un po’ di fanta-sia e immaginazione per creare degli ambiti di interesse dove poter fare uso della moderna tecnologia informatica, nella fattispecie del Text Mining.

6. CONCLUSIONI

Il Text Mining, come evoluzione del Data Mining applicato all’analisi delle fonti di infor-mazioni non strutturate, può considerarsi dal punto di vista tecnologico uno strumento ora-mai affidabile, basato su algoritmi maturi ed efficienti.

I segnali che provengono dal mercato indicano una sempre maggiore specializzazione delle aziende di software per offrire servizi evoluti su questa branca della Business Intelligence e aumentano le esperienze positive registrate nell’utilizzo delle sue funzioni in svariati campi di applicazione.

I benefici che ne possono derivare dall’utilizzo di tali potenzialità diventano ancor più inte-ressanti se pensate in combinazione con strumenti di rappresentazione semantica del domi-nio di interesse (ontologie).

Pertanto occorre mantenere alta l’attenzione sull’evoluzione di questa disciplina, eventual-mente sperimentando alcune applicazioni attraverso progetti pilota su determinate aree di inte-resse, per avere subito una sensazione dei risultati che se ne possono ricavare, anche senza investire ingenti risorse finanziarie, ma identificando specifici obiettivi che, ad esempio, potrebbero validamente costituire argomenti di tesi universitaria in determinate aree discipli-nari (ingegneria dell’informazione, scienze statistiche, scienze sociali ed economiche).

RIASSUNTO

In ogni organizzazione una larga percentuale di informazioni risiede in fonti non strutturate, in particolare testuali, sia di origine interna al proprio dominio (lettere dei clienti, relazioni, contratti, questionari, ecc), sia di origine esterna (blog, forum, agenzie di stampa, ecc.). La natura dinamica di tali fonti ed il loro formato non strutturato, rendono sempre più difficile poter recuperare le informazioni in esse contenute. La tecnologia del Text Mining

(evolu-L’INNOVAZIONE TECNOLOGICA E METODOLOGICA AL SERVIZIO DEL MONDO DEL LAVORO

60

zione del Data Mining applicato ai testi) mira ad organizzare in maniera automatica tale mole di dati non strutturati, permettendo di carpirne le informazioni principali, da trasfor-mare in conoscenza necessaria per migliorare i processi interni e supportare le decisioni aziendali. In questa relazione si vogliono dunque illustrare le caratteristiche di tale tecnolo-gia e le sue potenzialità, riportando anche gli ambiti applicativi all’interno dei quali sono state realizzate alcune significative esperienze. Si cercherà poi di configurare alcuni possi-bili scenari d’utilizzo per il nostro Istituto, in cui le fonti testuali a disposizione offrono numerose opportunità.

BIBLIOGRAFIA

V. Borghi: “Text Mining, per una migliore comunicazione tra P.A. ed il cliente-cittadino”, ComPA 2000.

CINECA: “Text Mining: aspetti applicativi in campo bio-medico” - (www.cineca.it).

CINECA: “ASTREA: Tecnologie dell’informazione e della comunicazione per la giustizia”

(http://astrea.cineca.it/).

A.M. Cohen, W.R. Hersh: “A survey of current work in biomedical text mining”, Briefings In Bioinformatics, Vol 6, No 1, 57-71. March 2005

(http://bib.oxfordjournals.org/cgi/content/abstract/6/1/57).

C.K. Cheng, X. Pan: “Using Perception in Managing Unstructured Documents”, ACM Crossroads 10.2, Winter 2003 (http://www.acm.org/crossroads/xrds10-2/challenge.html).

D. Fensel: “Ontologies: A Silver Bullet for Knowledge Management and Electronic Commerce”, Springer-Verlag, 2004.

S. Grimes: “Text Analytics Basics”, BeyeNETWORK, Luglio 2008 (http://www.b-eye-network.com/view/8032).

M. Hearst: “What Is Text Mining?”, Ottobre 2003,

(http://people.ischool.berkeley.edu/~hearst/text-mining.html).

R. Mattison: “Web Warehousing and Knowledge Management”, Mcgraw-Hill, Luglio 1999.

D. Sullivan: “Eye on the competition”, Intelligent Enterprise, Settembre 2000 (http://www.intelligententerprise.com/000908/feat1.jhtml).

ANONIMO: “Inside Data Mining Freeform Text”, Business Intelligence Best Practice (http://www.bi-bestpractices.com/view/4738).

A. Zamarra: “Il Text Mining che agevola gli acquisti”, LineaEDP, Gennaio 2007.

L’INNOVAZIONE TECNOLOGICA E METODOLOGICA AL SERVIZIO DEL MONDO DEL LAVORO

A. Zanasi: “La fase di analisi nel CRM: dal data al text mining”, Organizzazione e Sviluppo, N.184, Marzo/Aprile 2001.

A. Zanasi: “Information Warfare, Business Intelligence, Text Mining”, InfoSecurity 2003 (http://www.clusit.it/infosecurity2003/zanasi.pdf).

A. Zanasi: “Text Mining and its Applications to Intelligence, CRM and Knowledge Management”, IT Press, 2005.

L’INNOVAZIONE TECNOLOGICA E METODOLOGICA AL SERVIZIO DEL MONDO DEL LAVORO

62

INNOVARE IN MODO ALTERNATIVO