Le prime applicazioni informatiche furono sviluppate, cinquant’anni fa, per automatizzare processi ripetitivi. In questo contesto emersero presto l’esigenza e l’opportunità di utilizzare i dati raccolti e mantenuti da queste applicazioni a supporto del processo decisionale. Negli anni l’evoluzione è stata continua e ha portato alla bu-siness intelligence, termine con cui si indicano le metodologie e tecnologie che permettono ad amministratori, dirigenti e analisti di valorizzare il patrimonio informativo. Un modo semplice per schematizzare le attività di business intelligence è quello mostrato nella Figura 1: il supporto al processo decisionale viene svolto attraverso strumenti di vario tipo, che gestiscono attività di interrogazione, analisi e mining, su dati contenuti nel cosiddetto Data Warehouse, che è una base di dati integrata, con dati provenienti da fonti diverse, tanto interne quanto esterne all’organizzazione. Il Data Warehouse è, quasi sempre e per varie ragioni, una base di dati separata ri-spetto a quelle primarie, che contengono i dati operativi. In primo luogo essa è quasi sempre integrata, cioè fa riferimento a vari processi gestionali, ognuno dei quali, di solito, è gestito separatamente dagli altri. Poi, le esi-genze di prestazione e di organizzazione dei dati sono spesso contrastanti con quelle dei processi gestionali: questi ultimi eseguono, di solito, molte piccole operazioni nell’unità di tempo, con esigenza di scrittura affidabile; mentre nel processo decisionale interessano poche operazioni, molto complesse, ma di sola lettura. Per questo motivo, da alcuni decenni si tende a sottolineare, nel settore delle basi di dati, l’esistenza di due grandi famiglie di applicazioni: quelle OLTP (On-Line Transaction Processing), volte a gestire i processi operativi, e quelle OLAP (On-Line Analytical Processing), volte a supportare i processi di analisi e supporto alle decisioni.
Le informazioni e i dati costituiscono una importante ri-sorsa per ogni organizzazione. La business intelligence è l’insieme delle metodologie e tecnologie che permet-tono di valorizzare questa risorsa ai fini del supporto alle decisioni. Nonostante l’apparente maturità, questa area di studio e ricerca è in continua espansione ed evoluzione, anche grazie allo sviluppo delle reti e di altre tecnologie.
BUSINESS INTELLIGENCE: PRESENTE E FUTURO
Paolo Atzeni [email protected]
Dipartimento di Informatica e Automazione, Università Roma Tre
Fig. 1 Un semplice processo di business intelligence.
Sorgenti esterne
Basi di dati
operazionali
Sorgenti dei dati
Originariamente, le soluzioni proposte sono state molto rigide, con un significativo disaccoppiamento fra i vari processi, con la duplice conseguenza di limitare la disponibilità degli strumenti di analisi ai soli vertici azien-dali e di fornire loro la possibilità di operare su dati non sempre sufficientemente attuali e solo su sottoinsiemi dei dati di reale interesse.
Negli ultimi anni, il settore ha continuato a svilupparsi, sulla spinta tanto delle esigenze insoddisfatte quanto delle nuove op-portunità stimolate dall’evoluzione tecnologica, sia specifica sia di altri settori. Un primo fenomeno, continuo nel tempo, ma sem-pre più rilevante, è costituito dalla possibilità di acquisire dati in modo sempre più massiccio ed economico, anche in forma au-tomatica e attraverso vari dispositivi: ai dati rilevati attraverso le tradizionali applicazioni informatiche, quali quelli bancari o di vendita, si affiancano quelli ottenuti in altro modo, ad esempio relativi alle etichette RFID, ai log dei siti web o ai sensori GPS degli autoveicoli. La crescita delle dimensioni dei dati da gestire porta a nuove sfide, che si cerca di affrontare con architetture pa-rallele sempre più sofisticate e scalabili, sia di tipo generale, sia dedicato (chiamate talvolta data warehouse appliance), e anche con approcci nuovi, quali il paradigma Map-Reduce o le piatta-forme di Cloud Computing.
Un’altra importante direzione di attenzione è quella relativa
alle applicazioni di interesse e agli utenti. Nelle aziende moderne, le responsabilità decisionali sono sempre più distribuite e richiedono tempestività. Di conseguenza, si sta dedicando attenzione specifica alla possibilità di realizzare sistemi che operino in tempo reale o quasi (near real-time Business Intelligence), ad esempio attra-verso l’analisi di eventi che possono risultare di interesse, in applicazioni di monitoraggio o di gestione della si-curezza, così come per il supporto alle decisioni nel mondo finanziario, dove le variazioni sono continue. Analogamente, si cerca di realizzare applicazioni più leggere e flessibili, che possano essere utilizzate anche da decisori collocati nella gerarchia aziendale a livelli intermedi o addirittura bassi, permettendo ad esempio a un impiegato allo sportello o a un addetto alla relazione con la clientela di avere informazioni integrate e aggiornate in relazione a una determinata problematica. In questa direzione vanno anche iniziative volte a sviluppare ap-plicazioni mobili, che presentano ovviamente esigenze specifiche per i limiti imposti dai dispositivi e dalla lar-ghezza di banda disponibile.
È interessante segnalare che, essendo ormai accettata l’importanza (e la possibilità di gestire) informazioni di natura diversa, non solo strutturata ma anche semi-strutturata e testuale, anche le applicazioni di supporto alle decisioni cominciano a prendere in considerazione la necessità di ampliare il proprio spettro di dati da gestire. Di conseguenza, anche le tecniche di ricerca di informazioni vengono prese in considerazione nel contesto della business intelligence, con lo sviluppo di soluzioni di Enterprise Search, che cercano di supportare l’utente nella ricerca e correlazione di informazioni di varia natura, anche integrando documenti (ad esempio archivi di posta elettronica) e dati più tradizionali.
Prima di concludere, è utile una riflessione di natura generale. Uno dei problemi fondamentali della business intelligence è costituito dalla necessità di disporre di informazioni corrette e tempestive e di comprendere effi-cacemente il significato che esse hanno nei vari contesti e, di conseguenza, dalla possibilità di effettuare corre-lazioni sensate. La maggiore disponibilità ed economicità di risorse di memoria e di calcolo contribuisce solo in parte a risolvere questo problema, anzi rischia di accentuarlo, perché i dati sono sempre più variegati (aumentano quindi le possibilità di fraintendimento) e i relativi volumi sempre maggiori (rendono dunque impossibili verifiche e certificazioni manuali). È quindi cruciale affrontare le problematiche di qualità dei dati, con approcci sistematici, in cui il processo di produzione sia controllato, limitando le esigenze di intervento umano. Tematica correlata è il riconoscimento dell’identità degli oggetti (entity recognition), al fine di distinguere informazioni provenienti da fonti diverse. Ancora più significative infine sono le problematiche di integrazione e trasformazione dei dati,
62
studiate nella letteratura scientifica da decenni, con contributi certamente interessanti ma ancora molti problemi aperti a livello attuativo. Con tutti questi contributi e tante opportunità e problemi aperti, l’area della business intelligence continua a meritare l’interesse tanto nel mondo della ricerca quanto nel mercato dell’IT.
BIBLIOGRAFIA ESSENZIALE
Atzeni, P., Ceri, S., Fraternali, P., Paraboschi, S., Torlone, R. (2007). Basi di dati: Architetture e linee di evoluzione, seconda edizione. McGraw-Hill Italia.
Bernstein, P.A., Haas, L.M. (2008). Information integration in the enterprise. Comm. ACM 51(9): 72-79. Chaudhuri, S., Dayal, U., Narasayya, V.R. (2011). An overview of business intelligence technology. Comm. ACM
54(8): 88-98.
Kimball, R. (2008). The Data Warehouse Lifecycle Toolkit, 2ndEdition: Practical Techniques for Building Data
Wa-rehouse and Business Intelligence Systems, John Wiley & Sons.