• Non ci sono risultati.

2. Spatial Decision Support Systems: Stato dell’arte

2.1. I Sistemi di Supporto alle Decisioni

2.1.4.3. Analisi dei dati nei DW

I sistemi di business delle imprese che gestiscono i dati delle operazioni quotidiane sono sistemi transazionali o OLTP (Online Transaction Processing Systems). Questi sistemi sono ovviamente capaci di fornire reportistica, ma solo sui loro specifici dati. I sistemi BI usano l’approccio OLAP (Online Analytical Processing). Semplicemente, OLAP è un approccio per rispondere rapidamente a domande ad hoc eseguendo query analitiche multidimensionali su repository di dati organizzativi (ad esempio, data warehouse, data mart). OLAP utilizza i dati acquisiti da OLTP e OLTP automatizza i processi aziendali gestiti da decisioni supportate da OLAP.

Tabella 1 - Comparazione tra OLTP e OLAP (Sharda et al., 2015)

Criteri OLTP OLAP

Scopo Per svolgere le funzioni

aziendali quotidiane

Supportare il processo decisionale e fornire risposte a domande di business e gestionali

Fonte di dati Database transazionale (un

repository di dati

normalizzato focalizzato principalmente su efficienza e alla consistenza)

Data warehouse o data mart (un repository di dati non normalizzato

focalizzato principalmente

sull'accuratezza e completezza)

Reporting Reportistica di routine,

periodica e strettamente focalizzata

Reportistica e query ad hoc, multidimensionali e ampiamente focalizzate

Requisiti per le strutture di memorizzazione dei dati

Database relazionali ordinari Database multiprocessore, di grande capacità e specializzati Velocità di esecuzione Veloce (registrazione delle

transazioni di business e reportistica di routine)

Lenta (query complesse, ad alta intensità di risorse)

La struttura operativa principale in OLAP si basa su un concetto chiamato cubo. Un cubo in OLAP è una struttura di dati multidimensionale (reale o virtuale) che consente un'analisi rapida dei dati. Può anche essere definito come la capacità di manipolare e analizzare in modo efficiente i dati da più prospettive. La disposizione dei dati in cubi mira a superare una limitazione dei database relazionali: i database relazionali non sono adatti per l'analisi quasi istantanea di grandi quantità di dati. Invece, sono più adatti per manipolare i record (aggiunta, eliminazione e aggiornamento dei dati) che rappresentano una serie di transazioni. Sebbene esistano molti strumenti di scrittura di report per database relazionali, questi strumenti sono lenti quando è necessario eseguire una query multidimensionale che comprende molte tabelle di database. Utilizzando OLAP, un analista può navigare nel database e selezionare un particolare sottoinsieme dei dati (e la sua progressione nel

33

tempo) modificando gli orientamenti dei dati e definendo i calcoli analitici. Questi tipi di navigazione dei dati avviati dall'utente attraverso la specifica delle sezioni o “slices” (tramite rotazioni) e il drill- down / up (tramite aggregazione e disaggregazione) vengono talvolta chiamati "slice and dice".

Figura 7 - Slicing su cubo tridimensionale (Sharda et al., 2015) Le operazioni OLAP comunemente utilizzate sono le seguenti.

 Slice. Una sezione (slice) è un sottoinsieme di una matrice multidimensionale (in genere una rappresentazione bidimensionale) corrispondente a un singolo valore impostato per una (o più) dimensioni non presenti nel sottoinsieme. Una semplice operazione di taglio su un cubo tridimensionale è mostrata nella Figura 7.

 Dice. L'operazione dice è una sezione su più di due dimensioni di un cubo di dati.

 Drill down / up. Il drill down o up è una tecnica OLAP specifica in base alla quale l'utente naviga tra i livelli di dati che vanno dal più riepilogativo (in alto) al più dettagliato (in basso).

 Roll-up. Un roll-up comporta il calcolo di tutte le relazioni di dati per una o più dimensioni. Per fare ciò, potrebbe essere definita una relazione o formula computazionale.

 Pivot. Un pivot è un mezzo per modificare l'orientamento dimensionale di un report o della visualizzazione di una pagina di query ad hoc.

OLAP ha alcune varianti: esaminiamone le più comuni.

 ROLAP. ROLAP è l'acronimo di Relational Online Analytical Processing. ROLAP è un'alternativa alla tecnologia MOLAP (OLAP multidimensionale). Sebbene gli strumenti analitici ROLAP e MOLAP siano progettati per consentire l'analisi dei dati mediante l'uso di un modello di dati multidimensionale, ROLAP differisce in modo significativo in quanto non richiede il pre- calcolo e la memorizzazione delle informazioni. Al contrario, gli strumenti ROLAP accedono ai

34

dati in un database relazionale e generano query SQL per calcolare le informazioni al livello appropriato quando un utente finale lo richiede. Con ROLAP, è possibile creare tabelle di database aggiuntive (tabelle di riepilogo o aggregazioni) che riepilogano i dati in qualsiasi combinazione desiderata di dimensioni. Sebbene ROLAP utilizza come fonte un database relazionale, in genere tale database deve essere progettato con cura per l'uso con ROLAP. Un database progettato per OLTP non funzionerà bene come database ROLAP. Pertanto, ROLAP comporta comunque la creazione di una copia aggiuntiva dei dati.

 MOLAP. MOLAP (Multidimensional OLAP) è un'alternativa alla tecnologia ROLAP. MOLAP differisce significativamente da ROLAP in quanto richiede il pre-calcolo e la memorizzazione delle informazioni in un cubo, l'operazione nota come pre-elaborazione. MOLAP archivia questi dati in una array multidimensionale ottimizzato di memoria, piuttosto che in un database relazionale (che è spesso il caso di ROLAP).

 HOLAP. HOLAP (Hybrid Online Analytical Processing), è una combinazione di ROLAP e MOLAP. HOLAP consente di archiviare parte dei dati in un archivio MOLAP e un'altra parte dei dati in un archivio ROLAP. Il grado di controllo che il progettista del cubo ha su questo partizionamento varia da prodotto a prodotto.

Le “Analitiche”

Sebbene il termine venga usato talvolta come sinonimo di BI, per l’Institute for Operations Research and Management Science (INFORMS) “l'analitica rappresenta la combinazione di tecnologia

informatica, tecniche scientifiche di gestione e metodologie statistiche per risolvere problemi reali”

(Cochran, 2018). INFORMS ha proposto una classificazione delle analitiche secondo tre famiglie: analitiche descrittive, predittive e prescrittive (Cochran, 2018).

La Figura 8 mostra due rappresentazioni grafiche di questi tre livelli di analitiche. Una rappresentazione suggerisce che queste tre fasi sono in qualche modo indipendenti (gradini di una scala) e che un tipo di applicazione analitica porta a un'altra. La rappresentazione con i diagrammi di Venn suggerisce che in realtà ci sono alcune sovrapposizioni tra questi tre tipi di analitiche.

35

Figura 8 - Le tipologie di Analitiche secondo INFORMS (Sharda et al., 2015) Tassonomia delle analitiche (Sharda et al., 2015)

 Analitica descrittiva o di reporting L'analitica descrittiva o di reporting si riferisce alla conoscenza di ciò che sta accadendo nell'organizzazione e alla comprensione di alcune tendenze e cause sottostanti di tali eventi. Ciò comporta innanzitutto il consolidamento delle fonti di dati e la disponibilità di tutti i dati pertinenti in una forma che consenta un'adeguata comunicazione e analisi. Di solito lo sviluppo di questa infrastruttura di dati fa parte dei data warehouse. Da questa infrastruttura di dati possiamo sviluppare report e query utilizzando vari strumenti e tecniche di reporting. Una tecnologia significativa che è diventata un attore chiave in questo settore è la visualizzazione o Visual Analytics.

 Data Warehousing;  Business Reporting;

 Business Performance Management. Il termine Business Performance Management (BPM) si riferisce ai processi, alle metodologie, alle metriche e alle tecnologie utilizzati dalle imprese per misurare, monitorare e gestire le prestazioni aziendali. Il BPM – del quale sono sinonimi Corporate Performance Management (CPM), Enterprise Performance

36

Management (EPM), e Strategic Enterprise Management (SEM) – implica tre componenti (Sharda et al., 2015).

o Una serie di processi integrati di gestione e analisi (supportati dalla tecnologia) che affrontano le attività finanziarie e operative.

o Strumenti per definire obiettivi strategici e quindi misurare e gestire le prestazioni rispetto a tali obiettivi.

o Un insieme centrale di processi, tra cui pianificazione finanziaria e operativa, consolidamento e rendicontazione, modellizzazione, analisi e monitoraggio degli indicatori chiave di prestazione (Key Performance Indicators - KPI), collegati alla strategia organizzativa.

 Analitica predittiva. L'analitica predittiva mira a determinare cosa è probabile che accadrà in futuro. Questa analisi si basa su tecniche statistiche e su altre tecniche sviluppate di recente che rientrano nella categoria generale del data mining. Numerose tecniche sono utilizzate nello sviluppo di applicazioni analitiche predittive, inclusi vari algoritmi di classificazione come i modelli di alberi decisionali e le reti neurali. Possiamo anche utilizzare algoritmi di clustering e le tecniche di association mining.

 Data Mining;

 Predictive Modeling;  Big Data Analytics;

 Text Analytics, Text Mining, Sentiment Analysis;  Web Analytics, Web Mining, Social Analytics.

 Analitica prescrittiva. L'obiettivo dell'analitica prescrittiva è individuare sia cosa sta succedendo che le probabili previsioni e prendere decisioni per ottenere le migliori prestazioni possibili. Questo gruppo di tecniche è stato storicamente studiato sotto l'egida della ricerca operativa o delle scienze gestionali ed è stato generalmente mirato a ottimizzare le prestazioni di un sistema. L'obiettivo qui è fornire una decisione o una raccomandazione per un'azione specifica. Le decisioni possono essere utilizzate direttamente in un sistema di regole di decisione automatizzate (ad esempio, nei sistemi di tariffazione delle compagnie aeree). Pertanto, questi tipi di analisi possono anche essere definiti decisioni o analitiche normative.

 Model-Based Decision Making, Ottimizzazione e Analisi Multi-Criterio;  Simulazione ed Euristiche;

 Automated Decision Systems e Sistemi Esperti;  Knowledge Management e Sistemi Collaborativi.

Come conseguenza della tassonomia delle analitiche possiamo distinguere le competenze tra i data analyst e i data scientist. I primi sono gli esperti in analitiche descrittive, mentre i secondi sono gli esperti in analitiche predittive e prescrittive (Sharda et al., 2015).

37

Il rapporto tra DSS e BI

Abbiamo visto che sia DSS che BI sono concetti “ombrello”. Alcuni autori ritengono che la BI sia il successore dei DSS (Kopačkova & Skrobačkova, 2006): la BI è il risultato di una rivoluzione continua e, come tale, DSS è uno degli elementi originali di BI (Watson, 2005). Power (2002), invece, inserisce le applicazioni BI in un gruppo dei Data-driven DSS.

Di sicuro c’è uno sharing di componenti tra BI e DSS (Figura 9).

Figura 9 - Componenti dei sistemi BI e DSS (Kopačkova & Skrobačkova, 2006)

In Sharda et al., (2015) sono analizzate in dettaglio e comparate le caratteristiche dei sistemi BI e DSS.

1. Le loro architetture sono molto simili perché la BI si è evoluta da DSS. Tuttavia, la BI implica l'uso di un data warehouse, mentre DSS può o meno disporre di tale funzionalità.

La BI è quindi più appropriata per le grandi organizzazioni (poiché i data warehouse sono costosi da costruire e mantenere), ma un DSS può essere appropriato per qualsiasi tipo di organizzazione.

2. La maggior parte dei DSS è costruita per supportare direttamente il processo decisionale specifico. I sistemi di BI, in generale, sono orientati a fornire informazioni accurate e tempestive e supportano indirettamente il decisore. Questa situazione sta cambiando, tuttavia, poiché sempre più strumenti di supporto decisionale vengono aggiunti ai pacchetti software BI.

3. La BI ha un orientamento esecutivo e strategico, in particolare nei suoi componenti BPM e dashboard. DSS, al contrario, è orientato verso gli analisti.

4. La maggior parte dei sistemi di BI è costruita con strumenti e componenti disponibili in commercio adatti alle esigenze delle organizzazioni. Nel costruire i DSS, l'interesse potrebbe

38

essere nella risoluzione di problemi molto non strutturati. In tali situazioni, potrebbe essere necessaria una maggiore programmazione (ad es. utilizzando strumenti come Excel) per personalizzare le soluzioni.

5. Le metodologie DSS e persino alcuni strumenti sono stati sviluppati principalmente nel mondo accademico. Le metodologie e gli strumenti di BI sono stati sviluppati principalmente dalle società di software.

6. Molti degli strumenti utilizzati dalla BI sono anche considerati strumenti DSS. Ad esempio, il data mining e l'analisi predittiva sono strumenti fondamentali in entrambe le aree.

Un'altra possibile modalità di analisi per comprendere il rapporto tra DSS e BI è situare i due sistemi rispetto a un modello del processo decisionale.

Figura 10 - Il processo decisionale secondo Simon (1977) (Sharda et al., (2015)

Secondo Simon (1977), il processo decisionale passa attraverso quattro fasi che non sono necessariamente sequenziali. Queste fasi sono Intelligence, Progettazione (Design) e Scelta (Choice) e Implementazione. L'Intelligence è la fase di raccolta delle informazioni in cui viene identificato un problema ovvero una opportunità. La Progettazione è quando viene delineata una serie di possibili soluzioni per affrontare il problema identificato o utilizzare una possibile opportunità. Infine, la Scelta

39

è quando una delle soluzioni progettate viene selezionata per l'implementazione (Crawford, 1997). In

Figura 10 è riportato il modello di processo decisionale di Simon (1977).

In Poleto et al. (2015) viene proposto un Modello Integrato di Supporto alle Decisioni basato sul modello del processo decisionale di Simon (1977) nel quale la BI è collocata nella fase di Intelligence (e di Implementazione), mentre il DSS in quelle di Progettazione e Scelta (Figura 11).

Figura 11 - Modello Integrato di Supporto alle Decisioni (Poleto et al., 2015)

Documenti correlati