I sistemi informativi hanno lo scopo di supportare le persone che svolgono attività per cui è necessaria una certa quantità di informazioni, qualsiasi sia il livello operativo. Gli operai di produzione avranno bisogno dei dati provenienti dall’attività di pianificazione della produzione per eseguire i cicli di lavoro, così come gli impiegati negli acquisti avranno bisogno delle anagrafiche dei fornitori e degli articoli per creare gli ordini di acquisto. Anche a livello direzionale c’è l’esigenza di avere una base di dati che permetta l’attività di analisi e reporting ad esempio per fare delle previsioni di vendita o per studiare delle strategie di sourcing. Anthony (1965) ha definito il concetto di esigenza informativa in funzione del tipo di attività svolta distinguendo tre livelli: operativo, tattico e strategico (vedi Figura 17). A livello operativo sono necessari dati di dettaglio e in tempo reale per garantire lo svolgimento delle attività; a livello tattico sono necessari dati più aggregati e periodici per l’attività di reporting per il controllo direzionale; in cima alla piramide, a livello strategico, sono necessarie informazioni di sintesi, molto aggregate e fornite occasionalmente, per analisi strategiche da parte degli alti livelli direzionali.
44
Le attività strategiche necessitano di informazioni sintetiche e con una buona profondità temporale; hanno la caratteristica di essere poco strutturate e finalizzate ad attività di analisi degli stakeholder, degli scenari e PEST, e al decisore è lasciata ampia discrezionalità sull’interpretazione dei dati. Questo significa che la base di dati dovrà essere strutturata in modo da rendere efficaci le interrogazioni, l’aggregazione di dati, le ricerche per area tematica, l’analisi
multidimensionale e il data mining7. Questi sistemi dono definiti informazionali e sono
generalmente organizzati in una o più data warehouse.
Le attività tattiche riguardano la definizione di obiettivi di breve termine, il controllo direzionale e il controllo di processo. L’esigenza informativa è generalmente relativa a report estratti direttamente dai dati operativi strutturati e con cadenza periodica.
Sulla base della piramide troviamo tutte quelle informazioni necessarie al funzionamento delle attività operative come lo scheduling della produzione, gli ordini d’acquisto, i dati di vendita o le fatture. I dati sono molto strutturati e routinari ed hanno una scarsa profondità temporale perché si tratta di informazioni sempre aggiornate e quindi costantemente sovrascritte. Questi sistemi sono detti operazionali e sono progettati in database la cui funzione principale è la lettura e scrittura di tutte le transazioni informative: questi dati vanno ad alimentare i sistemi informazionali (Figura 18).
Figura 18 - Sistema operazionale e sistema informazionale
7 Il data mining è l’insieme delle tecniche di estrazione di conoscenza tramite algoritmi avanzati di elaborazione
dati che permettono di trovare correlazioni nascoste che non sarebbero altrimenti evidenziate dalle interrogazioni tradizionali.
45
Ai due sistemi sono chieste funzioni e prestazioni diverse: se ai sistemi operazionali è richiesta una certa coerenza dei dati, per i data warehouse le ridondanze sono utili per migliorare la velocità di lettura dei dati, così come la velocità di scrittura è una prerogativa principalmente dei database operazionali. Si dice che i sistemi operazionali fanno parte della famiglia degli On Line Transaction
Processing (OLTP) perché sono specializzati nel gestire una grande quantità di transazioni
provenienti da molti utenti. I sistemi informazionali, invece, sono detti strumenti OLAP (On Line
Analytical Processing) in quanto finalizzati all’analisi multidimensionale. La loro funzione
principale è garantire buone prestazioni in fase di interrogazione e analisi dei dati. Una comparazione tra i sistemi (12) è visibile in Tabella 4.
Caratteristica OLTP OLAP
Finalità Supporto operativo Supporto alle decisioni
Utenti Molti, operativi Pochi, direzionali
Dati Analitici, puntuali Sintetici
Modalità di utilizzo Guidata Interrogazioni ad hoc
Quantità di dati Bassa Alta
Orientamento Per processo o applicazione Per area tematica
Frequenza di aggiornamento Continua, tramite azioni Sporadica, tramite funzioni esplicite
Copertura temporale Dati correnti Dati storici
Ottimizzazione Per accessi in lettura e scrittura su una porzione del DB
(normalizzazione)
Per accessi in lettura e interrogazioni su tutto il DW (denormalizzazione e multidimensionalità)
Tabella 4 - Comparazione tra sistemi OLAP e sistemi OLTP
Sistemi OLAP
I sistemi informazionali sono progettati in modo da facilitare l’attività di analisi; la rappresentazione più adatta a questa funzione è quella del modello multidimensionale in quanto strutturato per argomenti (fatti) anziché per relazioni tra tabelle come nel caso dei modelli entità- relazione: questa caratteristica rende più leggibili le informazioni di sintesi. Il modello multidimensionale è rappresentato da un ipercubo, i cui gli spigoli sono gli attributi di un determinato fatto, e i valori degli attributi sono le coordinate di una precisa istanza del fatto stesso. Per esempio, se volessimo rappresentare il fatto spesa per acquisti, identificata dalle tre
46
dimensioni Fornitore, Categoria merceologica (Commodity) e Area strategica d’affari da dove è stata effettuata la spesa (Business Unit), avremmo un ipercubo come quello di Figura 19. Un ipercubo con queste caratteristiche è comunemente conosciuto come Spend Cube in quanto, come già suggerisce il nome, descrive la spesa per gli acquisti in funzione degli attributi di spesa appena definiti. Le dimensioni possono essere diverse da quelle indicate: per esempio è spesso utilizzato l’attributo Data oppure Centro di Costo al posto di Business Unit. In realtà il cubo multidimensionale può avere ben più di tre dimensioni ma, per comodità di illustrazione, se ne utilizzano tre per volta.
Figura 19 - Spend Cube: esempio di ipercubo
La progettazione del data warehouse può essere sviluppata attraverso un approccio relazionale (ROLAP), puramente multidimensionale (MOLAP) oppure ibrido (HOLAP). In una struttura di tipo ROLAP i dati sono memorizzati su un’architettura relazionale, cioè seguendo il modello entità/relazione e le interrogazioni vengono realizzate tramite query SQL standard. Adottare questo approccio riduce lo spazio di archiviazione rispetto agli altri modelli a fronte di svantaggi come la poca efficienza nelle interrogazioni e una scarsa attitudine nell’elaborazione di
query complesse.
L’approccio MOLAP permette di memorizzare i dati su dei vettori che costituiscono la struttura multidimensionale, organizzata per fatti e non per entità/relazioni. Questo implica che, per identificare un’istanza, bisogna fornire tutte le coordinate che descrivono il fatto: questo
47
comporta lo svantaggio di un uso maggiore dello spazio di archiviazione ma vantaggi in termini di semplicità e velocità di accesso oltre alla possibilità di eseguire delle query complesse.
Il modello HOLAP è una via di mezzo tra i due appena descritti in quanto i dati sono memorizzati in tabelle relazionali ma le aggregazioni vengono invece fatte su tabelle multidimensionali attraverso data mart tematici. È un’architettura di nuova concezione e combina la velocità d’accesso del MOLAP e la semplicità di sviluppo del ROLAP. Una panoramica sulle caratteristiche dei tre sistemi è illustrata in Figura 20.
Figura 20 - Caratteristiche ROLAP, HOLAP e MOLAP
I data warehouse sono concepiti principalmente per gestire una grande quantità di dati dalla quale estrarre una ampia varietà di informazioni. Gli utenti che usano questi strumenti non sempre hanno competenze informatiche avanzate e l’accesso alle informazioni, pertanto, deve essere intuitivo. La fruizione di questi contenuti è possibile grazie alle analisi OLAP le quali permettono l’esplorazione degli ipercubi attraverso procedure logiche e guidate. Le analisi di questo tipo necessitano di un’idea chiara su cosa si vuole chiedere alla base di dati perché l’estrazione potrà solamente confermare o smentire una determinata ipotesi formulata sotto
48
forma di query. Altri sistemi di esplorazione dei dati, come gli strumenti di mining, permettono di individuare correlazioni o informazioni nascoste che non è possibile prevedere a priori.
Ogni passaggio di analisi che l’utente svolge sul cubo multidimensionale corrisponde ad un operatore OLAP specifico. I più usati sono:
➢ drill down, permette di “scavare” a fondo per ottenere informazioni più dettagliate partendo da dati a più alta granularità. Questa operazione è possibile aggiungendo un attributo alla dimensione di dati e scendendo lungo una gerarchia (Figura 21);
➢ roll up, è l’operatore che aggrega i dati per ottenere informazioni più sintetiche. Si comporta in modo del tutto speculare al drill down, nel senso che sarà sufficiente risalire la gerarchia di una dimensione, o eliminare un attributo, per ottenere informazioni aggregate (Figura 21);
Figura 21 - Operatori di drill down e roll up
➢ slice, significa “affettare” l’ipercubo lungo una sola dimensione di analisi ottenendo un focus specifico per una determinata caratteristica. Il concetto è facilmente intuibile dall’illustrazione di Figura 22;
➢ dice, considera una porzione di ipercubo limitando almeno due dimensioni. Viene sostanzialmente selezionato un sotto cubo all’interno di quello generale (Figura 22);
49
Figura 22 - Esempi di slicing e dicing
➢ pivot, ruota l’ipercubo per avere una vista migliore dei dati che interessano.
I campi d’applicazione dei sistemi informazionali sono tra i più svariati: sono utilizzati dal
marketing per monitorare e fare previsioni sulle vendite così come vengono utilizzati dalla customer care per analizzare i rapporti con i clienti. Non mancano applicazioni nel campo del procurement in quanto sono strumenti utili per analizzare la spesa dell’azienda e individuare
opportunità di miglioramento.
Sistemi OLTP
I sistemi operazionali sono la fonte di dati da cui si alimentano i sistemi informazionali e permettono di raccogliere e gestire una grande quantità di dati, provenienti da tutte le aree aziendali. Molti di questi sistemi si interfacciano all’utente tramite dei software specifici che permettono un accesso semplice e immediato alla piattaforma al fine di supportare o automatizzare le attività più ripetitive. Fino a poco più di venti anni fa, i sistemi informativi erano
50
progettati per essere specializzati nelle operazioni di supporto alle specifiche aree aziendali e quindi ogni funzione era fornita del proprio database e della propria interfaccia utente. I sistemi così sviluppati sono detti ad isole informatiche autonome e sono implementati con soluzioni ad- hoc (sistemi legacy), con il vantaggio di avere una piattaforma informativa modellata sulle specifiche esigenze dell’azienda o della funzione aziendale. Tuttavia la forte specificità di queste soluzioni comportava grossi svantaggi a causa della loro eterogeneità tra le diverse aree operative dell’azienda, impedendo agli utilizzatori di avere una visione complessiva e integrata delle informazioni. Questo significa che gli stessi dati sono memorizzati nei diversi database funzionali senza la possibilità di comunicare tra loro.
Con l’inizio del nuovo millennio hanno iniziato a diffondersi i primi sistemi di Enterprise
Resource Planning (ERP), soluzioni capaci di superare il problema dell’integrazione delle isole di
automazione e quello della frammentazione della base di dati, unificando le fonti in un unico database al quale accedono tutte le varie aree operative dell’azienda. I sistemi ERP permettono anche di automatizzare tutte quelle attività ripetitive che non danno valore aggiunto, lasciando le operazioni più complesse agli utenti. Il fatto di avere tutti i dati raccolti in un’unica fonte comporta l’accesso simultaneo, da parte di diversi utilizzatori, agli stessi dati in modo integrato e completo. Nella Figura 23 è illustrato un esempio di architettura di data warehousing a due livelli in cui è possibile distinguere tre aree di elaborazione:
➢ a sinistra, l’area operativa dove vengono raccolti e immagazzinati tramite ERP i dati provenienti dalle diverse attività;
➢ al centro, il sistema di estrazione dati che ha la funzione di estrarre, trasformare e caricare i dati nel data warehouse tramite gli strumenti di ETL (Extract, Transform and
Load);
➢ sulla destra, l’area relativa all’ambiente informazionale costituita dal data warehouse centrale e dai data mart tematici da cui vengono estratti i dati per le analisi OLAP. La sezione dedicata alle sorgenti, sulla sinistra, è il primo livello dell’architettura, mentre il secondo livello è identificato dalla sezione che contiene il data warehouse e i data mart. Esistono anche sistemi a tre livelli in cui il terzo livello è posto tra le sorgenti e il data warehouse nell’area predisposta all’estrazione, trasformazione e caricamento dei dati (ETL). Questo livello intermedio prende il nome di staging area e ha la funzione di salvare temporaneamente i dati durante l’estrazione, prima di popolare il data warehouse.
51
Figura 23 - Architettura del sistema operazionale-informazionale a due livelli
L’ERP ha quindi anche il vantaggio di interfacciarsi con le altre funzioni aziendali permettendo l’accesso alla base di dati tramite delle viste, le quali permettono all’utente di vedere e interagire solo con i dati che gli interessano. I sistemi ERP, infatti, sono implementati per moduli e ogni modulo è destinato ad una funzione diversa ma conservando comunque la caratteristica di potersi interfacciare con gli altri moduli in modo completamente automatizzato e integrato. I moduli più utilizzati sono:
➢ amministrazione e contabilità, si occupano della stesura del bilancio aziendale, della registrazione dei movimenti contabili, della gestione delle fatture e del controllo di gestione;
➢ logistica, si occupa della gestione dei magazzini, della movimentazione delle merci, della codifica degli articoli;
➢ vendite, ha la funzione di definire le caratteristiche commerciali dei prodotti e dei clienti, così come gestire gli ordini di vendita e le fatture;
52
➢ acquisti, fornisce supporto per le attività di gestione dei fornitori, gestione degli ordini d’acquisto, ricezione dei materiali e fatturazione passiva;
➢ produzione, permette di definire i cicli di lavoro, la pianificazione della produzione, la preventivazione e consuntivazione dei costi di produzione.
È chiaro che le funzionalità che interessano al procurement sono prevalentemente concentrate nel modulo acquisti in quanto esso costituisce la base di informazioni per gestire i rapporti con i fornitori, compresi le condizioni di fornitura e i listini, la gestione delle categorie merceologiche e le strategie di fornitura, e permette anche di studiare la spesa complessiva dell’azienda grazie a tutti i dati provenienti dagli ordini di acquisto.