• Non ci sono risultati.

CASE STUDY

gura 4.8 Tabella dati per il grafico Waterfall

4.5 RISULTATI E ANALIS

Cerchiamo in questa parte del capitolo di riassumere tutti i risultati ottenuti dalle varie applicazioni dei modelli e di trarne delle conclusioni. Dopo aver trattato i dati a nostra disposizione ed averli aggregati per prodotto, le prime misure che emergono sono lo

scostamento assoluto (che abbiamo usato per costruire il grafico Waterfall), quello percentuale che fornisce la medesima informazione del precedente ma in una forma più

leggibile, lo scostamento medio durante l’anno per ogni prodotto e la deviazione standard. Tutte queste misure sono leggibili alla base di ogni tabella riassuntiva come in figura 4.6 del

- 108 -

paragrafo 2 del presente capitolo. Il loro calcolo è semplice e immediato e riportano importanti caratteristiche sulla consistenza dei dati.

Per quanto riguarda la deviazione standard, che ci dà una misura di affidabilità della media del campione indicando come sono distribuiti i dati in esso, tutti i valori ottenuti sono riassunti nella seguente tabella, che altro non è che una sottotabella di quella ottenuta con la macro descritta nel paragrafo 4.3.1 di questa tesi:

2010 2011 ID Descrizione Scostamento Medio Deviazione Std Scostamento Medio Deviazione Std 1 Coffee Amaretto:Regular -63,3 30,2 -14,3 51,3 2 Coffee Columbian:Regular -363,8 145,5 -141,9 300,1

3 Coffee Decaf Irish Cream:Decaf -254,3 81,2 -145,1 151,7

4 Espresso Caffe Latte:Regular 190,8 58,1 255,8 97,3

5 Espresso Caffe Mocha:Regular -63,6 57,2 88,9 147,1

6 Espresso Decaf Espresso:Decaf 31,7 37,1 171,8 114,6

7 Espresso Regular Espresso:Regular 36,7 15,1 80,9 47,6

8 Herbal Tea Chamomile:Decaf 420,8 82,8 557,4 153,6

9 Herbal Tea Lemon:Decaf 650,5 134,5 818,3 194,4

10 Herbal Tea Mint:Decaf 276,7 53,6 339,2 76,7

11 Tea Darjeeling:Regular 593,3 132,9 722,7 180,0

12 Tea Earl Grey:Regular 601,7 119,3 721,0 162,7

13 Tea Green Tea:Regular 282,9 56,7 342,9 84,9

Dall’analisi di questi risultati si capisce che abbiamo medie più affidabili durante l’anno 2010 mentre l’anno successivo peggiorano tutte. Per esempio per il prodotto Coffee Columbian:Regular arriva addirittura a 300: questo significa che c’è moltissima volatilità del campione.

Per quanto riguarda invece i risultati dell’analisi degli scostamenti per prodotto abbiamo trovato nel grafico Waterfall un valido alleato per vedere quali prodotti sono più o meno responsabili dello scostamento finale. I prodotti che dobbiamo analizzare meglio sono i prodotti 8, 9, 11 e 12. Sono tutte miscele di tè e il segno dello scostamento è positivo. Questo deve farci arrivare alla conclusione che probabilmente dovremmo investire meglio su questa tipologia di miscela dal momento che i dati a consuntivo sono sempre maggiori rispetto a quelli a budget.

Analizzando il grafico dell’analisi degli scostamenti per area, la prima cosa che risalta è come tutte e quattro le aree abbiano scostamenti positivi per entrambi gli anni. Se andiamo ad

- 109 - analizzare l’entità dello scostamento risultano più precise le previsioni che vengono fatte sul mercato del sud e quello centrale sia per l’anno 2010 che per il 2011: sono due dimensioni ben conosciute dall’azienda che non presentano particolari fluttuazioni impreviste, anche se per il secondo anno lo scostamento per il mercato centrale aumenta di più del doppio. Per le restanti aree invece si verificano scostamenti più consistenti seppur di segno positivo. Il mercato di cui prevediamo meno l’andamento è quello dell’ovest. Il consiglio è quello di investire di più su questo mercato che evidentemente è sottovalutato dall’azienda, la quale prevede valori nettamente inferiori a quelli che si verificano a consuntivo.

Inoltre rimanendo sempre a questo livello di analisi, prima di passare ad applicare i modelli di data mining, osservando i dati aggregati per prodotto a livello di budget si può notare che i dati per l’anno 2011 sono i medesimi di quelli dell’anno precedente. A tal proposito, nel primo capitolo abbiamo introdotto i modelli di smorzamento esponenziale che servono a rimuovere il rumore dalle serie temporali al pari del metodo della media mobile. La formula che lo descrive è la seguente:

%&!= ' % + 1 − ' %

dove ' è la costante di livellamento ovvero indica il tasso di apprendimento, la velocità con cui impariamo osservando quello che accade a consuntivo. Più grande è e più velocemente stiamo imparando dall’ambiente circostante.

Applicato ai nostri dati, dal momento che i valori a budget sono gli stessi per entrambi gli anni di osservazione, significa che chi si è occupato del budget delle vendite ha usato un α=0. Più precisamente il valore previsto per l’anno successivo è quello che avevano previsto nel 2009 per il 2010. Questa è una dichiarazione di ferma conoscenza: si è convinti che nel lungo periodo le oscillazioni si compenseranno e il risultato sarà quello che prevedo costantemente. Ma questo non si addice per nulla a fenomeni come l’andamento delle vendite. Anzi, bisogna osservare quello che si sta verificando durante l’anno anche per eventualmente migliorare la previsione in corso d’opera tramite l’applicazione di modelli feed-forward.

Quello che consigliamo in questo caso è applicare α molto alto in modo da studiare l’andamento delle vendite con la mente più aperta possibile, essendo veloci nell’apprendimento. Successivamente, quando si inizia ad accumulare l’esperienza si può abbassare mano a mano in modo da mettere in pratica quello che stiamo imparando durante l’osservazione, ma mai troppo perché le aziende sono inserite in un ambiente fortemente mutevole.

- 110 -

Proseguiamo con l’analisi dei risultati del nostro esercizio e confrontiamo la bontà dei vari modelli applicati alla nostra serie storica, che sono stati riassunti nella tabella di seguito:

Modello applicato R2

Regressione Lineare 0,197

Autoregressione di ordine 1 0,155

Autoregressione di ordine 4 0,374

Autoregressione di ordine 12 -32,565 Media mobile di ordine 3 + R.Lineare 0,199 Media mobile di ordine 4 + R.Lineare 0,23 Media mobile di ordine 6 + R.Lineare 0,463

Il miglior modello di tutti è risultato dall’aver applicato prima una media mobile di ordine 6 alla serie, per togliere il ciclo stagionale, e poi un modello di regressione lineare per far emergere il trend di lungo periodo. In questo modo otteniamo un R2 di 0,463 il più alto di tutti. Tale modello spiega il 46,3% della variazione delle vendite. Se volessimo prevedere le vendite per il 25 mese (Gennaio 2012) basterebbe applicare la seguente formula e sostituire al mese 25:

4dmUc4$z = 33083,5570175 + 81,5008772 ∗ 25 = 35121,07895

E così via per ogni mese successivo.

Infine il giudizio sul software Orange è complessivamente molto positivo. Risulta essere semplice ed intuitivo anche a chi non ha familiarità con gli strumenti di analisi per data mining. È perfetto per chi non ha conoscenza dei linguaggi di programmazione e si adatta perfettamente alle esigenze di chi non è data miner di professione, ma che comunque deve analizzare grandi quantità di dati. Risulta essere perciò l’ideale per chi svolge attività di controllo di gestione.

- 111 -

CONCLUSIONI

In un mondo in cui esiste una disponibilità d’informazioni che non ha precedenti, il data mining si rivela sempre più uno strumento decisivo e indispensabile per le aziende che possono così cogliere segnali chiari in un ambiente complesso e caotico. I dati sono a pieno titolo una risorsa delle aziende e perciò bisogna dedicargli i giusti investimenti affinché si possa ottenere il meglio da essi.

Nel corso della tesi abbiamo dimostrato come la ricerca non si limiti alla conoscenza di un insieme di algoritmi: per raggiungere la padronanza delle tecniche di data mining bisogna porsi alcune domande ed integrare con un’analisi delle informazioni.

Nel futuro sarà necessario anche affrontare e risolvere questioni spinose come la privacy, la proprietà dei dati e il loro uso proprio o improprio. Il trade-off fra la privacy e il migliorare le decisioni di business genera una tensione molto alta proprio perché sembra ci sia una relazione diretta fra l’aumento dei dati personali dei clienti e l’aumento dell’efficacia delle decisioni aziendali.

Un tempo la Business Intelligence era strutturata solo per i dati numerici, ma adesso può operare anche su dati testuali e perciò può lavorare su tutta l’ampiezza dei dati aziendali. Le sue metodologie sono in costante evoluzione e si proverà a concentrarci sull’inclusione di diverse fonti di informazione come ad esempio le notizie dei quotidiani oppure come l’aggiunta delle informazioni derivanti dai social media, che sono sempre più un’importante fonte d’influenza nella vita aziendale.

Dal punto di vista aziendale si è visto come le metodologie di data mining possono essere molto utili per la pianificazione, la programmazione e per il controllo gestionale. Per implementare e mettere a punto con successo un progetto di data mining è necessaria una soluzione software che permetta all’utente di svolgere tutti i passi del processo analizzato nel primo capitolo della tesi. Il software che abbiamo usato durante l’esercizio pratico risulta

- 112 -

essere molto utile ed è adatto perché può essere usato da utenti con diversi gradi di esperienza in capo statistico: la parte con interfaccia grafica è di facile utilizzo e molto intuitiva, senza perdere per questo la potenza che viene richiesta ad un software che si occupa di data mining.

Naturalmente, come già detto, non è sufficiente che il software sia a disposizione: bisogna piuttosto le persone lo usino perché ne capiscano il valore aggiunto e non perché devono farlo.

Bisogna infine considerare i limiti del data science e dell’analisi dei dati a supporto del processo decisionale: ci sono cose che i computer fanno meglio delle persone ma esiste anche la casistica contraria. Per esempio gli esseri umani sono più bravi nell’individuare in un set piccolo informazioni da riutilizzare in una determinata attività, mentre i computer lavorano meglio su enormi quantità di dati. Il processo di data mining descritto nel primo capitolo mette in luce come sia necessaria la combinazione di entrambi per ottenere il miglior risultato: la struttura imposta al processo prevede che siano le persone a selezionare le attività, il che garantisce che l’applicazione di metodi scientifici sia rivolta ai giusti task. La conoscenza e il buonsenso aggiungono valore alla scelta dei dati da analizzare. Infine l’interazione umana è anche fondamentale nella fase di valutazione dei modelli.66

Conoscere le tecniche di data mining non è un’abilità richiesta a chi si occupa di controllo di gestione, ma si ritiene che un controller che padroneggi tali tecniche abbia dei vantaggi e possieda capacità superiori nell’analizzare i dati rispetto ad altri colleghi.

66

RINGRAZIAMENTI

Tutte le persone citate in questa pagina hanno svolto un ruolo fondamentale nella stesura della tesi, ma desidero precisare che ogni errore o imprecisione è imputabile soltanto a me.

Desidero ringraziare per primo il professor Nicola Ciaramella, relatore di questa tesi, per la disponibilità e la cortesia dimostratemi, per tutto il tempo che mi ha dedicato e per l’aiuto fornito durante il lavoro di stesura. Senza il suo supporto e la sua guida questa tesi non esisterebbe.

Un ringraziamento ai miei genitori per il sostegno che mi hanno dato e gli infiniti incoraggiamenti durante questi mesi (anni) di preoccupazioni e ansie. Siete e rimarrete il mio punto di riferimento.

Un ringraziamento a tutte le amiche di studio con le quali ho condiviso questo percorso e che mi hanno accompagnato sia nei momenti difficili che in quelli felici. Grazie per tutti i consigli e i dubbi risolti insieme durante i nostri gruppi. L’unione fa la forza davvero.

L’ultimo ringraziamento va alla mia roccia, il mio migliore amico e compagno Marco. Grazie per tutta la forza che mi hai trasmesso e la pazienza che mi hai dimostrato nei momenti più difficili. Qualunque percorso, qualunque destinazione: è un piacere camminare a fianco a te.

BIBLIOGRAFIA

BERRY M. J. A., LINOFF G. S., Data Mining Techniques for Marketing, Sales, and Customer Relationship Management, Wiley Publishing, Inc., 2004

BERRY M. J. A., LINOFF G. S., Data Mining: l’Azienda Intelligente e la Gestione Strategica delle Informazioni, Apogeo, 2001

DEL CIELLO N., DULLI S., SACCARDI A., Metodi di Data Mining per il Customer Relationship Management, Franco Angeli, 2010

FLORIA G., Excel per il Controllo di Gestione, Tecniche Nuove, 2013

GIUDICI P., Data Mining: Metodi Statistici per le Applicazioni Aziendali, McGraw-Hill, 2001

MARASCA S., MARCHI L., RICCABONI A., Il Controllo di Gestione: metodologie e strumenti, Knowita, 2013

MERCHANT K. A ., RICCABONI A., Il Controllo Di Gestione, McGraw-Hill, 2001

MODINA S., Pianificazione, Controllo e Reporting nell’Aspetto Economico della Gestione, G. Giappichelli Editore, 1998

PROVOST F., FAWCETT T., Data Science for Business, O’Reilly, 2013

RAUSCH P., SHETA A.F., AYESH A., Business Intelligence And Performance Management, Springer-Verlag London, 2013

ROFFIA P., Strumenti di Pianificazione, Controllo e Reporting Direzionale, G. Giappichelli Editore, 2003

ROIGER R.J., GEATZ M.W., Introduzione al Data Mining, McGraw-Hill, 2004

VERCELLIS C., Business Intelligence: Modelli Matematici e Sistemi per le Decisioni, McGraw- Hill, 2006, p.80

Sitografia

http://www.bistrategy.it/app_bi_origini_definizione.aspx https://www.charteredaccountantsanz.com/- /media/369b705a6faf43478bc45d49316c4290.ashx http://blog.biolab.si/2016/06/10/scripting-with-time-variable/ http://businessfinancemag.com/planning-budgeting-reporting/automated-budgeting- forecasting-and-business-intelligence-manufacturing http://kfknowledgebank.kaplan.co.uk/KFKB/Wiki%20Pages/Beyond%20Budgeting.aspx http://steve.maraspin.net/resources-dl/Data_Warehousing.pdf http://tdan.com/data-mining-on-a-budget/5343 https://excel.officeacademy.it/3766/excel-cosa-deviazione-standard-come-calcolarla-excel/ https://support.office.com/it-it/article/Assegnare-una-macro-a-una-maschera-o-un-pulsante- di-controllo-d58edd7d-cb04-4964-bead-9c72c843a283?ui=it-IT&rs=it-IT&ad=IT

Articoli

Janez Demšar and Blaž Zupan, ORANGE: DATA MINING FRUITFUL AND FUN, University of Ljubljana, Faculty of Computer and Information Science Tržaška 25, 1000 Ljubljana, Slovenia

Stajdohar M., Demsar J., Interactive Network Exploration with Orange, Journal of Statistical Software, 2013, pp. 3-6