• Non ci sono risultati.

Tale tempestività, tuttavia, a volte contrasta con la mole dei dati da elaborare per estrarre le informazioni necessarie a supportare il processo decisionale

N/A
N/A
Protected

Academic year: 2021

Condividi "Tale tempestività, tuttavia, a volte contrasta con la mole dei dati da elaborare per estrarre le informazioni necessarie a supportare il processo decisionale"

Copied!
4
0
0

Testo completo

(1)

INTRODUZIONE

Negli ultimi decenni il ciclo di vita dei processi decisionali nelle aziende è andato accorciandosi sempre più. La tempestività nell’individuare nuovi segmenti di mercato, nello scoprire preferenze e comportamenti da parte di clienti, nel ridurre eventuali sprechi nella produzione o nel razionalizzare altri processi aziendali, è diventata vitale per la sopravvivenza delle aziende. Tale tempestività, tuttavia, a volte contrasta con la mole dei dati da elaborare per estrarre le informazioni necessarie a supportare il processo decisionale. I dati sono spesso difficilmente recuperabili perché sommersi nell’insieme di informazioni ospitate dal sistema informativo. Il ricorso alle tecnologie dell’informazione è quindi un passo obbligato. Con il termine Business Intelligence (BI) si suole indicare l’insieme dei processi, delle tecniche e degli

strumenti basati sulla tecnologia dell’informazione, che supportano i processi decisionali di carattere economico. Il problema fondamentale nel BI è quello di disporre di sufficienti informazioni in modo tempestivo e fruibile e di analizzarle cosicché da poter avere un impatto positivo sulle strategie, le tattiche e le operazioni aziendali. Le informazioni possono riguardare la specifica impresa oppure situazioni più generali di mercato, o ancora la concorrenza (competitive intelligence). Nel BI è possibile individuare tre attività importanti: raccolta dei dati, analisi dei dati e proposta di consigli.

Per quanto riguarda l’attività di raccolta dei dati è importante che questa non si limiti ai soli dati transazionali, generati e usati nei processi produttivi o operativi di un’impresa (processi di più basso livello), ma che sia orientata anche ai dati decisionali (o business data), caratterizzati da una natura aggregata, una struttura

flessibile, un uso non ripetitivo, un orizzonte temporale ampio, e una proprietà di staticità (Inmon, 1992). L’idea alla base del concetto di data warehouse (DW) è che le esigenze dei processi operativi sono completamente diverse da quelle dei processi decisionali, e quindi i sistemi informativi utilizzati in ambito operativo devono essere distinti da quelli adoperati in ambito decisionale (Kimball, 1996). Il DW è quindi un ambiente specializzato a sé stante, in cui far periodicamente convergere tutti i dati utili ai processi decisionali, prelevandoli dai dati di produzione, eventualmente arricchendoli con dati provenienti da fonti esterne (internet, banche dati, etc.), e infine

(2)

organizzandoli in una forma comprensibile per chi in azienda deve prendere decisioni tattiche e/o strategiche.

I DW sono spesso considerati un buona tecnologia per supportare soluzioni di knowledge discovery in databases (KDD). Questo è il processo di esplorazione e

analisi di grandi quantità di dati, condotto in modo automatico o semiautomatico, al fine di scoprire delle regolarità (pattern) nei dati, che siano considerabili nuovi elementi di conoscenza (Fayyad et al., 1996). Tale processo prevede, fra l’altro, delle fasi di selezione e pulizia dei dati, al fine di rimuovere inconsistenze, trattare dati mancanti, e determinare il giusto livello di aggregazione. Tutto ciò è già assicurato da un DW, che diventa quindi una tecnologia di supporto al KDD.

In un contesto aziendale, la conoscenza scoperta può avere un valore perché consente di aumentare i profitti riducendo i costi oppure aumentando le entrate.

Questo spiega l’importanza di soluzioni KDD nel BI. Il processo KDD include la fase di data mining (DM), consistente nell’applicazione di particolari algoritmi di analisi dei dati e tema principale di questa tesi.

Il concetto di data mining – letteralmente “estrazione di dati” – nasce dall’esigenza di coniugare esperienze procedurali diverse provenienti da vari ambiti disciplinari, quali l’informatica e la statistica, al fine di ricercare ed individuare relazioni prima sconosciute dall’esplorazione di ingenti quantità di informazioni. Esso include una varietà di significati che sono mutati nel corso della sua evoluzione: a volte è stato usato allo scopo di indicare tecniche per il trattamento statistico dei dati;

altre volte per definire l’intero percorso che va dalla raccolta delle informazioni alla loro sistemazione sotto forma di database o di data warehouse.

L’ambito di applicazione per eccellenza del data mining è il marketing aziendale, cui è demandato il compito di approntare le strategie più efficaci per aumentare le quote di mercato. Dal momento che l’attività è finalizzata a ottenere dei vantaggi da un punto di vista meramente economico, l’attenzione è rivolta, in molti casi, all’analisi della clientela, all’analisi delle vendite e alle tecniche più idonee a spiegare determinate variabili-obiettivo. Un esempio è costituito dal CRM (Customer Relationship Management), che può essere definito come “un insieme di strategie, processi, cultura e tecnologia che consente ad un’azienda di migliorare la comprensione dei bisogni dei propri clienti”.

(3)

Il fine principale delle applicazioni software, nel contesto dell’azienda che opera nella grande distribuzione, è quello di usare database al fine di automatizzare il processo di interazione con i clienti. Perché le operazioni possano essere compiute con successo il database deve identificare il segmento di mercato o un prospetto di potenziale alto profitto per l’azienda. Il punto di partenza è identificare il segmento di mercato, richiedendo i dati che identificano il cliente e i suoi acquisti passati. Si potrebbe pensare che avere molti dati sia meglio, in realtà spesso avere troppi dati rende le operazioni più difficili senza dare vantaggi.

Negli ultimi anni le operazioni di marketing hanno trovato un nuovo “alleato”

nelle tecniche di data mining. Il data mining mira ad automatizzare le operazioni precedentemente descritte e cerca di trovare pattern che siano utili a identificare il cliente e a conoscerlo meglio. Il risultato delle operazioni di data mining viene preso in input ad un altro software che gestirà direttamente la campagna di marketing diretta verso il segmento di mercato individuato.

Il data mining aiuta l’azienda nell’obiettivo di creare campagne di marketing personalizzate e accurate cercando di allineare le necessità delle imprese con le aspettative del cliente. Se le informazioni esistono e sono contenute in un database il processo di data mining modella virtualmente le attività dei clienti. Il problema di base, ad ogni modo, è la scoperta di pattern rilevanti per l’applicazione richiesta.

Il data mining crea modelli usando i dati contenuti in un database e li usa per prevedere il comportamento del cliente. È applicabile in vari campi, ad esempio abbonamenti ad un certo giornale, uso di carte di credito, ecc. Il risultato di questa previsione è detto score ed è tipicamente un valore numerico assegnato ad ogni record nel database che indica la probabilità di quel particolare comportamento.

Il ruolo del data mining è anche quello di studiare iniziative o promozioni per fare in modo che il rapporto azienda-cliente sia di lunga durata.

Se le campagne di marketing sono condotte usando i risultati ottenuti dall’applicazione di un modello di data mining si ottengono risultati migliori che nel caso di insiemi di clienti scelti casualmente. I benefici che si possono ottenere utilizzando modelli di data mining possono essere davvero sorprendenti.

(4)

La presente tesi vuole approfondire le tematiche appena descritte ed esaminare attraverso analisi di dati due casi di studio. Questi ultimi riguardano aziende che operano nel settore della grande distribuzione.

Il primo caso di studio riguarda lo studio di dati relativi alle vendite di prodotti appartenenti ai settori della telefonia e della tecnologia. L’obiettivo è stato di trovare delle relazioni interessanti tra caratteristiche della clientela e prodotto scelto e i risultati, in questo caso, sono stati davvero interessanti. Si è ottenuto per quasi ogni prodotto esaminato un profilo abbastanza definito dell’acquirente corrispondente.

La seconda analisi prendeva in considerazione solamente dati a carattere anagrafico di clienti potenziali ed effettivi. L’obiettivo è stato di segmentare il più efficacemente possibile la clientela e i risultati hanno portato a scoprire segmenti di clientela ben determinati e diversi tra loro.

Il primo capitolo offre una panoramica sulla segmentazione, sulla profilazione dei clienti e sul data mining come strumento efficace nell’ambito della grande distribuzione.

Il secondo capitolo presenta l’azienda nella quale ho svolto il tirocinio formativo che mi ha portato alla stesura della presente tesi, la SA.BA. Consulting.

Vengono definiti ed esaminati i concetti di “In-store Promotions” e “CRM” che costituiscono il core business dell’azienda e che sfruttano la potenza applicativa degli strumenti di Business Intelligence.

Il terzo capitolo prende in considerazione il processo KDD, ovvero il Knowledge Discovery in Databases, definendo il data warehouse, ma soprattutto il data mining, con un approfondimento sulle principali tecniche utilizzate ai fini del progetto.

Il quarto e il quinto capitolo contengono le analisi di data mining con la specifica di tutte le fasi effettuate e i risultati ottenuti.

Infine sono presentate le conclusioni e i possibili sviluppi in prospettiva futura legati al progetto svolto.

Riferimenti

Documenti correlati

b) adempimento di tutti gli obblighi a carico della medesima previsti dalla normativa in materia di intermediazione finanziaria, intendendosi per essa: leggi, regolamenti,

La gestione dei database e l'elaborazione dei Dati sono limitate alle finalità del trattamento e vengono effettuate in conformità alle leggi e ai regolamenti applicabili in materia

Aspirazione di prodotto nei polmoni: Se si suppone che si sia verificata aspirazione di prodotto liquido nei polmoni (p.e. in caso di vomito spontaneo o erroneamente

Please contact the LibreEOL's DPO (Responsabile della protezione dei dati personali del sistema LibreEOL, Dipartimento di Matematica e Informatica, Università di Perugia,

a) ottenere la conferma dell’esistenza di dati personali che lo riguardano, anche  se non ancora registrati, e la comunicazione in forma intelligibile dei medesimi  dati e della

Per il perseguimento delle finalità descritte al precedente punto 3, i dati personali vengono trattati dai dipendenti della Fondazione, dal personale assimilato e dai collaboratori

I dati personali possono essere sia di carattere generico (dati anagrafici, recapiti telefonici, ecc.), sia riguardanti il tuo stato di salute (dati connessi a tutte le

In caso di ritardo o mancata risposta o diniego, il richiedente può chiedere il riesame al RPCT/RT, che decide con provvedimento motivato, entro