6 UN SISTEMA AUTONOMICO PER IL DIRECT MARKETING

(1)

6 UN SISTEMA AUTONOMICO PER IL DIRECT

MARKETING

Il presente capitolo descrive la progettazione e realizzazione di un programma denominato AKIM, Autonomic Knowledge for Interactive Marketing, che mira a realizzare un sistema innovativo di customer intelligence. La sua caratteristica principale è l’automazione del processo di apprendimento.

Il progetto presentato unisce gli aspetti teorici del direct marketing agli aspetti pratici del reinforcement learning e risulta particolarmente adatto per le realtà aziendali che, nella formulazione delle strategie di offerta ai propri clienti, incontrano spesso difficoltà derivanti dalle dinamiche ambientali, che hanno riflessi immediati sulle aspettative e sui gusti dei consumatori. Le aziende dovrebbero essere in grado di percepire queste dinamiche ambientali tempestivamente, in modo da individuare il momento più opportuno per proporre l’offerta giusta al cliente giusto.

Il campo di applicazione di questo sistema è quindi il marketing one-to-one, inteso sia come direct marketing per via telefonica o postale, che come web-marketing.

6.1 Motivazioni e obiettivi

Il progetto presentato ha lo scopo di aiutare le aziende nella pianificazione delle campagne di direct marketing. La pianificazione di una campagna richiede una buona definizione del target di riferimento a cui fare o inviare l’offerta ma allo stesso tempo anche una definizione dell’offerta più indicata per il target specifico.

Un’attenta ricerca dei sistemi di automazione per il marketing ha dimostrato che attualmente le aziende dispongono di sistemi per la pianificazione delle campagne che permettono di:

- creare gli elenchi dei contatti o degli account

- gestire attività telefoniche o di posta elettronica in blocco

- registrare le risposte

- gestire le campagne aiutando i responsabili di marketing nella pianificazione della campagna stessa e nella promozione dei prodotti

(2)

Gli strumenti attualmente esistenti in commercio forniscono sicuramente un buon aiuto alle aziende ma prevedono che l’analisi dei risultati di una campagna venga fatta solo alla fine di essa, cioè dopo aver ottenuto tutte le risposte dai clienti selezionati per quella campagna.

Una campagna di marketing può durare molto tempo e nel suo proseguo si possono verificare alcuni cambiamenti nell’ambiente esterno che si riflettono direttamente sui clienti e influenzano l’andamento della campagna; se i cambiamenti dell’ambiente potessero essere individuati, la campagna potrebbe essere indirizzata in ogni istante sui clienti più redditizi. Ad esempio, la nostra pianificazione di marketing potrebbe prevedere che le chiamate di oggi siano dirette a Livorno, ma se per qualche motivo i livornesi non rispondessero, potrebbe essere utile avere un sistema capace di rendersene conto, capace di creare una lista di nuove chiamate per un’altra città e di riprovare a chiamare Livorno dopo un certo periodo di tempo. In questo modo eviteremmo di sprecare il tempo e le chiamate destinate in un luogo che non ci farà ottenere nessun risultato.

Lo studio effettuato sugli strumenti esistenti in commercio ci ha permesso di accertare la non esistenza di sistemi che fossero in grado di monitorare e analizzare l’andamento della campagna durante il proseguo di essa ma solo al termine di essa. Analizzare i risultati alla fine può far capire com’è andata la campagna ma pone dei limiti alla possibilità di intervento, questo perché i risultati fanno già parte del passato, quindi non aiutano ma potrebbero essere oltretutto fuorvianti per la pianificazione delle prossime campagne, in quanto l’azienda potrebbe fare assunzioni erronee per il futuro. Inoltre, se l’azienda avesse potuto analizzare le risposte durante la campagna avrebbe potuto massimizzare il suo livello di profitto monitorando la campagna durante il suo proseguo.

Il progetto presentato riguarda la realizzazione di un sistema autonomico di gestione delle campagne di DM. Questo sistema anziché predisporre una lista di clienti già pronta da contattare utilizza un’analisi di data mining (clusterizzazione, classificazione) per la selezione dei clienti da contattare e definisce gli accoppiamenti cliente-offerta ottimali. Inoltre continuamente durante la campagna, effettua l’analisi delle risposte (o feedback) provenienti dai clienti e in base a questi formula le nuove ipotesi, adatta le conclusioni dell’analisi di data mining e ripianifica il proseguo della campagna.

Il progetto si rivolge a tutte quelle aziende che hanno bisogno di pianificare una campagna per poter offrire i loro prodotti sul mercato. L’offerta può riguardare qualsiasi tipo di prodotto, nel caso in esame potremmo ipotizzare che si tratti di

(3)

prodotti finanziari, che hanno la caratteristica di essere componibili e permettono la creazione di varianti di offerta.

Il sistema, denominato AKIM (Autonomic Knowledge in Interactive Marketing), è stato progettato in ambiente Visual Studio con linguaggio C#, è nato per scopi di telemarketing ma può essere adattato anche ad altri canali di direct marketing(DM) quali il web, da cui si ottengono risposte in tempo reale, o la posta, sia cartacea che elettronica, da cui si ottengono risposte più scaglionate nel tempo. Il capitolo descrive gli elementi e il funzionamento del sistema e presenta le analogie che il sistema conserva rispetto al Reinforcement Learning (RL), gli algoritmi che determinano il funzionamento del sistema non possono essere riportati perché tutelati da segreto aziendale. In bibliografia sono presenti alcuni riferimenti del RL al DM [Abe 02], [Abe 04], [Yong-Hyuk 06].

6.2 Elementi e principi di funzionamento del sistema

Come già detto in precedenza il progetto definisce gli accoppiamenti cliente-offerta ottimali. Con il termine cliente si intende un profilo di cliente, che in questo caso è il risultato di un’analisi di data mining (clusterizzazione, classificazione).

Un determinato profilo di cliente è costituito da attributi demografici, comportamentali ecc. e viene identificato con un numero, come mostrato nel seguente esempio:

Segmento 1 : Donne, giovani, istruzione superiore Segmento 2 : Uomini, vecchi, istruzione bassa

L’offerta invece, è rappresentata dal prodotto che è definito da una serie di attributi: il tipo, il prezzo, il confezionamento e tutte le caratteristiche che possono influenzare la scelta del cliente. Inoltre, ad ogni prodotto e ad ogni profilo sono associate delle disponibilità, cioè ogni prodotto è disponibile in una certa quantità e ogni profilo è costituito da un certo numero di clienti.

L’accoppiamento cliente-offerta definisce l’azione di offrire quel prodotto a quel cliente o target di clienti; segue un esempio che visualizza graficamente come, l’accoppiamento tra un determinato tipo di prodotto e un determinato profilo di cliente, definisce l’azione:

(4)

Figura 1 - Composizione dell'azione

Per chiarire meglio il concetto di azione, è necessario fare un esempio in cui il prodotto da offrire è rappresentato da una carta di credito che ha come attributi tipo e tasso di interesse applicato, mentre il profilo del cliente è rappresentato da due segmenti.

Ogni azione è generata dal prodotto cartesiano tra gli attributi di ciascun prodotto e i profili dei clienti; considerando di avere due profili definiti da due cluster identificati con i numeri 1 e 2, e i prodotti della tabella seguente,

Prodotto Tipo Tasso di interesse P1 American Express 9% P1 American Express 4%

P2 Carta Aura 6%

P2 Carta Aura 10%

Figura 2 - Esempio di prodotto con attribute

le azioni generate saranno:

Figura 3 - Esempio di generazione delle azioni possibili

Ad ogni azione corrisponde una risposta e ogni azione ha un valore atteso associato. Il cliente può dare diversi tipi di risposte, potrebbe accettare o meno l’offerta ma potrebbe anche chiedere di voler essere richiamato oppure potrebbe

CAE 9% CAE 4% CA 6% CA 10% 1 2 A1 A2 A3 A4 A5 A6 A7 A8 Profili A Prodotti

(5)

risultare infastidito per l’offerta che stiamo facendo o proporre lui stesso un prodotto che desidera; è importante che ognuna di queste diverse risposte sia valutata, memorizzata e identificata, quindi una risposta può essere di tipo booleano (si/no) oppure di tipo numerico, in tal caso ogni numero serve a identificare un diverso tipo di risposta.

Per semplicità il sistema prevede che il cliente risponda si oppure no, quindi per il sistema l’azione è rappresentata nel seguente modo:

)

,

(

)

(

))

,...

,

(

(Pr

odotto

a

₁

a

₂

a

andCliente

NumeroSegm

ento

ValoreRisp

osta

Si

No

Offerta

_n

→

La realizzazione dell’intera campagna di marketing avviene in più iterazioni, ciascuna iterazione rappresenta un ciclo di chiamate, ad esempio può riguardare un giorno di chiamate. Il numero delle iterazioni dell’intera campagna dipende dal numero di chiamate che si vogliono effettuare e dalla durata della campagna stessa. In ogni iterazione il sistema provvede a selezionare la lista delle azioni necessarie per la selezione dei nominativi dei clienti a cui proporre l’offerta.

Per selezionare le migliori azioni, il sistema utilizza due principi:

- Esplorazione

- Sfruttamento

Per esplorazione si intende la capacità del sistema di utilizzare azioni che al momento non sono promettenti ma che potrebbero diventarlo in futuro; lo scopo è quello di dare una chance anche a quelle azioni che altrimenti non sarebbero considerate. Per sfruttamento, invece, si intende la capacità del sistema di utilizzare le azioni più promettenti (cioè le azioni in grado di apportare maggior profitto) per contattare i clienti. Il sistema ad ogni iterazione deve dosare la percentuale di esplorazione e di sfruttamento nel modo più opportuno e successivamente selezionare le azioni da esplorare e da sfruttare.

A inizio campagna predomina la percentuale di esplorazione e man mano che la campagna giunge alla fine aumenta la percentuale di sfruttamento. Questo perché all’inizio si ha ancora incertezza sul mondo ed è quindi necessario esplorare per rendersi conto come iniziare a muoversi, man mano che ci si avvicina alla fine invece, è necessario concentrarsi su ciò che è stato appreso e quindi sfruttare le migliori azioni.

Il sistema quindi, parte da uno stato iniziale o modello, definito dall’esperto di marketing in base alla sua esperienza, e rappresentato da un modello bayesiano

(6)

che definisce tutte le possibili azioni cliente-prodotto con la relativa probabilità di successo.

Ad ogni iterazione il sistema deve essere in grado di applicare la migliore strategia in grado di massimizzare il valore totale delle azioni scelte.

Di seguito è illustrato il funzionamento del sistema:

Figura 4 - Funzionamento AKIM

All’inizio di ogni campagna il sistema genera la lista delle azioni possibili facendo il prodotto cartesiano tra i prodotti e i profili dei clienti, successivamente sulla base delle percentuali di sfruttamento e di esplorazione seleziona le azioni per l’iterazione corrente. Le migliori azioni generate, nel caso in esempio, sono la A4, A5 e A6. Essendo ad inizio campagna, alla prima iterazione il sistema potrebbe decidere che l’80% delle azioni dovrà servire per l’esplorazione mentre il restante 20% per lo sfruttamento. Sulla base di queste percentuali, il sistema provvede, quindi, a selezionare due azioni (80% del totale) per l’esplorazione e una sola azione (20% del totale) per lo sfruttamento. Ogni azione selezionata si riferisce a un determinato profilo di cliente; in base a questo profilo, con una semplice interrogazione SQL al database dei clienti, si selezionano i dati dei clienti da contattare. Una volta recuperati i contatti è possibile proporre le offerte ai clienti per l’iterazione corrente.

(7)

Le offerte possono essere fatte utilizzando diversi canali di direct marketing: telefono, posta, internet. Un canale si distingue dall’altro per la cadenza temporale con cui è possibile ricevere la risposta dal cliente. Ad esempio nel caso del telefono, la risposta del cliente è immediata mentre, per posta elettronica o cartacea la risposta può esserci o meno e può non essere immediata. In ogni caso ogni volta che otteniamo una risposta da un cliente, il valore atteso di quell’azione deve essere aggiornato. Nella prossima iterazione, si selezionano altre azioni e si procede come sopra esposto fino alla fine della campagna.

Il sistema è stato progettato in modo da individuare le migliori azioni anche in presenza di un ambiente dinamico. Durante l’esecuzione di una campagna l’ambiente può subire dei cambiamenti, ad esempio si possono creare nicchie di mercato o cicli stagionali. Il sistema deve essere in grado di individuare questi cambiamenti e deve essere in grado di spostarsi dalle azioni meno promettenti a quelle che, in base ai cambiamenti del mondo, diventano più promettenti.

6.3 AKIM e il Reinforcement Learning

Il progetto presentato in questo capitolo presenta analogie con l’apprendimento automatico e in particolar modo con il Reinforcement Learning (RL) o apprendimento con rinforzo, discusso nel capitolo 5.

La prima analogia riguarda il fatto che sia il RL che AKIM fanno apprendimento; tuttavia il RL effettua un apprendimento dopo ogni episodio, mentre in AKIM, per limitazioni pratiche, ciò non sempre risulta facile da implementare per cui alcuni aspetti del RL sono stati rivisti per poter adattare il sistema, in particolare in AKIM, il RL è interpretato a episodi e ogni episodio contiene più contatti per cui l’apprendimento avviene in blocchi.

Il Reinforcement learning è caratterizzato dalla presenza di un agente che partendo da uno stato iniziale e muovendosi nel proprio ambiente esegue un’azione, il compimento di quest’azione comporta la modifica dello stato del suo ambiente e l’ottenimento di una ricompensa.

(8)

Figura 5 - Funzionamento del Reinforcement Learning

Analogamente al RL, AKIM può essere visto come un agente che si muove nel proprio ambiente compiendo delle azioni, modificando di conseguenza lo stato dell’ambiente e ottenendo delle ricompense. In AKIM le azioni sono le offerte da sottoporre al cliente, mentre le ricompense sono i valori delle risposte del cliente a ciascuna offerta. Il concetto di stato invece, risulta un po’ meno chiaro in AKIM e a volte sembra non esserci.

Nel reinforcement learning lo stato è una conseguenza dell’azione compiuta dall’agente e rappresenta la memoria di quello che l’agente fa, dei comportamenti assunti in passato e delle conseguenze ottenute. Lo stato in AKIM potrebbe essere rappresentato dai cambiamenti dell’ambiente, ad esempio il cambiamento di una moda o le variazioni stagionali, tuttavia questi cambiamenti sono indipendenti dall’azione dell’agente, perché dipendono dall’ambiente stesso e si verificherebbero comunque anche in assenza di AKIM.

Per poter collegare in modo adeguato AKIM al RL è necessario cercare di capire quali cambiamenti apportano le azioni compiute dal sistema nell’ambiente o nel mondo. Pensando in questi termini possono essere individuati tre concetti di stato:

1) Il concetto di stato (interno) dato dalla disponibilità (prodotto, target): ogni offerta o azione è una coppia target di clienti-prodotto. Ogni prodotto offerto è disponibile in una certa quantità e ogni target è formato da un certo numero di clienti, quindi esiste una disponibilità associata al prodotto e una disponibilità associata al target. Se i prodotti e clienti fossero infiniti per tutta la campagna non ci sarebbe nessun cambiamento di stato in quanto sarebbe possibile fare un numero infinito di offerte senza esaurire mai il numero di clienti e di prodotti. Il concetto di stato nasce nel momento in cui ogni target e ogni prodotto sono disponibili in una certa misura. In tal caso proporre un’offerta a un determinato cliente fa diminuire la disponibilità del target, inoltre se il cliente accetta fa diminuire

Agente Ambiente Reward rt rt+1 st+1 Stato st Azione at

(9)

anche la disponibilità di prodotti. Quindi ogni volta che AKIM fa un’offerta, cambia anche lo stato del mondo ed è lo stesso AKIM (agente) che lo fa cambiare.

2) Il concetto di stato (interno) rappresentato da risorse e obiettivi: le scelte di una determinata azienda dipendono dalla definizione degli obiettivi e dalla disponibilità di un certo numero di risorse. Per decidere quali sono le azioni migliori da eseguire l’azienda si trova spesso a dover affrontare problemi di min-max, ed è sulla base delle azioni scelte per il raggiungimento degli obiettivi che deve modificare il sistema di gestione delle risorse. Ad esempio se per la realizzazione di una campagna sono stati stabiliti 20.000 contatti e la scelta del segmento di persone da chiamare ricade sul segmento 1 anziché sul 2, perché le persone del segmento 2 risultano più idonee per altre campagne, la campagna inizierà contattando le persone del segmento 1, ma se nel proseguo della campagna l’azienda si rende conto che il segmento 1 non da i risultati sperati allora a metà campagna può decidere di cambiare l’input, l’output, le direttive o la strategia. E’ l’azienda stessa che durante la campagna modifica lo stato dell’ambiente in cui opera, variando nel modo più opportuno, le risorse a sua disposizione per il raggiungimento dei propri obiettivi.

3) Il concetto di stato (di mercato) che riguarda il cliente: fino ad ora è stato preso in considerazione il concetto di un’unica campagna in cui i clienti possono essere chiamati al più una volta e in cui l’utilità deve essere ottimizzata nell’orizzonte temporale della stessa campagna. Uno dei problemi pratici di direct marketing è la gestione delle multicampagne, sia sequenziali che parallele. Nel caso di una singola campagna il concetto di stato è un concetto interno mentre nel caso delle multicampagne diventa un concetto di mercato. Le multicampagne sono caratterizzate dal fatto che uno stesso cliente può essere chiamato più volte per la ricezione di offerte diverse. Ad ogni cliente, quindi, è associato uno stato e ogni volta che esso riceve un contatto il suo stato cambia (diminuisce la sua disponibilità relativamente a quella determinata offerta, dopo il contatto è più fidelizzato con l’azienda oppure seccato per essere stato chiamato troppe volte). Ogni contatto quindi, ha riflessi sul mondo perché dopo ogni contatto il cliente modifica il suo stato e conseguentemente anche il target. Ad esempio, un cliente del segmento 1, si trova nello stato iniziale “cliente

(10)

va in un nuovo stato “cliente del segmento 1 con un contatto di tipo A e con una sua storia”. Quindi il proseguo della campagna contribuisce alla creazione di nuovi clienti da contattare ognuno con un proprio profilo e una propria storia formata dai diversi stati del cliente. Ogni stato può essere visto come un attributo per cui può essere utilizzato per la creazione di varianti di segmenti.

In conclusione, il concetto di stato sta nel cliente perché ogni contatto modifica i clienti e il loro stato, i clienti a loro volta modificano il target e di conseguenza le azioni perché si creano nuove varianti.

Figura 6 - Catena di modifiche generate da un contatto

I concetti di stato visti finora sono quelli che più si avvicinano alla visione di reinforcement learning perché in tutti e tre i casi AKIM è visto come un agente che agisce nel proprio ambiente e ne modifica lo stato. Tutti e tre i concetti di stato risultano molto importanti, inoltre uno di questi è legato al problema delle multicampagne che saranno analizzate nel paragrafo relativo alle funzionalità avanzate.

6.4 Funzionalità avanzate

Il progetto presenta anche alcune funzionalità avanzate che permettono di generare nuove azioni o famiglie di azioni. Come precedentemente esposto, l’azione è data dall’unione di una certa configurazione di prodotto (prodotto con i propri attributi) con una certa configurazione del profilo del cliente (cliente con i propri attributi). Le variazioni di configurazioni di prodotto o di profilo, dette anche varianti di prodotto e di profilo, generano nuove famiglie di azioni che meritano di essere esplorate.

6.4.1 Varianti di prodotto

Alcuni settori di mercato offrono prodotti con un alto livello di personalizzazione, ne sono un esempio i settori di prodotti finanziari, elettronici e turistici. Tali prodotti sono intercambiabili cioè le loro caratteristiche sono espresse sulla base di clausole contrattuali che possono essere variate facilmente; ad

Contatto modifica Cliente modifica Target Azioni nuove

varianti e modifica

(11)

esempio, se consideriamo come prodotto un pacchetto viaggi esso può essere caratterizzato da destinazione, prezzo e albergo. Una variante potrebbe essere rappresentata dal fatto che l’albergo contenuto nel pacchetto può essere a due, tre, o quattro stelle. Considerando invece, un prodotto finanziario, è possibile creare varianti del prodotto cambiando il tasso di interesse dal 10% all’11% o al 9%.

Nella realtà la possibilità di cambiare le caratteristiche di un prodotto non viene sfruttata molto. Per decidere il prezzo da attribuire ad un determinato prodotto è possibile fissare il prezzo iniziale ma successivamente il prezzo andrà variato in funzione della domanda, entra quindi in gioco l’elasticità della domanda rispetto al prezzo, che spesso non è affatto una funzione ben definita in quanto dipende da diversi fattori di mercato, e può essere ottimizzata solo effettuando delle prove.

Le persone che effettuano campagne di marketing, generalmente fissano il prezzo in base all’esperienza, si pensi ai fruttivendoli che conoscono benissimo le leggi del proprio mercato e sanno qual è l’ora migliore per vendere la frutta, e in base a queste conoscenze cambiano i prezzi nel momento più opportuno allo scopo di massimizzare l’utile. Il problema si presenta su mercati più ampi, dove è difficile controllare la variazione di domanda di molti prodotti.

L’idea base delle varianti di prodotto riguarda la possibilità di poter variare i valori di uno o più attributi del prodotto in modo da generare configurazioni alternative del prodotto di partenza, una volta proposte le alternative si prosegue all’analisi dei feedback ottenuti e si sceglie il prezzo migliore per quel prodotto. Considerando che il prezzo è un attributo come tutti gli altri, la stessa idea può essere applicata anche agli altri attributi che compongono il prodotto al fine di creare nuove configurazioni.

Tuttavia, una volta generate tutte le possibili varianti risulta praticamente impossibile provarle tutte, esistono infatti ostacoli pratici legati ai tempi e a fattori psicologici-cognitivi.

Il progetto in esame presenta la soluzione a questo problema; la generazione automatica di varianti di prodotto permette di effettuare una semplice ricerca di mercato in automatico, cioè per prove.

AKIM in questo modo affronta di nuovo il trade-off tra sfruttamento ed esplorazione. L’esplorazione in questo caso riguarda la generazione e la sperimentazione di varianti di configurazioni di prodotto che inizialmente non erano previste, ad esempio variazioni sul prezzo, o variazioni sul binomio prezzo fisso/prezzo al consumo (canone + variazione di prezzo).

(12)

Chiaramente è necessario porre dei limiti al ventaglio di opzioni che possono essere generate, è quindi essenziale che un umano ponga dei vincoli, ad esempio fissando un intervallo all’interno del quale il prezzo può essere variato, in modo che il sistema non vari le opzioni a suo piacimento.

La creazione di varianti contribuisce a incrementare lo spazio di ricerca che risulta formato dalle azioni di base iniziali definite dal progettista e dalle configurazioni generate sistematicamente da AKIM.

AKIM quindi, ha il compito di esplorare e nel contempo di ottimizzare l’utilità, creando azioni non esistenti a inizio campagna, generando così una campagna diversa dall’originaria.

La generazione e l’esplorazione di nuove azioni può essere vista come:

- un modo per personalizzare l’offerta: spingere il micro-marketing per il soddisfacimento dei bisogni di un gruppo verso il soddisfacimento dei bisogni di un solo individuo: marketing one-to-one;

- un’indagine di mercato effettuata in automatico, per tentativi ed errori: ai clienti non viene sottoposto nessuno tipo di questionario, è il sistema stesso che dalle prove ottiene delle risposte;

- una riprogettazione automatica della campagna di marketing: il sistema ripianifica ciò che potrebbe fare inventandosi nuovi prodotti nel proseguo della campagna.

AKIM quindi, partendo da una configurazione iniziale, ad esempio, un bancomat al costo mensile di 5€ e di 1€ ad operazione, dovrebbe essere in grado di creare altre possibili alternative e individuare la migliore.

Come già accennato questo modo di procedere è valido solo nel caso in cui i prodotti siano duttili o intercambiabili, ma soprattutto è valido se non è chiaro come potrebbe reagire la domanda alla variazione di configurazione di un determinato prodotto altrimenti non avrebbe senso sperimentare.

Tuttavia, le varianti che possono essere generate dalla configurazione di base di un prodotto possono risultare molte, soprattutto se il prodotto si compone di molti attributi; inoltre il prodotto da offrire non è uno solo ma sono diversi e questo contribuisce ad aumentare ulteriormente lo spazio di ricerca, potremmo trovarci nella situazione in cui il numero delle azioni risulta superiore al numero dei contatti a disposizione, sorge quindi un problema di campionamento che però può essere risolto in due modi:

- rinunciando a campionare grosse parti dello spazio delle azioni

(13)

La soluzione sta nell’apprendimento per analogia, cioè il campionamento non deve avvenire su una sola azione ma su un gruppo di azioni, quindi se abbiamo imparato qualcosa dall’offerta di un prodotto al tasso del 10% abbiamo imparato qualcosa anche sull’offerta dei prodotti vicini, cioè offerti al tasso del 9,9% e del 10,1%. Si tratta quindi di estendere il concetto del Reinforcement Learning; in questo caso, non imparo solo da quello che è successo in passato ma, se imparo qualcosa da un’azione imparo qualcosa anche per le azioni simili, viene quindi definita una metrica per valutare la somiglianza tra le azioni.

Il sistema quindi presenta una serie di algoritmi in grado di propagare la conoscenza acquisita su una determinata azione e sulle azioni simili a essa in modo da poter sfruttare i contatti rimanenti per altre azioni.

6.4.2 Varianti di target

Il ragionamento fatto sui prodotti può essere applicato anche ai target. Nel nostro caso il target è definito dal risultato di un’analisi di data mining, ad esempio da un cluster. Un target è descritto da un insieme di attributi e questo ci permette di creare varianti senza stravolgere lo stesso target. Variare il target vuol dire allargare o restringere lo stesso, modificandone qualche parametro, ad esempio se un target è definito da femmine con istruzione superiore di età tra 25 e 32 anni, la variante potrebbe essere creata allargando la fascia di età a 25-35 anni o a 23-34 anni, in questo modo il target cambia ma rimane comunque molto simile al precedente.

Tutto questo ha lo scopo di generare azioni leggermente diverse dalle originarie in modo da evitare di concentrarsi solo su determinate azioni (sfuggire agli ottimi locali); l’effetto è sempre il solito, l’aumento dello spazio di ricerca. Anche in questo caso un campionamento sull’intero spazio di ricerca risulta impossibile ed è quindi necessario, effettuare un apprendimento per somiglianza, una strategia che consenta di selezionare le azioni che per quanto già visto risultano buone.

6.4.3 Gestione delle multicampagne

Il termine campagna di marketing identifica un’attività eseguita da una o più persone e finalizzata alla promozione e alla vendita di determinati prodotti. L’esecuzione sequenziale o parallela di più campagne è detta multicampagna.

(14)

Nell’ambito del marketing una buona gestione delle multicampagne è fondamentale per la fidelizzazione e per il mantenimento della clientela, l’aspetto cruciale riguarda principalmente il bilanciamento delle campagne. Le campagne devono essere organizzate in modo che il cliente non risulti infastidito per essere stato contattato troppe volte. Ogni chiamata supplementare aumenta l’utilità attesa ma allo stesso tempo incrementa il malcontento del cliente.

AKIM ha come ulteriore funzionalità un’adeguata gestione delle multicampagne; tramite un’opportuna memorizzazione dei dati derivanti dallo svolgimento delle campagne, cerca di individuare quali sequenze di azioni provocano un cambiamento nel cliente (ad esempio generando malcontento per il numero eccessivo di contatti ravvicinati). In particolare nella memorizzazione dei dati, ogni cliente ha uno stato che si modifica ogni volta che viene contattato. Quindi per la gestione delle multicampagne è importante tenere conto del profilo del cliente, del suo stato (per quali campagne è stato contattato e quando) e delle sue risposte. La memorizzazione dei dati inoltre offre il vantaggio alle aziende, di poter legare le campagne tra loro in modo non casuale, le campagne vengono generate di volta in volta sulla base delle risposte ottenute dalle campagne precedenti (il cliente che in precedenza ha acquistato la cioccolata con molta probabilità acquisterà anche il torrone).

6.5 Valutazione delle prestazioni

La valutazione delle prestazioni di un sistema può essere fatta generando alcuni casi di prova. Un caso di prova, è una procedura di test utilizzata per valutare le prestazioni di un apposito software, esso quindi rappresenta il punto di riferimento per la misurazione di un sistema software, in particolare serve a misurare la capacità di detto software, di svolgere più o meno velocemente, precisamente o accuratamente il particolare compito per cui è stato progettato.

Una volta implementato, un sistema software ha bisogno di un apposito caso di prova in grado di misurare e valutare le sue prestazioni. Le prestazioni di una campagna in AKIM vengono valutate in termini di profitto, cioè il profitto totale derivante dai risultati delle azioni selezionate per la realizzazione dell’intera campagna. Il calcolo del profitto deriva dalla differenza tra i possibili ricavi ottenuti dalle risposte dei clienti alle offerte e i costi derivanti dal compimento di una determinata azione.

(15)

Conoscere il profitto derivante da una campagna è importante per l’azienda ma non serve a noi per valutare le prestazioni del sistema. Nasce quindi, l’esigenza di creare dei metodi di confronto per valutare il funzionamento di AKIM.

La valutazione delle prestazioni può essere fatta solo confrontando il livello di profitto ottenuto con AKIM con il livello di profitto ottenuto da un sistema che si comporta in modo diverso, a tale scopo abbiamo utilizzato due casi di prova chiamati “Oracolo” ed “Esperto”.

I principi di funzionamento di AKIM sono principalmente l’esplorazione e lo sfruttamento, AKIM inizia la campagna selezionando un gruppo di azioni da eseguire, man mano che la campagna avanza le azioni migliori potrebbero diventare altre. L’esplorazione serve proprio a individuare questi cambiamenti e, una volta individuate le migliori azioni deve cercare di sfruttarle fino a che non si verificano altri cambiamenti e così fino alla fine della campagna.

L’ “Oracolo” per noi, è un sistema software che ha lo stesso scopo di AKIM, cioè pianificare la campagna di marketing e calcolarne il profitto ma che si comporta in modo ottimale perché sa in ogni momento qual è l’azione migliore da eseguire, per tale motivo viene meno il trade-off tra sfruttamento ed esplorazione, sapendo di momento in momento qual è lo stato del mondo, sa quali sono le azioni migliori da eseguire e non ha bisogno di esplorare ma piuttosto di sfruttare.

Le differenze tra AKIM e l’oracolo sono illustrate dalla seguente matrice:

Greedy Sfruttamento Trade-off Sfruttamento-esplorazione ORACOLO A B AKIM C D

Figura 7 - Confronto AKIM – Oracolo

La matrice illustra quanti tipi diversi di prestazioni è possibile ottenere dalla combinazione dell’oracolo e di AKIM con il solo sfruttamento o con un opportuno trade-off tra esplorazione e sfruttamento.

La soluzione ottimale è la A, è una soluzione greedy in quanto si basa sul solo sfruttamento delle migliori azioni ed è implementata dall’oracolo. La soluzione che AKIM realizza invece, è la D che definisce ad ogni iterazione il giusto trade-off tra esplorazione e sfruttamento.

La matrice mette in relazione i due metodi riportando sulle colonne il trade-off tra esplorazione e sfruttamento e sulle righe la diversa conoscenza dello stato

(16)

del mondo da parte dei due sistemi. Nell’oracolo questa conoscenza è massima mentre in AKIM dipende dalla percentuale di esplorazione e sfruttamento definita ad ogni iterazione.

L’altro caso di prova utilizzato per la valutazione delle prestazioni di AKIM è quello dell’ “Esperto”; esso usa una previsione iniziale per la pianificazione e per lo svolgimento di tutta la campagna rappresentata da un modello che l’esperto di marketing realizza in base alla sua esperienza. Il modello definisce una serie di azioni, date da accoppiamenti cliente-prodotto. La campagna inizia selezionando le migliori azioni (quelle che secondo l’esperto apportano maggior guadagno) e prosegue fino alla fine sfruttando queste azioni. Il modello dell’esperto si differenzia da AKIM e dall’oracolo, in quanto non sa e non si preoccupa di sapere, in ogni momento, quale sia lo stato del mondo; inoltre, non fa esplorazione ma sfrutta semplicemente per tutta la campagna le azioni considerate migliori fin dall’inizio. Tuttavia, visto che il modello definito dall’esperto è un modello stimato quelle che sembrano le migliori azioni in realtà potrebbero non esserlo. Per tale motivo, l’esecuzione della campagna con il sistema dell’esperto fornisce livelli di profitto inferiori a quelli di AKIM. AKIM infatti sopperisce a errori nelle stime e riesce a migliorare il livello di profitto, infatti le sperimentazioni effettuate su dati simulati hanno dimostrato che esso risulta sistematicamente in vantaggio rispetto all’esperto, l’entità economica del vantaggio è tale da giustificare ampiamente l’introduzione del sistema per la gestione delle campagne. Concludendo, AKIM si trova ad un livello intermedio rispetto ai casi di prova definiti, esso infatti può essere inquadrato ad un livello superiore al sistema dell’esperto e ad un livello inferiore, ma molto vicino al sistema dell’oracolo in quanto dai confronti effettuati emerge che il livello di profitto ottenuto con AKIM è molto vicino al livello di profitto ottenuto con l’oracolo ma superiore al profitto ottenuto con il modello dell’esperto.

6.6 Considerazioni conclusive

In questo capitolo sono state presentate le principali caratteristiche del progetto denominato AKIM. Una buona pianificazione della campagna di direct marketing non solo consente all’azienda di ottenere un miglior livello di profitto ma consente di ottenere ottimi risultati anche nel lungo periodo perché migliora il rapporto tra il cliente e l’azienda. Il sistema presenta delle funzionalità che permettono di trovare l’accoppiamento più opportuno cliente-prodotto, ciò vuol dire che il cliente contattato riceverà l’offerta che più si adatta alle sue caratteristiche.

(17)

Questo contribuisce al miglioramento delle relazione tra cliente e azienda e ha riflessi positivi nel lungo periodo in quanto con il passare del tempo tra l’azienda e il cliente viene a crearsi un ciclo virtuoso. Il valore dell’impresa dipende dal valore della clientela, se il cliente riceve dall’azienda le offerte che si attende, il suo livello di soddisfazione aumenta e di conseguenza il cliente risulta più fidelizzato nei confronti dell’azienda, tutto ciò contribuisce ad aumentare il valore per l’impresa.

Attualmente è già disponibile un prototipo in grado di fornire prestazioni realistiche e risultati promettenti su dati simulati. La necessità di avere dei dati simulati è motivata dall’impossibilità di ottenere dei dati realistici ma soprattutto dal fatto che in questo modo è possibile testare il sistema per i nostri scopi. Dato che i risultati di una campagna sono dell’ordine di milioni di euro, vista l’entità monetaria in gioco vale la pena di misurare ulteriormente le prestazioni cercando di simulare più casi possibili. Le simulazioni effettuate finora hanno apportato risultati molto promettenti in quanto hanno soddisfatto le nostre aspettative, e c’è ragione di attenderci che il sistema si comporti allo stesso modo anche su dati reali.