7 MODELLI DI CHURN PREDICTION NELLE TELECOMUNICAZION
C) Modello con regressione
7.1.4 Confronto dei risultat
È evidente che ciascuna delle tecniche fornisca risultati diversi. I risultati per tutti i metodi possono essere visualizzati nella Tabella 7.6:
CHURN PREVISTI NON-CHURN PREVISTI ACCURATEZZA COMPLESSIVA ARCHITETTURA BAYESIANA DI RETI NEURALI FF/BB 70% 75% 74% ARCHITETTURA STANDARD DI RETI NEURALI FF/BP 55% 79% 72% ALBERI DI DECISIONE 66% 88% 82% REGRESSIONE 51% 94% 81%
Tabella 7.6 (Confronto complessivo delle tecnologie)
Come si può osservare nella Tabella 7.6, le reti neurali con un’architettura bayesiana funzionano meglio per prevedere il churn del cliente mentre la regressione lineare è molto accurata per prevedere i non churner. Su tutti il modello che ha ottenuto i migliori risultati è l’albero di regressione mentre i risultati più scarsi sono stati ottenuti dalla rete neurale con architettura standard. La classe più difficile ed anche la più importante da prevedere è costituita dai churners. Ciò significa che in questo studio il metodo più accurato si è rivelato essere quello della rete neurale, che utilizza l’architettura bayesiana.
La Tabella 7.7 confronta le variabili più significative di tutti e tre i modelli:
Tabella 7.7 (Variabili più significative)
Come si può vedere dalla tabella 7.7, quattro delle variabili sono state usate da più di una tecnologia. La variabile tipo di lamentela rappresenta l’informazione sul genere di lamentela che è stata riportata. La variabile numero di lamentele registra il numero di volte che il cliente ha emesso delle lamentele nei confronti dell’azienda. Tali variabili sono state utilizzate sia dal modello con albero di regressione che da quello con regressione lineare. La variabile numero di
appuntamenti per la riparazione indica quanti appuntamenti sono stati concessi
per effettuare la riparazione. La variabile se è stato emesso un ordine documenta se il cliente ha disposto un ordine per riparare un danno. Queste ultime due variabili sono utilizzate sia dalle reti neurali che dagli alberi di regressione.
Da queste informazioni si può constatare che dalle 24 variabili originarie le più significative sono quelle usate da più tecnologie, ossia le seguenti:
1) Tipo di lamentela 2) Numero di lamentele
3) Numero di appuntamenti per la riparazione 4) Se è stato emesso un ordine
7.1.5 Conclusioni
Il passo successivo degli autori della ricerca sarà quello di eseguire un’analisi più approfondita sui dati dei clienti per tentare di stabilire nuove variabili che migliorino le predizioni delle tecnologie basate sui dati esistenti. Ad esempio se un cliente ha emesso molte lamentele in un anno, l’autore potrebbe usare la deviazione standard per creare una nuova variabile che indichi quanto spesso il cliente denunci in termini di media d’intervalli di tempo. È possibile che un cliente che ha effettuato quattro lamentele differisca da un altro che ha fatto lo stesso numero di lamentele se esse sono state effettuate in un piccolo intervallo di tempo oppure se sono spalmate sull’intero anno. Gli autori ritengono che esperimenti come questo potrebbero offrire effetti interessanti sull’accuratezza delle previsioni. Identificata la tecnica più adatta per prevedere il churn del cliente, le future ricerche degli autori si focalizzeranno sul creare profili di lifetime del cliente sulla base dell’elenco dei tassi di fidelizzazione definito dalle reti neurali. Questi profili permetteranno alla compagnia di adattare la propria base di clienti in n categorie e di effettuare una lunga stima su quando un cliente stia potenzialmente terminando il rapporto con la compagnia. Un’osservazione interessante è che la tecnologia complessivamente migliore è quella degli alberi di decisione, tuttavia le reti neurali con architettura bayesiana sono le migliori tecnologie per prevedere i churners mentre il modello di regressione di base si è rivelato il migliore nel
prevedere i non-churners. Basandosi su questo gli autori vorranno analizzare un approccio di previsione a due vie in cui la base dei clienti è prima analizzata per i non churners usando un modello di regressione e poi analizzata di nuovo per i churners utilizzando il modello di reti neurali. Indubbiamente questo potrebbe comportare che certi clienti appartengano sia al gruppo dei churn che a quello dei non churn, così dovrebbe essere creato un terzo gruppo denominato “clienti fuzzy”. Un’analisi dettagliata potrebbe permettere agli autori di decidere se questi clienti appartengano al gruppo dei non churner, al gruppo dei churner oppure se rimangono nel proprio gruppo come clienti che richiedono immediata o nessuna attenzione. In seguito alla profilazione dei clienti, sarà sviluppato un ambiente real time per monitorare costantemente le interazioni dei clienti con la compagnia e spostare dinamicamente un cliente a un profilo più appropriato se necessario. Gli autori desiderano provare l’utilizzo di metodi di fuzzy clustering come estensione agli esperimenti delle reti neurali, degli alberi di decisione e della regressione che sono già stati eseguiti.
Questa ricerca ha fornito alcuni interessanti risultati e spunti per prevedere il churn del cliente e ha presentato varie tecniche disponibili per il proposito della predizione. Come è evidente dalla Tabella 7.6 dei confronti delle tecnologie, l’albero di decisione è complessivamente la migliore. Ciò probabilmente è dovuto alla sua architettura basata sulle regole. L’albero di decisione consiste di un insieme di regole complesso e filtra i clienti sia churn che non churn. Il processo è più sul classificare i clienti in due gruppi e quindi può tenere conto sia dei churn che dei non churn. Le reti neurali e la regressione sono state addestrate ad effettuare calcoli per decidere se i clienti sono churners. L’accuratezza dipende principalmente dai pesi per le reti neurali e dai coefficienti per la regressione. Giocando con queste cifre potrebbe essere possibile aumentare l’accuratezza delle tecnologie, tuttavia aggiustamenti manuali potrebbero essere difficili e dispendiosi in termini di tempo.
Inoltre questo lavoro ha affrontato molti gaps di ricerca. Infatti mentre molti altri studi focalizzano la previsione del churn sui dati di utilizzo e sui dati demografici,
questa ricerca ha ottenuto un’accuratezza significativa di previsione, utilizzando dati di riparazioni e di lamentele, dimostrando che le riparazioni e le lamentele influenzano le decisioni del cliente nel continuare la relazione con il service provider. Inoltre essa ha anche identificato le variabili chiave che incidono sul churn ed ha proposto un accurato e convalidato modello per la churn prediction.