• Non ci sono risultati.

Descrizione del processo di customer retention

Nel documento Modelli di Churn Prediction (pagine 141-145)

7 MODELLI DI CHURN PREDICTION NELLE TELECOMUNICAZION

C) Modello con regressione

7.2 Modello di knowledge discovery 1 Business understanding

7.2.2 Descrizione del processo di customer retention

La customer retention è un processo di business che ha il proposito di fidelizzare i clienti.

La Figura 7.3 mostra un quadro concettuale del processo di customer retention denominato Knowledge-based Customer Retention Process Model (KCRPM), sviluppato da Modisette [Modisette 99]:

Figura 7.3 (KCRPM)

Knowledge discovery è un sotto-processo di Knowledge Management Process che fornisce:

o Intuizioni riguardo al tipo di clienti che stanno lasciando e alle cause possibili (processo di profilazione);

o Lista di clienti che stanno per lasciare (processo di previsione).

Relationship-Marketing Planning Process consente lo sviluppo di piani strategici di ritenzione, targets specifici predefiniti, piani di trattamento, tipi di campagne e piani convertiti in azioni basati sulla conoscenza acquisita nel processo di Knowledge Management.

Relationship Marketing Implementation Process entra in azione sulle vendite e i piani di servizio forniti. Attraverso i canali, le informazioni sui risultati di

esecuzione sono raccolte e utilizzate come feedback per le valutazioni di performances. Le misurazioni di performances forniscono informazioni per l’apprendimento e per il perfezionamento.

Il Knowledge Management Process perfeziona la conoscenza e rende le informazioni disponibili per la condivisione. Questo a sua volta permette miglioramenti al processo e la formazione di nuova conoscenza. Ciò forma un processo ciclico di apprendimento continuo e di miglioramento. Questo studio è, in certa misura, una convalida del quadro concettuale presentato nella figura 7.3. Il focus è sulla previsione del churn; il data mining è applicato per costruire modelli di previsione così che possano essere definiti specifici targets di ritenzione per piani strategici di ritenzione nel Relationship – Marketing Planning Process. La Figura 7.4 mostra l’architettura dell’esperimento di questo studio che è stato partizionato in moduli che interagiscono con il datawarehouse:

Figura 7.4 (Architettura dell’esperimento)

Nella prima fase i dati dei clienti nel datawarehouse sono stati estratti ed esplorati per identificare i data items d’interesse. La seconda fase ha comportato la progettazione di script di programmazione per estrarre e trasformare i dati nella forma desiderata dopo che le variabili d’interesse sono state selezionate. Questi

dati sono stati ripristinati nel datawarehouse. Nella terza fase i dati sono stati estratti dal campione per ulteriori analisi, modellazione di churn prediction e del valore. La quarta e la quinta fase hanno incluso l’interazione ricorsiva con il datawarehouse finché i modelli non sono stati ben messi a punto. Nella sesta e nella settima fase, gli script SQL sono stati progettati per automatizzare e trasformare la scoperta di regole dei modelli in punteggi. Il programma di punteggio è stato applicato ad un’intera popolazione nel datawarehouse per produrre punteggi di churn risk e di valore per ciascun cliente su base mensile. Nell’ottava fase è stata generata una lista di 5000 clienti con alta propensione al churn con accompagnamento del rispettivo punteggio. Altre conoscenze, ad esempio segmenti di clienti, sono state presentate nella forma di cubi OLAP. Per l’esperimento sono stati stabiliti i seguenti criteri di successo:

● Performance di modello: hit rate e Lift (presentati nel paragrafo 3.4) sono stati usati come indicatori e il test sul campo è stato usato per misurare la stabilità dei modelli nel corso del tempo;

● Interpretabilità del modello: valutare se le regole generate dal modello sono capite e concordate con gli operatori di marketing;

● Efficienza del modello: il tempo preso per generare un modello;

● Manutenibilità del modello: la facilità di sviluppo o di perfezionamento del modello.

Per quanto riguarda la definizione del churn è stato considerato il churn volontario e la finestra di previsione è stata di un mese. Inoltre sono stati utilizzati “Abbonati qualificati”, vale a dire quelli con un contratto post-paid con 4 o più mesi di possesso e con i piani di fattura selezionati; la dimensione della lista dei nomi previsti è stata mantenuta a 5000 per soddisfare i vincoli dello staff di telemarketing in outbound.

7.2.3 Preparazione dei dati

Il datawarehouse integra i dati su prodotti e servizi, fatturazione del cliente, prospetti di customer care, contratti e dati di promozioni, incluso il rated CDR(Call Detail Record). Il datawarehouse on-line consiste di circa 6 milioni di abbonati di telefonia mobile. Sono state identificate oltre 170 variabili basate sulla demografia dei clienti, canale e attributi contrattuali; misure come utilizzo, fatture, pagamenti; ed eventi come cambi, pagamenti posticipati, perdita di SIM cards e contatti di customer care. Ciascuna variabile è stata visivamente esplorata in una ricerca per ovvi pattern. Se un pattern è stato trovato, è stato poi testato con un test chi-square. Con un test chi-square si intende uno dei test di verifica di ipotesi che utilizzano la variabile casuale chi-square per verificare se l’ipotesi nulla è probabilisticamente compatibile con i dati. Lo scopo del test è quello di conoscere se le frequenze osservate differiscono significativamente dalle frequenze teoriche. Ogni variabile il cui test univariato ha dato un valore di p < 0.25 è stata considerata come una candidata per l’inclusione nel modello di previsione. È stato utilizzato il livello di 0.25 invece del tradizionale 0.05 per consentire a più variabili di essere selezionate in questa fase. In aggiunta al test chi-square, sono stati usati anche odds ratio per identificare significative variabili categoriche esplicative. Per variabili continue come l’età, è stata utilizzata l’entropia (descritta nel paragrafo 2.2.2) per sezionare il dominio per separazioni migliori tra churn e clienti in uso. Le variabili sono state aggregate per combinarne nuove che sono più potenti nel differenziare i clienti churn da quelli non churn. Alla fine la lista delle variabili è stata ridotta a 99.

Nel documento Modelli di Churn Prediction (pagine 141-145)