• Non ci sono risultati.

Durante lo svolgimento di questo progetto si è cercato di estrarre dei modelli interessanti riguardanti le abitudini di navigazioni degli utenti del sito web e-commerce di un'azienda leader nel settore ICT. Per poter raggiungere il nostro scopo, si è fatto uso di alcuni degli strumenti più utilizzati nel campo del Web usage mining, l'analisi di clustering e la ricerca di regole di associazione e sequenze frequenti.

In quest'ultimo capitolo discuteremo delle conclusioni raggiunte e degli sviluppi futuri che potrebbero migliorare l'esperienza di navigazione degli utenti.

9.1 Conclusioni

Durante i cinque mesi di durata del progetto, abbiamo analizzato i dati riguardanti gli accessi al sito e gli ordini online con lo scopo di classificare gli utenti sulla base delle loro abitudini di navigazione e acquisto. Inoltre, durante la fase conclusiva, ci siamo occupati della ricerca di regole di associazione e sequenze frequenti interessanti tra le diverse aree del sito.

Le diverse fasi di svolgimento del progetto hanno richiesto una fase di preparazione dei dati con l'identificazione degli utenti e delle sessioni.

Inoltre, per lo svolgimento delle analisi di clustering, sono state individuate alcune metri- che che potessero aiutarci per i nostri scopi.

Per quanto riguarda l'analisi degli utenti sulla base delle diverse aree del sito maggior- mente visitate, e la ricerca di regole di associazione e sequenze frequenti, è stato necessario

94

svolgere l'arricchimento semantico delle diverse richieste registrate nella tabella contenente i dati del file log.

Durante le analisi di clustering abbiamo individuato 4 profili utente definitivi sulla base delle abitudini di accesso al sito e sulla base delle abitudini di acquisto.

Con l'ultima analisi di clustering, è stato possibile classificare gli utenti sulla base delle abitudini di navigazione. Sono stati individuati 6 cluster che ci hanno permesso di indivi- duare le aree del sito alle quali gli utenti di ogni gruppo hanno avuto accesso più frequente- mente durante il periodo di riferimento.

Durante la ricerca delle regole di associazione e sequenze frequenti tra le diverse aree del sito, si è potuta scoprire l'esistenza di relazioni tra alcune pagine, fornendo informazioni su eventuali migliorie da apportare alla struttura, seppur non precise a causa della scarsità dei dati riguardanti l'arricchimento semantico.

9.2 Sviluppi futuri

Per quanto riguarda gli sviluppi futuri, sarebbe interessante poter confrontare i dati degli acquisti online con quelli degli ordini effettuati utilizzando gli altri canali. Questo potrebbe aiutare a comprendere meglio se il sito web viene utilizzato in modo significativo o sono necessarie azioni migliorative che possano spingere i clienti a un maggiore utilizzo.

Inoltre, durante il mese di maggio 2018, è stata modificata la struttura di alcune pagine. Questo apre la possibilità di svolgere un'analisi che confronti i dati riguardanti l'ultimo tri- mestre 2017 con l'ultimo trimestre 2018, al fine di verificare se le modifiche apportate hanno effettivamente permesso di migliorare l'esperienza degli utenti.

In riferimento alle diverse aree del sito, si potrebbe perfezionare l'applicazione java che identifica il contenuto di ogni richiesta registrata nel file log. Questa miglioria darebbe la

95

possibilità di ripetere le analisi utilizzando i nuovi dati, consentendo l'estrazione di informa- zioni più dettagliate.

Oltre alle metriche calcolate durante le analisi di clustering, se ne potrebbero individuare delle altre e potrebbe essere interessante, ad esempio, identificare le pagine referer frequenti.

Questo progetto è solo il punto di partenza di un lavoro che potrebbe migliorare sempre più l'efficienza del sito web aziendale.

96

BIBLIOGRAFIA

[Albano 05] A. Albano, G. Ghelli, R. Orsini, Fondamenti di basi di dati, Se- conda edizione, Zanichelli, 2005, capitolo 1.

[Kienan 01] B. Kienan, Gestire le attività e-commerce, seconda edizione, Mon- dadori informatica, 2001, pag 53.

[Tan 06] P.N. Tan, M. Steinbach, V. Kumar, Introduction to Data Mining, Addison Wesley, 2006.

[Pighin 11] M. Pighin, A. Marzona, Sistemi informativi aziendali. Struttura e processi, Pearson, 2011, capitolo 14.

[Han 11] J. Han, M. Kamber, J. Pei, Data Mining: Concepts and Techniques, 3rd Edition, Elsevier, 2011.

[Pujari 01] A. K Pujari, Data mining Techniques, Universities Press, 2001. [Liu 11] B. Liu, Web Data Mining - Exploring Hyperlinks, Contents, and

Usage Data, Second edition, Springer, 2011.

[Vasta 10] D. Vasta, Web Analytics - le metriche gli strumenti le analisi, APOGEO, 2010, capitolo 1.

[Srivastava 05] T. Srivastava, P. Desikan, V. Kumar, Foundations and Advances in Data Mining, Springer, 2005, capitolo 10.

[Anderson 14] D. Anderson, D. Sweeney, T. Williams, Statistica per le analisi economico-aziendali, Apogeo Editore, 2010, capitolo 3.

[Masand 99] B. Masand, M. Spiliopoulou, Web usage analysis and user profil- ing, International WEBKDD'99 Workshop San Diego, CA, USA, August 15, 1999, pp. 165-166.

[Joshila Grace 11] L.K. Joshila Grace, V. Maheswari, Dhinaharan Nagamalai, Analy- sis of web logs and web user in web mining, International Journal of Network Security & Its Applications (IJNSA), Vol.3, No.1, Jan- uary 2011.

[Siddiqui 13] A.T. Siddiqui, S. Aljahdali, Web Mining Techniques in E-Com- merce Applications, International Journal of Computer Applica- tions (0975 – 8887), Volume 69, No.8, May 2013.

[Suneetha 09] K. R. Suneetha, R. Krishnamoorthi, Identifying User Behavior by Analyzing Web Server Access Log File, IJCSNS International Journal of Computer Science and Network Security, VOL.9 No.4, April 2009.

97

[De Bortoli 09] A. De Bortoli, Web Usage Mining e Clickstream: la profiliazione degli utenti nel web, 2009.

[Giudici 03] P. Giudici, C. Tarantola, Web Mining pattern discovery, No.156, settembre 2003.

[Jagli 12] D. Jagli, S. Oswal, Web Usage Mining: Pattern Discovery and Forecasting, IFRSA International Journal of Data Warehousing & Mining, Vol 2, issue4, November 2012.

[Mobasher 01] B. Mobasher, H. Dai, Tao Luo, M. Nakagawa, Improving the Ef- fectiveness of Collaborative Filtering on Anonymous Web Usage Data, School of Computer Science, Telecommunication, and Infor- mation Systems DePaul University, Chicago, Illinois, USA, April 2001.

[Ezeife 02] C. I. Ezeife, Yi Lu, Mining Web Log Sequential Patterns with Po- sition Coded Pre-Order Linked WAP-Tree, School of Computer Science, University of Windsor, Windsor, Ontario, Canada, N9B 3P4, Fayyad, July 2002.

[Rosato 14-15] M. Rosato, Segmentazione e modellazione del comportamento degli utenti di un portale per la ricerca del lavoro, Università degli studi di Pisa, Tesi di laurea magistrale, 2014-2015.

[Tavella 03-04] G. Tavella, WEB USAGE MINING, Analisi del comportamento di navigazione e classificazione degli utenti. Applicazione al sito della Biblioteca di Ateneo, Università degli studi di Milano – Bi- cocca, Tesi di laurea, 2003-2004.

[Informatica.com 18] Informatica.com, https://www.informatica.com, 2018. [Knime.com 18] Knime.com, https://tech.knime.org/documentation, 2018.

Documenti correlati