• Non ci sono risultati.

In questa sezione vengono riportate alcune mappe che sono state ottenute al termine di questo lavoro e che descrivono come i turisti sono distribuiti sul territorio a livello di sezione di censimento. Essendo questo tipo di informazione molto dettagliata, `e necessario mostrare mappe che fanno riferimento a singoli comuni.

Consideriamo ad esempio il comune di Milano, in Figura 8.8 viene riportata la mappa tematizzata in base al risultato dell’applicazione dell’algoritmo Head - Tail Breaks alle sezioni di censimento di questo comune, come descritto nella Sezione 7.2.

Come si pu`o osservare dalla mappa e coerentemente al risultato riportato nella Sezione 7.2, la maggior parte delle sezioni di censimento rientra nella classe pi`u bassa che corrisponde a quella non interessante dal punto di vista turistico. Alle

CAPITOLO 8. KNOWLEDGE CONSOLIDATION 84

Figura 8.8: Sezioni di censimento del comune di Milano tematizzate in base alla classe di appartenenza

classi pi`u alte, colorate nelle varie tonalit`a di blu, appartiene un numero molto basso di sezioni di censimento, concentrate nel centro citt`a.

Combinando questa classificazione con il Touristic Presence Index ottenuto a livello comunale si `e ottenuto il valore di questo indicatore per ogni sezione di cen- simento. In Figura 8.9 si riporta la mappa relativa al centro della citt`a di Milano.

CAPITOLO 8. KNOWLEDGE CONSOLIDATION 85

Osservando la mappa si osserva che il punto di maggiore attrattivit`a turistica per la citt`a di Milano `e Piazza Duomo, colorata in rosso scuro, dove in base al Tou- ristic Presence Index affluiscono circa 20 milioni di turisti all’anno. A partire da Piazza Duomo poi i turisti si distribuiscono nella citt`a andando a visitare il Castello Sforzesco, la Galleria Vittorio Emanuele, il Teatro La Scala, la zona dei Navigli e il quartiere Porta Nuova. Un punto nevralgico per il turismo milanese risulta essere anche la Stazione Centrale.

Secondo la nostra stima la citt`a italiana con maggiori presenze turistiche `e Ro- ma. Nella mappa in Figura 8.10 possiamo vedere che l’intero centro citt`a risulta essere fortemente turistico visto il ricco patrimonio artistico che la rende una delle citt`a pi`u visitate al mondo.

Figura 8.10: Mappa del centro di Roma

A differenza di Milano, a Roma si individuano diverse zone fortemente attrattive come il Colosseo e i Fori Imperiali, Piazza Venezia e il Vittoriano, Piazza Navona, Piazza del Popolo, Fontana di Trevi, Piazza di Spagna e il Pantheon che vengono visitate praticamente da tutti i turisti che sono stimati a Roma. Altre zone molto frequentate ma dove probabilmente il numero effettivo di turisti `e maggiormente distribuito tra le sezioni di censimento sono il quartiere Trastevere, la zona adiacen- te alla Citt`a del Vaticano e nei pressi di Montecitorio, Palazzo Chigi e del Palazzo del Quirinale. Cos`ı come nella maggior parte della citt`a anche a Roma la Stazione

CAPITOLO 8. KNOWLEDGE CONSOLIDATION 86

Termini risulta essere luogo di passaggio di molti turisti.

Le mappe riportate in questo capitolo sono esclusivamente a titolo esemplifica- tivo, ragionamenti simili a quelli proposti possono essere effettuati su qualsiasi zona di Italia in base alle specifiche esigenze del soggetto che utilizza questi dati.

Conclusioni e sviluppi futuri

Con il lavoro descritto in questa tesi `e stato raggiunto l’obiettivo di calcolare un indicatore, il Touristic Presence Index, che misura il fenomeno turistico in Italia. Per ottenere tale valore si `e tenuto in considerazione il fatto che le presenze turisti- che non possono essere misurate basandosi unicamente sulle statistiche ufficiali ma `

e necessario quantificare anche il turismo nelle case vacanze e il fenomeno dell’escur- sionismo.

Dopo un primo periodo in cui si `e cercato di capire da quali fonti fosse possibile estrarre i dati necessari per raggiungere lo scopo prefissato, questi sono stati effetti- vamente scaricati tramite API adeguatamente inserite all’interno di script Python, successivamente analizzati e integrati con i dati Istat relativi al turismo, utilizzando le API Python di Apache Spark e l’ambiente di sviluppo interattivo Ipython Note- book. Questi strumenti si sono dimostrati molto efficienti dal punto di vista compu- tazionale e la loro flessibilit`a, dovuta al fatto che le analisi sui dati sono effettuate tramite codice, li rende adatti ad effettuare analisi ad hoc. Inoltre la combinazione di Apache Spark e Python consente di avere a disposizione molte librerie che per- mettono di effettuare analisi complesse sui dati, visualizzarli ed eseguire algoritmi di Machine Learning.

Dal punto di vista formativo, grazie alla realizzazione di questo progetto ho avuto la possibilit`a di imparare ad analizzare i dati mediante il linguaggio di programma- zione Python, utilizzare tecnologie di nuova generazione come Apache Hadoop e Apache Spark, ma anche di affrontare le complesse tematiche dell’analisi di dati geo- grafici e di utilizzare software dedicati alla gestione di questa tipologia di dato come Esri ArcGis.

Nello sviluppo di questo progetto non `e stato possibile sfruttare a pieno la po- tenzialit`a dei dati estratti da Flickr e Panoramio. Nelle nostre analisi ad esempio non abbiamo considerato i campi testuali, tipicamente Titolo, Descrizione e Tag, per avere informazioni pi`u precise riguardo all’immagine stessa. In ottica futura queste informazioni possono essere sfruttate per arricchire il modello effettuando dei controlli sul posizionamento delle immagini o per dedurre dalla descrizione quale sia

88

il contenuto della fotografia stessa.

Un ulteriore miglioramento che si vuole apportare in futuro riguarda la meto- dologia con cui sono stati ripartiti i turisti sulle sezioni di censimento a partire dal totale comunale. In particolare si vuol implementare un meccanismo grazie a cui le sezioni di censimento vengano suddivise in classi omogenee dal punto di vista del numero di fotografie presenti, come riesce a fare l’algoritmo Head - Tail Breaks, ma che all’interno di ogni gruppo creato le sezioni siano tra loro anche attigue.

Inoltre, dal momento che le fotografie vengono assegnate esattamente alla sezio- ne di censimento di appartenenza, si verificano dei casi in cui le sezioni adiacenti a quelle di forte interesse turistico risultano poco fotografate. Sarebbe quindi oppor- tuno correggere il valore del Touristic Presence Index per queste sezioni in quanto verosimilmente anch’esse saranno aree di transito di turisti.

Questo lavoro `e stato uno spunto per immaginare altri scenari per cui pu`o esse- re utile analizzare dati provenienti da social network o altri siti web. Sicuramente questa tipologia di dato pu`o essere sfruttata per capire il gradimento degli utenti nei confronti di una localit`a, un negozio o un prodotto, che possono essere espressi sotto forma di check-in in un luogo, mediante hashtag o commenti.

Per quanto riguarda la parte finale del progetto, ossia il calcolo del Touristic Presence Index, il risultato raggiunto `e stato considerato un evidente miglioramento rispetto ai dati Istat, fino a questo momento utilizzati in azienda per misurare il fenomeno turistico. Sicuramente ci sono ancora alcuni aspetti da tenere in consi- derazione, come le varie sfaccettature che sono intrinseche nel fenomeno turistico. Ad esempio vorremmo arrivare a individuare per ogni comune la quota di turismo d’affari, fieristico o congressuale rispetto al totale calcolato.

Ci`o che ci interessa sottolineare, oltre ovviamente al risultato finale raggiunto, `e l’intero processo svolto. Nello sviluppo di questa tesi infatti, a partire da dati grezzi provenienti da fonti di differente natura, passando per le fasi classiche del proces- so KDD siamo riusciti a creare informazioni che vanno ad arricchire il patrimonio aziendale.

Bibliografia

[1] Value Lab, http://www.valuelab.it

[2] Lukasz A. Kurgan, Petr Musilek, A survey of Knowledge Discovery and Data Mining process models,The Knowledge Engineering Review, Vol.21, Pages 1-24, March 2006

[3] Fosca Giannotti, Mirco Nanni, Dino Pedreschi and Fabio Pinelli, Trajectory Pat- tern Mining, in: Proc. KDD ’07. Proceedings of the 13th ACM SIGKDD inter- national conference on Knowledge discovery and data mining, New York, ACM, 2007, pp: 330-339

[4] Yan-Tao Zheng, Yiqun Li, Zheng-Jun Zha and Tat-Seng Chua, Mining Travel Patterns from Geotagged Photos, ACM Transactions on Intelligent Systems and Technology (TIST), Vol. 3, N. 56, May 2012

[5] Alexander Kachkaev and Jo Wood. Automated Planning of Leisure Walks Based on Crowd-Sourced Photographic Content, Paper presented at the 46th Annual Universities’ Transport Study Group Conference, New Castle, 2014

[6] Tye Rattenbury, Nathaniel Good and Mor Naaman, Towards Automatic Ex- traction of Event and Place Semantics from Flickr Tags, in: Proc. SIGIR ’07. Proceedings of the 30th annual internation ACM SIGIR conference on Research and development in information retrieval, New York, ACM, 2007, pp. 103-110

[7] Lyndon Kennedy, Mor Naaman, Shane Ahern, Rahul Nair and Tye Rattenbu- ry, How Flickr Helps us Make Sense of the World: Context and Content in Community-Contributed Media Cpllections, in: Proc. MULTIMEDIA ’07 Pro- ceedings of the 15th interational conference on Multimedia, New York, ACM, 2007, pp: 631-640

[8] Dennis Zielstra and Hartwig H. Hochmair, Positional Accuracy Analysis of Flickr and Panoramio Images for Selected World Regions, Journal of Spatial Science, Vol. 58, N.2, 2013

[9] Claudia Hauff, A Study on the Accuracy of Flickr’s Geotag Data, in: Proc. SIGIR ’13 Proceedings of the 36th international ACM SIGIR conference on Research and development in information retrieval, New York, ACM, 2013, pp. 1037-1040

BIBLIOGRAFIA 90

[10] Livia Hollenstein and Ross S. Purves, Exploring Place through User-Generated Content: Using Flickr Tags to Describe City Cores, Journal of Spatial Information Science, N.1, 2010, pp. 21-48

[11] Istat, http://www.istat.it

[12] Gerarld Friedland and Robin Sommer, Cybercasing the Joint: On the Priva- cy Implication of Geo-Tagging, in: Proc. HotSec ’10. Proceedings of the 5th USENIX conference on Hot topics in security, Berkeley, USENIX Association, 2007

[13] David Wilkinson, Flickr Mashups, Indianapolis, 2007

[14] Tom White, Hadoop : The definitive guide, 4th Edition, 2015

[15] Spencer A. Wood, Anne D. Guerry, Jessica M. Silver and Martin Lacayo, Using Social Media to Quantify Nature-Based Tourism and Recreation, Scientific Reports 3, N. 2976, 2013

[16] About GeoNames, http://www.geonames.org

[17] Holden Karau, Andy Konwinski, Patrick Wendell and Matei Zaharia, Learning Spark, 2015

[18] Wes McKinney, Python for Data Analysis, 2013

[19] Cyrille Rossant, Learning IPython for Interactive Computing and Data Visualization,2013

[20] Jiawei Han, Micheline Kamber and Jian Pei, Data Mining, Concept and Techniques, 3rd Edition, 2012

[21] Emilio Becheri, Giacomo Becheri, Sandro Billi, Elena Caramaschi, Pierluigi Picilli, Paolo Sani, Serena Scarcella, Il turismo che non appare: il ruolo delle abitazioni per vacanza, 2009

[22] Osservatorio del Turismo della Campania, Elaborazione Flussi Turistici. Il Movimento Escursionistico verso le Isole del Golfo di Napoli, Novembre 2007

[23] Isabella Scaramazzi, Giuseppina Di Monte, Cristiana Pedenzini, Giovanni Santoro, Il turismo sostenibile a Venezia, Marzo 2009

[24] Carlo Alberto Dondona, Escursionismo in Piemonte: stime e valore, Torino, 2009

[25] Bin Jiang, Head-Tail Breaks: A New Classification Scheme for Data with a Heavy-tailed Distribution, 2011

BIBLIOGRAFIA 91

[26] Ministero dei beni e delle attivit`a culturali del turismo, http://www.beniculturali.it

Documenti correlati