• Non ci sono risultati.

6.2 Interpretazione dei dati

6.2.5 Confronto tra dati social e dati Istat

In questa sezione vengono messi a confronto i dati social e i dati Istat raggruppati a livello di circoscrizione turistica in modo da capire se esiste una correlazione e per quali aspetti invece differiscono.

Correlazione tra la ricettivit`a ufficiale e i dati social a livello di circoscri- zione turistica

L’indice di correlazione di Pearson tra due variabili statistiche `e un indice che esprime l’eventuale relazione di linearit`a tra esse, in altre parole esso descrive la tendenza delle due variabili a variare assieme.

Formalmente, date due variabili statistiche X e Y, l’indice di correlazione di Pearson `e definito come:

ρXY = σXY

σXσY

CAPITOLO 6. SEMANTIC ENRICHMENT E INTERPRETAZIONE DEI DATI 56 Calcolando l’indice di correlazione di Pearson tra la variabile arrivi e la variabile fotografie otteniamo il valore 0,92. Questo indice ci dice che le due variabili sono correlate positivamente e che la correlazione `e forte.

Poich`e un indice non `e sufficiente per descrivere in modo esaustivo la relazione esistente tra le due variabili, in Figura 6.19 viene riportata su un grafico la distri- buzione delle due variabili.

Figura 6.19: Correlazione tra arrivi nelle strutture ricettive e fotografie

Oltre alla distribuzione delle due variabili, nel grafico in Figura 6.19 viene riportata anche la retta di regressione, ossia quella retta che descrive con il minimo errore la relazione tra le due variabili.

Il coefficiente R2 viene utilizzato per valutare la bont`a di questo modello e nel caso della regressione lineare esso corrisponde semplicemente al quadrato dell’indice di correlazione di Pearson. Nel nostro caso quindi otteniamo il valore 0,8478. Visto che il valore di tale indicatore `e prossimo a 1 significa che la retta riesce a descrivere in maniera abbastanza appropriata la relazione tra le due variabili.

Ci`o che `e interessante capire da questa distribuzione `e per quali aspetti le due variabili presentano comportamenti diversi e quindi sono in grado di individuare situazioni che l’altra variabile non riesce a intercettare.

A tal fine ci focalizziamo su quei punti che sono distanti dalla linea di tendenza e individuiamo due situazioni:

1. Basso numero fotografie, alto numero arrivi: i punti che si trovano al di sotto della linea di tendenza rappresentano il caso in cui secondo i dati Istat le presenze alberghiere sono elevate ma secondo i dati social le presenze turistiche non sono significative. Questa situazione pu`o rappresentare due realt`a differenti:

CAPITOLO 6. SEMANTIC ENRICHMENT E INTERPRETAZIONE DEI DATI 57 (a) il dato Istat sovrastima le presenze turistiche. Questo avviene in quelle localit`a dove `e alta la presenza in alberghi per motivi lavorativi o per le localit`a dove i turisti vanno a pernottare per poi spostarsi e visitare altri luoghi;

(b) il dato social sottostima le presenze turistiche. Il basso numero di foto- grafie pu`o essere anche dovuto al fatto che il luogo `e poco adatto ad essere immortalato e quindi dal punto di vista social non risulta interessante.

2. Alto numero fotografie, basso numero di arrivi: i punti che si trovano al di sopra della linea di tendenza rappresentano il caso in cui secondo i dati Istat le presenze alberghiere sono basse ma secondo i dati social la localit`a `e di interesse turistico. Questa situazione si pu`o verificare in quelle localit`a in cui la ricettivit`a `e bassa, per cui il turista `e forzato a dormire altrove oppure nel caso in cui la localit`a sia meta di turismo giornaliero.

Ad esempio, rientra nel caso di sovrastima da parte di Istat la circoscrizione turistica Altri comuni Milano, composta dall’aggregazione dei comuni limitrofi alla citt`a di Milano, che con 1.780.293 arrivi e 3.664.178 presenze in un anno, risulta una delle zone pi`u frequentate. Ovviamente questa zona per`o non `e turistica e questo ci viene confermato dal basso numero di fotografie presenti.

Rientrano invece nel caso di sottostima da parte del dato social delle presenze tu- ristiche le circoscrizioni turistiche appartenenti alla riviera romagnola come Rimini, Localita marine Rimini, APT di Caorle e APT di Iesolo ed Eraclea. Considerando queste quattro circoscrizioni, Istat registra in totale 6.209.538 arrivi e 29.048.497 presenze a fronte di 25.889 fotografie presenti nel dataset. E’ evidente come questi due dati siano tra loro incoerenti e che il dato Istat sia il pi`u realistico tra i due.

Infine un caso di sottostima delle presenze da parte di Istat si osserva nella circoscrizione turistica di Pompei in cui vengono registrati 104.893 arrivi e 197.423 presenze nelle strutture ricettive ma dove sono state scattate circa 20.000 fotografie. Questi esempi di incoerenza tra le due sorgenti dati fanno capire che esiste la necessit`a di individuare delle regole che permettano di stimare con la massima precisione possibile le presenze turistiche in un area, combinando le due informazioni.

Stagionalit`a dei flussi turistici

In ambito turistico un altro aspetto che `e necessario tenere in considerazione ri- guarda la stagionalit`a dei flussi. Questo problema risulta comune a quasi tutte le destinazioni turistiche, che vedono l’afflusso di visitatori concentrato in determinati periodi dell’anno. Anche per questo aspetto viene messa a confronto la distribuzione temporale dei dati ufficiali Istat e dei dati social in modo da capire quale fonte sia pi`u affidabile da questo punto di vista.

CAPITOLO 6. SEMANTIC ENRICHMENT E INTERPRETAZIONE DEI DATI 58

Figura 6.20: Stagionalit`a dei dati relativi alla ricettivit`a ufficiale

Per quanto riguarda gli arrivi nelle strutture ricettive, Istat offre i dati relativi all’anno 2013 aggregati per mese e per tipo di localit`a turistica. Le distribuzioni in Figura 6.20 evidenziano il fatto che la stagionalit`a `e un fenomeno presente in ogni tipo di localit`a anche se in misura e con andamenti diversi. Per quanto riguarda le localit`a marine e le localit`a lacuali `e evidente un picco in corrispondenza dei me- si estivi, in particolare per le localit`a marine ben il 58% degli arrivi `e concentrato nei mesi di giugno, luglio e agosto con un picco ad agosto del 23% mentre per le localit`a lacuali negli stessi mesi sono stati rilevati il 50% degli arrivi. Le localit`a montane presentano invece un doppio picco: il primo in corrispondenza dei mesi invernali con percentuali di arrivi attorno al 10 %, il secondo a luglio e agosto dove vengono rilevati in totale il 31% degli arrivi annui. Le citt`a d’arte che attirano un numero molto anno di turisti risultano la distribuzioni pi`u piatta, con un minimo del 5% degli arrivi nel mese di gennaio e un massimo dell’11% a luglio. Un anda- mento simile `e seguito dalle distribuzioni degli arrivi delle localit`a termali e religiose.

Considerando la stessa distribuzione costruita a partire dai dati social si ottiene il grafico in Figura 6.21.

In questo caso per le localit`a marine e lacuali il picco estivo risulta meno evidente infatti entrambe evidenziano un massimo attorno al 12 - 13 % nel mese di agosto. Anche per le localit`a montane `e presente solamente un picco in corrispondenza del mese di agosto mentre non viene messa in evidenza la stagione invernale dove le fotografie risultano meno della met`a rispetto all’estate. Anche in questo caso la

CAPITOLO 6. SEMANTIC ENRICHMENT E INTERPRETAZIONE DEI DATI 59 distribuzione relativa alle citt`a d’arte risulta piuttosto piatta, passa infatti dal 7% delle fotografie in media nei mesi invernali al 10% nei mesi di maggio e di ottobre.

Capitolo 7

Stima delle presenze turistiche

in Italia

Dalle analisi effettuate nei capitoli precedenti risulta evidente come per avere una sti- ma corretta delle presenze turistiche nel territorio italiano i dati relativi alle presenze nelle strutture ricettive non siano sufficienti.

Come mostrato nel Capitolo 6 si verificano dei casi in cui il dato fornito da Istat sottostima le presenze turistiche effettive in quanto una parte di turismo rimane sommerso. Questo pu`o essere ricondotto al fatto che in Italia `e molto forte la com- ponente di turisti che non alloggia in albergo durante le vacanze ma che alloggia in seconde case o appartamenti in affitto. L’altra componente che i dati Istat non riescono a rilevare sono gli escursionisti, ossia coloro che effettuano viaggi da un gior- no. Per questi motivi, partiamo dai dati Istat e utilizziamo i dati social come driver per correggere queste distorsioni in modo da ottenere un indicatore, che chiamiamo Touristic Presence Index, in grado di misurare l’intero fenomeno turistico .

Questo processo verr`a effettuato in due fasi, una prima parte in cui viene fatta una stima delle presenze turistiche nei comuni italiani. Il dato cos`ı ottenuto verr`a poi distribuito tra le sezioni di censimento in modo da scendere ad un livello di dettaglio molto basso e riuscire a valutare la consistenza del fenomeno turistico non solamente a livello macro ma anche a livello micro.

7.1

Stima a livello comunale

Documenti correlati