• Non ci sono risultati.

Per la realizzazione dell'archivio dei microdati dell'indagine 'Viaggi e vacanze', è stata adottata una soluzione 'gerarchica' (o ad albero) che ha il vantaggio di facilitare le elaborazioni e minimizzare tempi e spazi di archiviazione, coerentemente all'esigenza di tempestività, implicata dalla Direttiva. Fra i paesi membri dell’Unione europea è stata riscontrata una ampia convergenza sul trattamento dei dati elementari in forma gerarchica.

Il database risultante da un trimestre di rilevazione è costituito da tre files: un file delle famiglie, uno degli individui, uno dei viaggi. Il principio logico che sottende tale struttura gerarchica si basa sulla relazione esistente tra famiglia, individuo e viaggio, secondo lo schema logico sotto illustrato. Si noti che ogni elemento può essere messo in relazione con più elementi di livello inferiore, ma con un solo elemento di livello superiore.

Ogni intervista telefonica effettuata tramite CATI viene inizialmente registrata in un unico record, piuttosto lungo. Solo al termine della fase trimestrale di rilevazione, le informazioni di ogni singola intervista vengono ripartite in tre differenti tipi di record, a seconda dell'unità di analisi a cui si riferiscono:

- un record con informazioni sulla famiglia,

- un record con informazioni su ciascun individuo componente la famiglia, che abbiano viaggiato (turista) o meno,

-

un record con dettagli su ciascun viaggio realizzato da un membro della famiglia37. I records dello stesso tipo vanno poi a formare files omogenei.

37 Nel caso in cui due o più membri della famiglia abbiano effettuato un viaggio insieme (con stessa data di inizio, stessa durata, stessa destinazione ed uguali caratteristiche del viaggio), sono prodotti tanti records viaggi quanti sono i partecipanti al viaggio. Dal ogni singolo record è possibile identificare tutti gli altri membri partecipanti . Famiglia Individuo Individuo Viaggio Viaggio Viaggio Viaggio Individuo

In alternativa all’ottica gerarchica esiste la possibilità di strutturare il database secondo una ottica lineare, cioè ad un solo livello: si tratta di archiviare i dati elementari in un file composto da un record per ogni individuo. Il record contiene le informazioni generali dell’individuo, le informazioni generali sulla famiglia e una serie di campi che si ripetono per ciascun viaggio realizzato, come indicato nella figura.

individuo famiglia viaggio 1 viaggio 2 … viaggio n Questa soluzione è stata presto scartata perché presenta alcuni inconvenienti. Innanzitutto produce un file molto pesante, con una lunghezza record dell'ordine delle migliaia di bytes. Inoltre la lunghezza del record non può essere predeterminata, ma varia da individuo a individuo in base al numero di viaggi rilevato. L’archiviazione elettronica di questo genere di file comporta un notevole impiego di spazio, e la maggior parte dei campi riservati ai viaggi rimarrebbe comunque inutilizzata. L’elaborazione di files lineari risulta complicata dal fatto che una determinata informazione riferita a viaggi fatti da un individuo si trova collocata su diverse colonne dello stesso record, piuttosto che su record distinti. Inoltre, si incontrerebbero problemi di adattamento del tracciato qualora sorgesse la necessità di inserire nuovi quesiti nella scheda viaggi, a causa della contiguità dei blocchi di informazioni sui viaggi.

L'adozione di un archivio gerarchico, unitamente all'adozione di codici identificativi strutturati anch'essi a più livelli (vedi paragrafo seguente) ha dunque offerto numerosi vantaggi:

- risparmio di spazi di archiviazione e chiarezza nei contenuti dell'archivio (i tre soggetti rimangono distinti);

- snellezza delle elaborazioni e possibilità di automatizzare alcune procedure di elaborazione;

- possibilità di analizzare separatamente una unità d’analisi senza essere appesantiti da informazioni attinenti ad altra unità, ma non perdendo di vista il contesto di appartenenza (unità superiore);

- facilità di aggancio tra unità di analisi diverse e facilità di identificazione di ogni unità.

Il tutto ha permesso di avere files elaborabili in modo indipendente, ma agganciabili all'occorrenza in modo molto rapido.

7.1.1 - I codici identificativi

Nell'indagine 'Viaggi e vacanze', i codici identificativi dei records sono costruiti tramite un meccanismo di propagazione dei codici. Ciò significa che un identificativo è il risultato della concatenazione di sottocodici, ciascuno dei quali riferito ad un livello di unità statistica. Ad ogni passaggio lungo i legami logici viene aggiunta una componente di livello più basso:

- identificativo familiare = codice trimestre + numero d'ordine famiglia nel trimestre (ad es. 013500 = trimestre 01, famiglia 3500)

- identificativo individuale = identificativo familiare + numero d'ordine individuo nella famiglia (ad es. 01350002 = trimestre 01, famiglia 3500, individuo 02)

- identificativo del viaggio = identificativo individuale + numero d'ordine viaggio dell'individuo (ad es. 0135000201 = trimestre 01, famiglia 3500, individuo 02, viaggio 01). Oppure, saltando un livello: identificativo famiglia + numero d'ordine viaggio della famiglia (ad es. 01350008 = trimestre 01, famiglia 3500, viaggio 08) Il codice identificativo ha lo scopo essenziale di distinguere una unità statistica dalle altre dello stesso tipo (ad es. un individuo dagli altri individui), ma se è costruito in modo 'gerarchico', permette anche l'assegnazione di una unità alla rispettiva unità di ordine

superiore (l'individuo alla famiglia, il viaggio all'individuo). I codici identificativi gerarchici permettono dunque di risalire alla famiglia di appartenenza o all’individuo che ha effettuato il viaggio.

Tali codici rendono possibile l'individuazione di tutti i records che appartengono ad un'unica unità di livello superiore:

- tutti gli individui appartenenti ad una famiglia, - tutti i viaggi fatti da una famiglia,

- tutti i viaggi fatti da un individuo.

Rendono inoltre agile l’aggancio (merge) tra tipi record differenti e il 'travaso' o la 'disseminazione' di informazioni:

- tra una famiglia e tutti gli individui che la compongono (tipo record1-tipo record 2), - tra un individuo e tutti i viaggi che ha effettuato (tipo record 2-tipo record 3),

- tra una famiglia e tutti i viaggi effettuati dai componenti (tipo record 1-tipo record 3). Ad esempio risulta agevole ottenere:

- la distribuzione degli individui secondo le caratteristiche della famiglia di appartenenza,

- la distribuzione dei viaggi secondo le caratteristiche della famiglia di appartenenza, - la distribuzione dei viaggi secondo le caratteristiche dell’individuo viaggiatore, - la distribuzione degli individui secondo le caratteristiche dei viaggi,

- l’individuazione del turista, come individuo che ha fatto almeno un viaggio nel trimestre.

7.1.2 - Il contenuto informativo dei files

Ognuno dei tre files gerarchici ha un tracciato contraddistinto da un codice di tipo record posto nel primo campo: 1 per le famiglie, 2 per gli individui, 3 per i viaggi.

La posizione delle variabili, i nomi, il numero di bytes assegnato ad ogni campo sono stati predisposti con criteri di razionalità, economia di spazio, previsione dei possibili sviluppi dell'indagine e, dove possibile, in armonia con le altre indagini del sistema Multiscopo e in generale con gli standard dell'Istituto.

Tutti i tre files gerarchici hanno in comune, registrate nelle medesime posizioni del tracciato, alcune fondamentali informazioni identificative: trimestre di riferimento, codice identificativo familiare, comune e provincia di residenza, regione, ripartizione, tipologia socio-demografica del comune e il coefficiente di riporto all'universo.

Oltre a ciò, il file famiglie è caratterizzato dalle seguenti informazioni: alcune informazioni generali preventive all'intervista: il numero di componenti, se la famiglia ha ricevuto o meno la lettera di preavviso e se ha compilato il modulo riepilogativo allegato alla lettera; seguono alcuni indicatori sintetici della propensione a viaggiare della famiglia, come la presenza/assenza di viaggi di lavoro, di viaggi di vacanza, di vacanze brevi, di vacanze lunghe; seguono informazioni sintetiche sull'andamento dell'intervista: il codice intervistatore, la data e l'ora di inizio dell'intervista, la sua durata, il numero di tentativi complessivamente effettuati per arrivare al completamento, la disponibilità mostrata dalla famiglia e la difficoltà incontrata nelle diverse sezioni del questionario. Chiude il record un campo note riservato all'intervistatore.

Il tracciato record del file individui, oltre alle informazioni generali accennati all'inizio, ha le seguenti informazioni specifiche: il numero d'ordine individuale nella famiglia, varie informazioni socio-demografiche come la relazione di parentela con il rispondente, sesso, età, stato civile, professione, ecc.; alcuni indicatori sintetici sulla propensione dell’individuo a viaggiare, come il numero totale di viaggi di lavoro e di vacanza fatti dall'individuo; vi è poi la sezione dei viaggi abituali fatti dall'individuo, distinti tra Italia ed estero, con il relativo numero di pernottamenti.

Nel file dei viaggi sono ripetute le informazioni socio-demografiche dell’individuo, presenti nel file individui (sesso, età, stato civile, professione, ecc.), in modo da conoscere le caratteristiche di colui che ha viaggiato senza ricorrere necessariamente ad un merge con il file individui. Il tracciato record del file viaggi prevede inoltre i seguenti dati: un progressivo del viaggio, sia individuale che familiare e tutti i dettagli sul viaggio, come tipo di viaggio (lavoro, vacanza), motivo del viaggio, numero di partecipanti, durata, destinazione, mezzo di trasporto, alloggio, spesa sostenuta, eventuali destinazioni secondarie, ecc.

Nella progettazione del tracciato record sono stati previsti dei campi vuoti (filler) tra gruppi di informazioni omogenee. Questi filler sono utili per individuare slineamenti nella registrazione, oltre che per osservare al video il files dei dati con facilità. Inoltre, hanno permesso di inserire i nuovi quesiti che col passare degli anni hanno arricchito l'indagine, vicino a variabili di contenuto omogeneo, piuttosto che accodarle disordinatamente in fondo al tracciato.

Un certo numero di variabili presenti nei tracciati sono registrate automaticamente dal sistema, come il trimestre di riferimento, il codice intervistatore, la data e la durata dell'intervista e le variabili territoriali (provincia, comune, regione di residenza).

A volte non esiste perfetta corrispondenza tra i codici visualizzati nel questionario CATI e quelli previsti nel piano di registrazione. Questo avviene ad esempio quando il software CATI ha delle rigidità interne che impongono un preciso ordinamento delle modalità nella schermata, diverso da quello desiderato. In questi casi le risposte vengono ricodificate successivamente alla rilevazione.

In aggiunta alle variabili ricavate dall'intervista, ne esistono alcune ricavate per calcolo. Si tratta generalmente di contatori e indicatori sintetici, come la propensione a viaggiare di una famiglia, rappresentata da un indicatore di presenza/assenza di viaggi fatti dalla famiglia o il contatore dei viaggi di un individuo, ottenuto contando nel file dei viaggi i records attribuibili all'individuo.

7.2 - I files delle interviste interrotte

Il controllo della qualità dell'indagine comprende anche lo studio delle 'interviste interrotte', intendendo quelle interviste che sono state interrotte in modo definitivo perché l'intervistato ha opposto il rifiuto a continuare. Per convenzione l'intervista si intende iniziata quando è stata iniziata la scheda generale (prima parte) in cui sono raccolte le informazioni strutturali: ciò distingue il rifiuto in corso d'intervista dal rifiuto iniziale.

Nei files delle interviste interrotte viene registrato il punto esatto in cui è avvenuta l'interruzione, cioè l'ultima sezione, quesito, individuo (e eventualmente viaggio) compilati: a questo scopo sono stati attribuiti dei numeri identificativi alle sezioni dell'intervista e ai quesiti. Controllando in quale punto dell'intervista è avvenuta l’interruzione, è possibile monitorare alcuni quesiti particolarmente delicati e verificare se esistono punti critici del questionario, in cui più frequentemente le interviste si interrompono. In questi casi si può pensare di intervenire sulla sezione critica, modificandone la struttura o la formulazione dei quesiti.

Le interviste interrotte vengono registrate in files gerarchici del tutto analoghi per tracciato ai files delle interviste complete38, dove mancheranno alcune informazioni, a seguito dell'interruzione. A seconda del punto del questionario in cui si è verificata l'interruzione, l'architettura gerarchica della singola intervista può risultare compromessa, mancando interi record individuali o di viaggio.

38

Nei files delle interviste complete i campi destinati alla descrizione del punto in cui si interrompe l'intervista rimangono ovviamente non compilati.

7.3 - Elaborazioni caratteristiche della domanda turistica

Il principale risultato fornito dall'indagine è ovviamente la stima del numero dei viaggi, cioè la consistenza della domanda turistica dei residenti in Italia. Il numero di viaggi viene poi distribuito secondo alcune caratteristiche dei viaggi, ad esempio: quanti viaggi sono stati fatti per lavoro e quanti per vacanza, quanti in Italia e quanti all’estero, quanti con prenotazione e quanti senza alcuna prenotazione, quanti in albergo e quanti in alloggi privati ed altro ancora.

Un attributo determinante di un viaggio è però il numero di pernottamenti. Se contestualmente al numero dei viaggi non viene considerato anche il numero di pernottamenti, si rischia di non cogliere alcuni cambiamenti nelle abitudini degli italiani, come la tendenza a fare un maggior numero di viaggi ma di minore durata. Si consideri inoltre che il numero di pernottamenti attiene all’impatto economico del flusso turistico, si pensi ad esempio all’impatto sulle strutture alberghiere di un certo territorio. Per questi motivi è opportuno produrre le stesse distribuzioni del numero di viaggi anche per il numero di pernottamenti.

Uno degli risultati più interessanti della domanda turistica, accanto ai viaggi e ai pernottamenti, è costituito dalle quote di turisti. Secondo la definizione ufficiale, applicata a livello sia nazionale che internazionale, si definisce ‘turista’ la persona che nel periodo di riferimento ha fatto almeno un viaggio (con pernottamento). Si parla, pertanto, di turista anche nel caso di viaggiatore per lavoro, oltre che di turista per vacanza a seconda se l’individuo ha fatto nel trimestre almeno un viaggio di lavoro o di vacanza. Ovviamente un individuo può essere enumerato contemporaneamente tra i turisti per lavoro e i turisti per vacanza.

L’analisi dei turisti è importante anche perché permette di conoscere i motivi per cui una quota di popolazione non ha fatto viaggi. Nell'indagine ‘Viaggi e vacanze’ agli individui che dichiarano di non aver fatto vacanze viene chiesto di specificare se ciò è avvenuto per motivi economici, motivi di salute, mancanza d’abitudine, perché già residente in località di villeggiatura e così via. Si scopre così, ad esempio che tra le persone che non hanno fatto vacanze nell’estate 2001, il 19,4% è stato impedito da motivi di famiglia, e il 18,9% da motivi economici.

Rapportando il numero di turisti alla popolazione residente si ottiene un quoziente che indica la quota di popolazione che ha fatto almeno un viaggio su cento (o mille) residenti. Questo indicatore si presta benissimo ad un approfondimento di tipo socio-economico, mirato ad esempio alle fasce di popolazione più svantaggiate (anziani, disoccupati, ecc.). Nel trimestre estivo 2001, ad esempio, hanno fatto almeno una vacanza il 52,6% dei bambini di 0-14 anni, mentre tra gli anziani di 65 anni ed oltre la quota è stata di appena il 20,5%.

La definizione di turista è strettamente legata al periodo di riferimento. Nell’indagine ‘Viaggi e vacanze’ il periodo di riferimento è il trimestre. I dati trimestrali sul numero dei turisti non sono cumulabili, perché una stessa persona può essere stata turista in trimestri diversi ed una eventuale somma dei dati trimestrali comporterebbe una sovrastima del numero annuale dei turisti. Per conoscere il numero di turisti nell’intero anno occorre formulare un apposito quesito riferito ad un periodo di riferimento annuale, inserendolo ad esempio nella quarta rilevazione, riferito all'anno appena concluso.

Altri indicatori interessanti possono essere il numero medio di viaggi per turista e il numero medio di viaggi per abitante. Il primo indicatore si presta ad evidenziare l’intensità della mobilità dei viaggiatori, ad esempio in relazione alle condizioni professionali o all’appartenenza territoriale. L’altro, il numero di viaggi per abitante, è calcolato sulla popolazione residente, comprensiva cioè sia delle persone che hanno viaggiato sia di quelle che non hanno viaggiato, e si presta ad evidenziare la propensione a viaggiare di alcune fasce di popolazione o regioni d’Italia, inteso come numero di viaggi prodotti in media dai residenti in una zona.

Raggiunto un numero sufficiente di trimestri è inoltre possibile effettuare un'analisi della serie storica, ad esempio dei viaggi per vacanza, per analizzare le singole componenti della serie: la tendenza di fondo (ciclo-trend), la componente erratica e soprattutto la stagionalità, che ovviamente caratterizza fortemente i flussi turistici39. La destagionalizzazione delle serie grezze, eliminando le oscillazioni stagionali che nascondono la tendenza di fondo del fenomeno, permette di condurre analisi congiunturali di breve e medio termine e introduce anche all'uso di modelli previsivi.

Infine, l’indagine ‘Viaggi e vacanze’, rilevando informazioni su tutti i componenti della famiglia, consente di ricostruire la struttura completa della famiglia: si possono dunque studiare i comportamenti turistici delle diverse tipologie familiari (famiglie unipersonali, coppie con figli, coppie senza figli, ecc.). Può essere interessante ad esempio conoscere in quali occasioni le persone che vivono in coppia si trovano ad andare in vacanza da soli o solo con i figli.

7.4 - La diffusione dei risultati e dei dati elementari

In seguito alle procedure di revisione, imputazione e ponderazione, i dati elementari sono elaborati in funzione di alcuni obiettivi. La prima serie di elaborazioni produce tavole sintetiche ad uso interno, in grado di fornire un primo sguardo d'insieme sull'andamento trimestrale della domanda turistica e servono ad aggiornare un archivio di tavole e una serie storica. Si tratta di elaborazioni piuttosto elementari (frequenze semplici e doppie, medie, tassi) sull'ammontare complessivo dei viaggi, dei pernottamenti e dei turisti, secondo le principali caratteristiche strutturali del viaggio o del turista.

Una volta giunti a completamento del ciclo annuale di rilevazione, un'analisi dei principali risultati dell’indagine è regolarmente pubblicata nel volume 'I viaggi in Italia e all’estero' (Collana Informazioni), disponibile anche su Internet. I principali approfondimenti del volume sono: l'analisi temporale del flusso turistico, le caratteristiche dei viaggi (motivo, destinazione principale, durata, mezzo di trasporto, alloggio ecc.) e i motivi per cui l'individuo eventualmente non ha effettuato alcuna vacanza, informazione nuova e di notevole interesse sociale. Si analizza inoltre la propensione a viaggiare degli italiani, in termini di quota di popolazione che ha effettuato almeno un viaggio nel periodo di riferimento. I dati sono classificati per area geografica di residenza e caratteristiche socio-economiche quali sesso, età, titolo di studio, condizione lavorativa.

La ricchezza dei contenuti dell'indagine, quasi tutti assolutamente nuovi per la statistica ufficiale, permette inoltre approfondimenti sui tipi di turismo (ad es. viaggi abituali, viaggi di lavoro, turismo in alloggi privati come le seconde case, escursionismo, ovvero viaggi senza pernottamento) e sul comportamento turistico di particolari fasce di popolazione (ad es. giovani, anziani, coppie).

In base alla normativa vigente sulla diffusione dei dati statistici, è previsto da parte dell'Istat il rilascio dei dati elementari (c.d. 'file standard'), per motivi di studio e ricerca scientifica: “Sono distribuite altresì, ove disponibili, su richiesta motivata e previa autorizzazione del Presidente dell’Istat, collezioni campionarie di dati elementari, resi anonimi e privi di ogni riferimento che ne permetta il collegamento con singole persone fisiche e giuridiche”40. L'utente può acquistare la collezione dei dati ed effettuare elaborazioni diverse da quelle pubblicate. I file standard di 'Viaggi e vacanze', privati di

39

L'Istat adotta la procedura TRAMO-SEATS per la destagionalizzazione dei principali indicatori congiunturali economici. La procedura è disponibile gratuitamente sul sito internet dell'Istat. Si veda Gomez V. e Maravall A. (1996):'Tramo and SEATS: Instructions for the User', Bank of Spain, Working Paper n. 9628, Madrid.

ogni riferimento che ne permetta il collegamento con il rispondente41, sono composti da un file degli individui e un file dei viaggi, costruiti dalla sequenza dei files trimestrali gerarchici. Le informazioni strutturali della famiglia sono riportate nel file degli individui. Volendo analizzare le informazioni relative alle famiglie è sufficiente selezionare l'individuo 01 di ciascuna famiglia.

Un manuale per l'uso accompagna i files standard: l'utente può trovarvi la descrizione dei tracciati, le modalità delle variabili, le principali definizioni (viaggio, turista, viaggio di lavoro, viaggio di vacanza, vacanza ‘breve’, vacanza ‘lunga’) ed ogni informazione utile per un corretto utilizzo dei files ed una corretta interpretazione dei risultati. Particolare riguardo è riservato alla strategia di campionamento e alla valutazione dell'errore campionario delle stime: trattandosi infatti di indagine campionaria è importante mettere in grado l’utilizzatore di valutare autonomamente l’attendibilità delle stime da lui ottenute.

La Direttiva prevede che i paesi membri trasmettano ogni trimestre ad Eurostat i dati sia della domanda che dell'offerta turistica, al fine di raccogliere in un unico database europeo le statistiche ufficiali armonizzate sul turismo. Il piano di trasmissione, definito da Eurostat nel dicembre 1998, prevede una batteria di tavole statistiche pre-formattate: i formati e le specifiche per la compilazione e trasmissione delle tavole sono descritti in un apposito Compendio42. Le tavole sulla domanda turistica riguardano dati trimestrali e annuali. Una apposita procedura di elaborazione è stata dunque realizzata per produrre le tavole richieste. Esse contengono l'ammontare dei viaggi, dei turisti, dei pernottamenti