• Non ci sono risultati.

L’analisi cluster per la segmentazione della domanda turistica

PARTE II. IL CASO DI STUDIO: RISORSE RURALI E TURISMO IN

5. ELEMENTI METODOLOGICI D’INDAGINE

5.2 Strumenti di analisi della domanda turistica

5.2.4 L’analisi cluster per la segmentazione della domanda turistica

Nel presente lavoro, in ragione degli obiettivi prefissati, si è deciso di segmentare la domanda turistica intercettata nel campione con il metodo “a posteriori”, in ragione delle preferenze espresse dai turisti nei confronti delle risorse rurali. Non esiste, infatti, una conoscenza a priori di questo aspetto sebbene si intuisca una certa sensibilità nei confronti delle stesse che a monte determina la scelta di una visita alla provincia di Siena in cui la caratterizzazione della componente rurale è sicuramente molto rilevante (in termini territoriali ma anche di comunicazione turistica). Tale impostazione della segmentazione è tipica di un approccio di tipo esplorativo, soddisfacendo l’obiettivo di scoprire se ed in quale misura esistono differenze nell’eterogeneo insieme dei turisti per quanto riguarda la percezione, l’apprezzamento, la conoscenza del patrimonio rurale provinciale e se a tali presunte differenze di tipo psicografico e comportamentale corrispondono differenze anche nelle variabili socioeconomiche.

Precedenti segmentazioni presenti in letteratura sulla domanda turistica della provincia di Siena utilizzano sempre un approccio a priori. Nel piano turistico triennale 2006-2008 (CISET, 2006) i turisti vengono suddivisi in due gruppi: turisti alla prima visita (new comers) e turisti che hanno già precedentemente visitato le Terre di Siena (repeaters). All’interno di questi macrogruppi sono poi impiegate variabili socio demografiche (provenienza, età, ciclo di vita della famiglia) per individuare dei sottogruppi. In un altro lavoro, invece, si segmenta il mercato in base ai

75 principali modelli di fruizione del territorio (variabili comportamentali), distinguendo i turisti in base ai luoghi di prevalente interesse: turisti dei principali centri d’arte, turisti delle terme, turisti del territorio, e turisti enogastronomici (MINGHETTI, 2008).

Tali segmentazioni hanno un indubbio valore pratico e un’utilità strettamente legata agli scopi per i quali sono stati generati. Rispetto agli obiettivi del presente studio, tuttavia, si è preferito individuare un’altra modalità attraverso la quale procedere, al fine di distinguere l’insieme dei turisti che frequentano il territorio senese in modo tale da discriminare al massimo il ruolo delle risorse rurali nel processo decisionale che li spinge a visitare il territorio in esame.

Come accennato in precedenza l’algoritmo usato per la segmentazione è l’analisi cluster, eseguita per mezzo del programma di analisi statistica SPSS. Un‘ analisi cluster consiste di sei fasi indicate da Malhotra (2007) come:

1. Formulazione del problema

2. Selezione di una misura di distanza

3. Selezione di una procedura di “clustering” (segmentazione) 4. Decisione sul numero dei gruppi (segmenti)

5. Interpretazione dei segmenti 6. Valutazione della validità dell’analisi

Per quanto riguarda la prima fase si vuole segmentare il mercato in base alle preferenze ed attitudini dei turisti nei confronti delle risorse rurali. Sono state scelte a questo scopo nove variabili in cui il turista esprime l’importanza (in una scala di Likert a 5 punti) delle risorse rurali sia come fattore di richiamo alla base della destinazione turistica, sia come elemento all’interno dell’esperienza turistica. Un’altra variabile invece esprime la priorità data dai turisti alle zone rurali o urbane nell’itinerario di viaggio (assegnando un punteggio percentuale).

Le variabili scelte sono:

• Importanza della campagna senese come fattore di richiamo tra le diverse risorse turistiche provinciali

• Influenza del contesto rurale nella scelta della destinazione

• Itinerario

76

• Importanza della visita ad aree naturali

• Importanza della forte identità vitivinicola locale

• Qualità dei prodotti enogastronomici tipici

• Importanza dell’acquisto di prodotti enogastronomici tipici

• Importanza della pratica di sport all’aperto

Siccome l’obiettivo di un’analisi cluster è quello di raggruppare soggetti simili tra di loro, è necessaria una misura per valutare quanto essi siano simili tra di loro. L’approccio più utilizzato è quello della distanza a coppie di soggetti, con diversi metodi per misurare questa distanza. Il metodo per il quale è possibile rilevare una prevalente tendenza nella letteratura di riferimento (MALHOTRA, 2007) è rappresentato dalla distanza Euclidea quadratica7, intesa come la radice

quadrata della sommatoria delle differenze al quadrato fra ogni coppia di variabili.

Le procedure di “clustering” possono esser di tipo gerarchico, non gerarchico o misto. Le clustering gerarchiche possono essere agglomerative, qualora partano dagli oggetti separati per raggrupparli in cluster, e divisive, nel caso in cui partano da un insieme unico di oggetti per poi dividerlo progressivamente. Molti sono i metodi utilizzati per calcolare le distanze fra gruppi come il metodo di likage, metodo dei centroidi il metodo di Ward. Quest’ultimo risulta essere quello maggiormente impiegato ed opera formando i gruppi selezionando i vari soggetti da attribuire a ciascuno di essi in modo tale da rendere minima la varianza all’interno di ogni gruppo. Per ogni gruppo è calcolata la media per ogni variabile e gli oggetti vengono assegnati ad un gruppo in base alla distanza euclidea quadratica da tale media. Nelle clustering non gerarchiche (la principale è quella delle K-medie) il numero dei gruppi è prefissato a giudizio dell’analista e gli oggetti vengono raggruppati nei gruppi prefissati sempre in base alla loro distanza.

Nel presente lavoro si è deciso di utilizzare un approccio misto peraltro suggerito anche in letteratura (HAIR, 2006). All’inizio è stata eseguita una clusterizzazione gerarchica agglomerativa (utilizzando il metodo di Ward) allo scopo di identificare il numero di cluster. Successivamente, è stata eseguita un’ulteriore clusterizzazione delle K-medie utilizzando il numero di gruppi cosi prefissato. In numero di cluster (fase 4 del processo di segmentazione) è stato deciso nella prima fase di cluster gerarchica sulla base delle distanze alle quali i vari

77 gruppi sono man mano combinati tra di loro. Quando tale distanza all’improvviso fa un salto significa che i gruppi iniziano ad essere combinati a grandi distanze. Si legge lo stadio in cui ciò è avvenuto (nel nostro caso alla 362esima iterazione) e la differenza tra il numero di oggetti (nel presente caso 365 turisti) e lo stadio cui corrisponde tale salto (362) dà una soluzione appropriata del numero di cluster (365-362=3). Quindi, la soluzione a tre segmenti sembra appropriata. A questo punto la clusterizzazione delle K-medie offre come risultato la classificazione di ogni individuo in un segmento e la tabella dei centroidi finali che corrispondono alle medie ottenute per ogni variabile da ogni singolo segmento. L’interpretazione dei tre segmenti è stata fatta confrontando i centroidi finali di ogni segmento per ognuna delle variabili scelte. Altre variabili di tipo socio demografico (età, reddito, sesso) e comportamentale (spesa giornaliera, % di spesa per prodotti tipici e dell’artigianato) poi sono state utilizzate per vedere se tali segmenti differissero anche per queste caratteristiche.

La validità del modello di analisi è stata valutata dividendo il campione in due gruppi e ripetendo lo stesso procedimento. I centroidi finali sono risultati comparabili con quelli dell’analisi sull’intero campione quindi l’analisi si può dire valida.