Università degli studi ROMA TRE
Scuola Dottorale in Ingegneria
Sezione Scienze dell‟Ingegneria Civile
XXIII Ciclo
Tesi di Dottorato
Modello di scelta
per la distribuzione delle residenze
per la pianificazione della mobilità urbana
Dottorando: Stefano Saracchi
Docente guida: Prof. Stefano Carrese
Coordinatore del dottorato: Prof. Leopoldo Franco
Collana delle tesi di Dottorato di Ricerca In Scienze dell‟Ingegneria Civile
Università degli Studi Roma Tre Tesi n° 29
Abstract
In this scientific research, in the land use and transport interaction framework, the type of link (a correlation or causality) between the built environment and the travel behavior has been investigated: the relationship between neighborhood characteristics and travel behavior is taken into account to understand if attitudes and neighborhood preferences influence the residential location choices and travel behavior. It could be useful to examine, whether neighborhood design influences travel behavior or whether travel preferences influence the choice of neighborhood. This could lead to better understand the effect of the transport policies. A lot of studies (Hansen 1959, Lowry 1964, Nuzzolo 2006, Cao, Mokhtarian and Handy 2008) have verified that a suitable transport planning leads to an urban economics development well-matched with the land use aims (e.g. Road Pricing, Congestion Charge and Eco-pass). The literature in transport research underlines the tools to catch the energetic sustainable town; these tools can be divided into 2 different objectives:
1) minimize the total travel time on the road network (in other terms shorten home-work distance)
2) maximize the modal split on behalf of public transport.
In literature it is still not fully known which are the attitudes for the residential location choice (R.L.C.) and if between these attitudes even the travel preferences are included, and how this influences the R.L.C.. To investigate if there is a casuality or an effect between the two choices (R.L.C. and Travel choice) a survey in order to calibrate a mixed multinomial logit model in the Rome metropolitan region has been conducted. In the research, after a literature review of the land use transport models, the Experimental Design Theory will be presented and the main effect of a good survey will de discussed. It will be shown how to investigate the problem and which are the main attitudes in travel behavior and residential location choice in Rome. The Fig.1 marks the sub-area of the land use and transport system and how they are in connection.
Fig. 1 – Land Use Transport interaction.
The cities in Italy are changing according to the decentralization criteria even for the household economic constraint, assuming a feature as different as possible from the old compact urban centre; new roads grow up; the buildings and the blocks are divided by streets of more than two lanes per direction and this gives an increase of the total travel time on the network for the home-work transfer. It‟s easy to prove that the residential and activities replacing follows the accessibility increase or decrease. The aim of the paper is to individuate the main attributes of the utility function of the R.L.C. to evaluate the different transport policies measure to build the town to serve with an optimal transport solution. In order to obtain a result it will be necessary to make a survey on the population with an optimal experimental design - efficient designs - in order to understand the behavior of the 3 millions Roman residents with the minimum sample and with the minimum error.
Through the survey it is possible to explore the connections among residential accessibility, employment, income, and auto ownership and it will be possible to focus the attention on the potential discrete choice model which will be able to predict the residential choice function of the different transport policies. A first survey has been made and the first results are useful to calibrate a choice tasks survey through the Experimental Design Theory. Later through the “Biogeme” software, the mixed utility model parameters are calibrated and with the statistical test the validity of the results are estimated. A distribution of the parameters
after the calibration with biogeme is shown. For the parameters calibration even the normal, log-normal and Johnson distribution for the latent class are taken into account in order to view the differences between the outputs and underline which distribution better represents the real R.L.C., even trying to build a new Model.
Indice
ELENCO DELLE FIGURE ... 6
1. INTRODUZIONE ... 8
2. STATO DELL’ARTE ... 13
3. L’EXPERIMENTAL DESIGN – IL PROGETTO... 21
FASE 1: SPECIFICAZIONE DEL MODELLO ... 22
FASE 2: CREAZIONE DEL DESIGN ... 22
FASE 3: CREAZIONE DEL QUESTIONARIO ... 22
ORTHOGONAL DESIGN ... 23
Full factorial design e fractional factorial design ... 23
Orthogonal design ... 24
Orthogonal optimal design ... 25
EFFICIENT DESIGN ... 25
BAYESIAN DESIGN ... 27
ORTHOGONAL VS EFFICIENT DESIGN ... 28
I VALORI DEI PARAMETRI A PRIORI ... 29
DISCUSSIONE SUGLI EFFICIENT DESIGN ... 29
4. INTRODUZIONE AI MODELLI DI UTILITÀ ALEATORIA ... 31
IL MODELLO LOGIT MULTINOMIALE ... 32
IL MODELLO LOGIT GERARCHIZZATO A UN LIVELLO ... 33
IL MODELLO LOGIT GERARCHIZZATO A PIU‟ LIVELLI ... 35
IL MODELLO CROSS-NESTED LOGIT ... 36
IL MODELLO MIXED LOGIT ... 37
5. LA TEORIA DELLE DECISIONI NEL SETTORE DEI TRASPORTI ... 39
6. L'IDENTIFICAZIONE DEL MODELLO... 43
LA STIMA DEL MODELLO ... 46
STATISTICA DEL MODELLO DI UTILITA‟ ... 52
Test formali sui coefficienti del modello ... 52
7. LA MATRICE VARIANZA COVARIANZA ... 55
8. LA TEORIA DELLE PRIORITÀ ... 65
9. IL CASO DI STUDIO ... 74
INFORMAZIONI SPECIFICHE ... 85
10. LE INDAGINI ... 88
Dati RP ... 88
Dati SP ... 90
INDAGINE FACE TO FACE: I RISULTATI ... 94
Scelta singola ... 94
Scelta di gruppo... 96
CONFRONTO TRA INDAGINI - MAIL E FACE TO FACE ... 100
Scelta del singolo intervistato ... 100
Dati RP ... 100
Dati SP ... 102
CONFRONTO TRA SCELTE SINGOLE E DI GRUPPO ... 103
Dati RP ... 103
Dati SP ... 104
11. CALIBRAZIONE DEL MODELLO D’UTILITÀ ALEATORIA ... 106
INDAGINE SP EMAIL ... 108
Utility functions ... 108
Utility parameters ... 109
Correlation of coefficients ... 109
INDAGINE SP FACETO FACE ... 110
Utility functions ... 110 Utility parameters ... 111 Correlation of coefficients ... 112 INDAGINE SP DI GRUPPO ... 113 Utility functions ... 113 Utility parameters ... 114 Correlation of coefficients ... 114 INDAGINE RP ... 115 Utility functions ... 115 Utility parameters ... 116 Correlation of coefficients ... 116
12. IL MODELLO NEL CONTINUO ... 120
13. RISULTATI E CONCLUSIONI ... 127
Elenco delle figure
Fig. 1 – Land Use Transport interaction. ... 2
Fig. 2 – Choice Experiment... 21
Fig. 3 – Standard Error ... 26
Fig. 4 – Random Utility Model ... 38
Fig. 5 – Esempi di distribuzione dei parametri nel continuo ... 48
Fig. 6 –distribuzione T-Student ... 53
Fig. 7 – Esempi di Campionamento ... 56
Fig. 8 – Esempi di aumento di affidabilità nell‟intervista ... 56
Fig. 9 – Schema logico funzionale per la determinazione dei parametri 57 Fig. 10 – Distribuzione degli errori ... 58
Fig. 11 – I Livelli degli attributi ... 59
Fig. 12 – Tabella degli Scenari... 60
Fig. 13 – Dalla città attuale alla città di progetto ... 66
Fig. 14 – Dalla città attuale alla città di progetto con gerarchizzazione degli interventi... 67
Fig. 15 – Ranking Priority Intervention ... 72
Fig. 16 – Suddivisione in municipi della città di Roma ... 74
Fig. 17 – Percentuale di intervistati per ciascun municipio ... 88
Fig. 19 – Distribuzione del “Parametro Accessibilità” in relazione al reddito... 122
Fig. 20 – Distribuzione del “Parametro Densità” in relazione al reddito ... 123
Fig. 21 – Distribuzione del “Parametro Verde” in relazione al reddito 124
Fig. 22 – Distribuzione del “Parametro Sicurezza” in relazione al reddito ... 125
Fig. 23 – Distribuzione del “Parametro T. Casa-Lavoro” in relazione al reddito... 126
1. Introduzione
Nel corso della vita gli individui sono portati a compiere alcune scelte che influenzeranno in maniera rilevante il loro benessere sociale ed il loro comportamento. In particolare una di queste scelte risulta essere senza ombra di dubbio dove vivere: non solo in quale città, in metropoli come Roma anche in quale porzione di territorio. Per cogliere il suo significativo impatto, la scelta residenziale deve essere analizzata assieme ad uno studio accurato del sistema territoriale. Di conseguenza è logico supporre che vi sia una stretta correlazione tra dove si è deciso di vivere e le ripercussioni sul sistema dei trasporti. Per comprendere tale complessa interazione fra il sistema dei trasporti e il territorio è necessario considerare non solo l‟impatto della distribuzione delle attività urbane sul territorio (offerta residenziale, disponibilità di servizi e attività commerciali) sulla domanda di spostamenti e, quindi, sulle prestazioni del sistema, ma anche come le variazioni dell‟offerta di trasporto, in termini di livello d‟accessibilità di differenti zone, modifichino l‟attrazione localizzativa nelle scelte residenziali. Queste ultime inducono, anche nel medio periodo, variazioni della distribuzione delle residenze e delle attività economiche che a loro volta provocano variazioni nella domanda di spostamenti. Stabilità questa duplice dipendenza è chiaro come la pianificazione urbanistica influenzi il sistema dei trasporti e viceversa. Il Piano Regolatore Generale di una città sviluppa una serie di indirizzi su come costruire o riurbanizzare il tessuto cittadino tuttavia in nessun caso viene posta attenzione su un tema fondamentale: il tempo di attuazione. L‟assenza di una specifica programmazione dei tempi di realizzazione dei vari interventi impone l‟obbligo di capire quali siano le forze attrattive (o repulsive) che inducano un individuo ad effettuare una delle sue scelte più importanti. Il mercato degli immobili italiani e dei finanziamenti per acquistarli sono tali da non rendere particolarmente agevoli più cambi di residenza nel breve periodo. L‟utente ben consapevole di questi vincoli quando effettua la sua scelta la pondera prestando la massima attenzione. L‟obiettivo del presente lavoro è identificare in primo luogo quali siano le forze, ovvero gli attributi, che determinano una scelta d questo tipo e se
tra tali parametri esiste una interrelazione sostanziale tra la scelta residenziale e le attitudini che l‟utente ha al sistema di trasporto.
Il sistema di trasporti determina, dunque, da una parte, la domanda di spostamenti fra punti diversi sul territorio e, dall‟altra, modifica l‟offerta di servizi per soddisfare tale richiesta. In sostanza, al fine di valutare gli impatti di medio-lungo termine sulla domanda di spostamenti dovuti alle variazioni dell‟offerta di trasporto, non è possibile ignorare gli effetti che tali cambiamenti hanno sulla localizzazione residenziale e sull‟occupazione ovvero l‟interazione fra il sistema dei trasporti e il territorio. In questa tesi dunque si espone, dopo un ampia rivisitazione della letteratura su tale argomento, un modello analitico per la determinazione delle complesse interazioni tra i trasporti e la scelta della distribuzione spaziale delle residenze.
In generale quando si parla di “scelta” si fa riferimento a quel processo mentale di pensiero implicato nel giudizio del valore di diverse opzioni a disposizione che si conclude con la selezione di una di esse ai fini della conseguente azione. Difficilmente, nella realtà, si sceglie tra opzioni dalle conseguenze chiaramente negative ed altre che conducono apparentemente a risultati positivi: « la nostra decisione non riguarda il trovare l'unica soluzione facile e giusta tra altre scelte sfavorevoli, ma nell'individuare tra diverse opzioni complesse ognuna con una propria densità di probabilità di fattori negativi, quella che presenta maggiori possibilità di futuri interessanti sviluppi, o quella che si fa al momento preferire perché con sviluppi "certi" rispetto a quelli "incerti" delle altre opzioni, o quella ancora che presenta probabili perdite che potremmo meglio sostenere.
Chiarendo queste basi si coglie immediatamente la multidisciplinarità del tema che valorizza aspetti dell‟Ingegneria dei Trasporti in relazione con temi urbanistici e modelli socio-economici dell‟individuo.
È evidente quindi che in tutto il mondo, le grandi metropoli urbane hanno nel tempo maturato una distribuzione delle attività e delle residenze su tutto il territorio cittadino tali da rendere essenziale il ruolo dell‟ingegnere dei trasporti per una corretta pianificazione di tutti gli spostamenti e delle scelte. Le città evolvono e crescono e l‟analista dei trasporti deve avere capacità di pianificazione per far sviluppare i centri e le periferie nella giusta direzione. Tale argomento seppur di frontiera nell‟ambito della ricerca scientifica di settore nel corso del tempo è divenuto una “scienza di sistema” che sempre più studia non solo il sistema delle infrastrutture e dei trasporti ma in ampia parte anche le aree sociali che coinvolgono la
vita di tutti i giorni. È ormai noto che ad esempio un intervento sul sistema dell‟accessibilità di una certa area, come la realizzazione di un corridoio della mobilità o di una metropolitana leggera, si ripercuota a livello generale sulla rilocalizzazione dei sistemi produttivi di quella stessa area; le interazioni con l‟urbanistica sono quindi notevoli ed evidenti ma non ancora determinate in senso univoco. È altrettanto evidente che, mai come in questo momento, il termine “Sistema” ben si adatta allo studio integrato multidisciplinare dell‟argomento: Architettura del sistema urbanistico, sociologia dei comportamenti collettivi ed altro, fanno capire come il tema è di particolare importanza perche determinate le componenti di queste relazioni saremmo in grado di capire come la struttura dei trasporti deve essere pianificata per servire la città o applicata anche per correggere sviluppi non sostenibili dell‟agglomerato urbano. Già storicamente molti autori ci danno elementi di riflessione sul tema; infatti gli spunti più penetranti per questo discorso vengono forniti ponendo in luce il contrasto ineliminabile che vi è tra una città percepita e una città vissuta, e ancor di più tra la libertà che nasce nel desiderio e nella memoria e il benessere che nasce nella funzionalità. Non vi sono dati obiettivi a convalidare e a quantificare le sue intuizioni e i suoi archetipi ideali: in realtà è difficile trovare strumenti atti a tracciare il confine tra libertà e benessere anche nelle opere degli architetti, degli urbanisti e dei loro critici. I primi punti fermi per un‟analisi, via via meno ambiziosa, li potremmo trovare nella sperimentazione della psicologia ambientale e nelle teorie della semiotica. Da ciò nasce l‟esigenza di chiarire che il termine “scelta residenziale” già di per sé presuppone di poter effettivamente scegliere e soprattutto di voler effettivamente scegliere di compiere un cambiamento di residenza. Come già scritto, la scarsa mobilità naturale trova, per di più in Italia, un sistema residenziale caratterizzato dalla sempre minor presenza di alloggi in affitto e dal crescente vincolo costituito dalle case di proprietà. A ciò va aggiunta la forte penalizzazione fiscale nella compravendita ed il peso fiscale centrale e periferico nei confronti degli immobili. Perciò in Italia tale scelta va analizzata come iniziale ed univoca e vanno quindi assolutamente determinate con il maggior dettaglio possibile le energie (gli attributi) che influenzano in maniera sistemica la decisione.
La scelta residenziale che viene compiuta dal singolo terrà conto di numerosi vincoli legati sia ad aspetti economici quali la disponibilità di bilancio, sia ad aspetti logistici, primo tra tutti quello dell‟ubicazione e del tipo di lavoro svolto, sia ad aspetti sociali, quali la conservazione del
proprio ambiente familiare e sociale, o la possibilità di ritrovarne uno di proprio gradimento. Anche in questo andrebbero verificate delle ipotesi che determinano una sequenza ben marcata della priorità delle scelte. Potrebbe accadere infatti in qualche paese occidentale come l‟America che la scelta residenziale sia subordinata alla scelta lavorativa cosa che invece sembra essere capovolta in un mercato del lavoro italiano. Tuttavia compatibilmente con i vincoli la scelta cercherà di ottimizzare la funzione obiettivo della soddisfazione individuale (o familiare). Questa soddisfazione in generale non è immediatamente misurabile in termini monetari, in quanto vi concorrono fattori quali il tempo libero e lo spazio vitale disponibile. Un ulteriore fenomeno che negli ultimi anni sta caratterizzando le grandi metropoli, andando poi ad influenzare anche la scelta residenziale, è quello dell‟ “urban sprawl” con cui si intende uno sviluppo urbano orizzontale, caratterizzato da bassa densità. In questo modo si è già chiarita una dipendenza iterativa tra i vari sistemi. La determinazione della funzione di comando che porta a modificare gli altri modelli è necessaria per pianificare quindi una città sostenibile sotto il punto di vista sociale. In particolare questa dispersione urbana è caratterizzata da molti utilizzi del terreno che si presentano contemporaneamente. Le aree commerciali, residenziali ed industriali sono separate le une dalle altre. Grandi porzioni di terreno sono destinate allo stesso tipo di utilizzo. Le aree sono separate tra loro da strade, zone verdi, o altri tipi di barriere. Come risultato, i posti dove le persone vivono, lavorano, acquistano e si divertono sono necessariamente separate tra loro. La dispersione urbana consuma molta più terra rispetto al normale sviluppo urbano se le nuove aree son create con una bassa densità abitativa. Gli edifici hanno solitamente meno piani e sono separati dagli altri attraverso siepi, giardini, strade o parcheggi, sono lontani tra loro e a causa dell'alto utilizzo di automobili molto spazio è riservato ai parcheggi. Il risultato dello sviluppo a bassa densità in molte comunità è che lo sviluppo e l'"urbanizzazione" del terreno prosegue ad un tasso superiore rispetto all'incremento della popolazione. In alcuni posti la popolazione che cresce dell'uno o due per cento può causare un incremento dell'uso del terreno fino al trenta per cento. Le aree di dispersione urbana sono anche caratterizzate dal fatto di essere estremamente dipendenti dalle automobili per il trasporto. Molte attività, come compra-venidte, spostamenti sul luogo di lavoro, tempo libero, ecc. richiedono l'uso di macchine come risultato sia dell'isolamento dalla città che da quello da zone industriali e commerciali. Camminare o utilizzare
altri tipi di trasporto non è efficiente. Lo sviluppo in queste aree tende ad essere su scala maggiore rispetto alle zone abitate più concentrate. Questo fatto implica case più grandi, strade più larghe e iperspazi commerciali con relativi immensi parcheggi. A causa del fatto che lo sviluppo procede ad un ritmo accelerato, gli edifici adiacenti tendono ad essere simili gli uni agli altri.
Porsi dunque l‟obiettivo di determinare la base mentale su cui vengono compiute le scelte residenziali, se influenzano gli spostamenti sistematici ed asistematci, se esiste una reciproca interdipendenza tra i due fattori con ripercussioni sul sistema sociale economico e schematizzare ciò con un modello di scelta discreta con utilità aleatoria è ormai oggi necessario per il mondo della ricerca.
2. S
tato dell’arte
Nel corso del dottorato si sono potute approfondire gran parte delle ricerche svolte sul tema e, essendo l‟argomento di estrema attualità e di frontiera nell‟ambito scientifico, si è potuta verificare l‟assenza di un completo e delineato filone di ricerca. In altri termini la comunità scientifica ancora sta ponendo le basi e le ipotesi di partenza del problema. Ci si domanda costantemente, con tutte le opportune differenze tra Paese a Paese, se l‟ambiente urbano è influenzato dal sistema dei trasporti, se il contrario o se la mutua interrelazione può far variare l‟uno rispetto all‟altro iterativamente. Stabilire questa prerogativa di base vuol dire definire univocamente quali siano le variabili endogene ed esogene del sistema.
In economia (e in econometria, in particolare nello studio dei modelli simultanei su serie storiche) si definisce variabile esogena una variabile economica che, all'interno di un determinato modello, assume un valore indipendente dall'equilibrio rappresentato nel modello stesso; si tratta quindi di una variabile che influisce sull'equilibrio rappresentato nel modello, ma non è influenzata dall'equilibrio stesso (è causa dell'equilibrio e non l'effetto di questo, ma è l'effetto di altre variabili che non appartengono al modello).
L'esempio più semplice è rappresentato dal reddito o dal progresso tecnico in un semplice modello domanda-offerta (modello di mercato concorrenziale): la quantità domandata è funzione inversa del prezzo di mercato e funzione diretta del reddito dei consumatori; l'offerta è funzione diretta del prezzo di mercato e funzione inversa del progresso tecnico; in un modello di questo tipo abbiamo quattro variabili: quantità, prezzo, reddito e progresso tecnico; prezzo e quantità sono tipicamente variabili endogene (nella curva di domanda la quantità dipende dal prezzo, nella curva di offerta il prezzo dipende dalla quantità; i valori effettivi della quantità e del prezzo dipenderanno però dall'equilibrio simultaneo tra le due relazioni); il reddito e il progresso tecnico sono invece tipicamente variabili esogene, in quanto i loro valori vengono determinati altrove rispetto al modello di riferimento, e quindi influenzano l'equilibrio del modello considerato, ma non ne vengono
influenzati (saranno cioè le variazioni del reddito e del progresso tecnico a variare l'equilibrio del mercato e non viceversa).
Nella realtà non esistono delle variabili totalmente esogene, visto che tutti gli aspetti della realtà si possono considerare collegati attraverso relazioni complesse, tuttavia è possibile individuare delle variabili che, all'interno di un certo modello, possono considerarsi approssimativamente esogene (in quanto le variazioni dell'equilibrio sono in grado di influenzare solo relativamente il valore di queste variabili).
In pratica è emerso che le ricerche condotte in passato cercavano principalmente di prevedere i flussi di traffico per una data configurazione del land use mentre gli studi più recenti cercano di comprendere come i comportamenti di viaggio possono essere influenzati da variazioni nella struttura dell‟area urbana. In generale, gli analisti hanno cercato di modellare le interazioni fra territorio e traffico per poter studiare diverse problematiche, come ad esempio definire gli aspetti progettuali che devono essere considerati nella realizzazione dei quartieri in modo da ridurre l‟uso dell‟automobile, incrementare la mobilità pedonale e, conseguentemente, diminuire le emissioni inquinanti.
Gli studi presenti in letteratura possono essere classificati a seconda delle diverse variabili del sistema dei trasporti che vengono influenzate dalle caratteristiche del sistema territoriale.
Infatti, le variabili di land use possono avere impatti sulla scelta del modo di trasporto, sulla distanza percorsa, sul tempo impiegato per compiere lo spostamento, sulla frequenza degli spostamenti.
Buona parte degli studi condotti è focalizzata sulle variazioni della scelta modale provocate dai cambiamenti che avvengono nelle variabili di land use. Naess (2005) sostiene che la struttura urbana influenza i comportamenti di viaggio futuri di lunga durata. Da questo studio risulta che la struttura urbana non è la sola condizione che fa variare i comportamenti di viaggio ma semplicemente una delle condizioni che influenza i comportamenti di viaggio.
Handy (2005) ha effettuato una rassegna di studi presenti in letteratura relativi ad alcune città degli Stati Uniti concludendo che la relazione fra trasporti e land use non è ancora completamente compresa e non è possibile definire il grado di intensità di questa relazione e l‟endogeneità della localizzazione e dei trasporti. Ad esempio, non risulta chiaro se le persone scelgono di localizzare la propria residenza in zone molto dense perché preferiscono usare poco l‟auto. Di conseguenza, i pianificatori si chiedono se è più conveniente costruire un maggior numero di autostrade
per contribuire alla dispersione urbana e aumentare l'uso dell'auto oppure promuovere nuove strategie per ridurre l‟uso dell'auto.
Abreu e Silva et al. (2006) hanno elaborato un modello ad equazioni strutturali relativo alla città di Lisbona per valutare la relazione tra land use, caratteristiche socio-economiche e comportamenti di viaggio. A differenza degli altri studi, questo modello prevede indicatori del sistema dei trasporti che riguardano le decisioni sia a breve sia a lungo termine. Dal punto di vista concettuale il modello prevede che le caratteristiche del land use siano influenzate dalle caratteristiche socio-economiche degli intervistati e del loro nucleo familiare di appartenenza.
Le variabili del comportamento di viaggio sono influenzate dalle variabili socio-economiche e dalle variabili di land use. Per determinare i coefficienti del modello sono state analizzate le relazioni tra le variabili. Gli autori hanno verificato che abitare nei quartieri tradizionali favorisce l'utilizzo del trasporto pubblico, incrementa il numero di spostamenti non motorizzati e, di conseguenza, comporta un minor utilizzo dell‟auto. Inoltre, lavorare nelle zone centrali incrementa l‟uso dei mezzi collettivi e comporta un minor numero di auto per famiglia. Al contrario, abitare nelle zone periferiche ma ben servite dalla rete stradale comporta un maggior numero di auto per famiglia e un maggior numero di spostamenti motorizzati. Lavorare in queste zone comporta anche un maggiore utilizzo dell‟auto ma questo non provoca necessariamente un minor utilizzo dei mezzi collettivi. A differenza degli studi riguardanti le città americane, nel caso di Lisbona non viene considerato il comportamento di viaggio solo nelle zone residenziali ma anche in quelle in cui sono localizzati i posti di lavoro.
Utilizzando i dati provenienti da un'indagine sulle famiglie e sui trasporti condotta in California fra il 2000 e il 2001, Yoon et al. (2009) hanno svolto un'analisi esplorativa per esaminare le relazioni fra indicatori dei comportamenti di viaggio, di land use e di offerta di autostrade. Sono stati calibrati tre sistemi di modelli. Il primo stima gli spostamenti non motorizzati e si compone di due modelli, uno che considera un generico componente della famiglia e l‟altro che riguarda solo i comportamenti di viaggio degli adulti patentati. Il secondo sistema stima la domanda di trasporto pubblico mentre il terzo gli spostamenti motorizzati, nel caso in cui a bordo del veicolo vi sia solo il conducente.
I risultati di questo studio mostrano che la densità delle residenze, delle attività commerciali e delle infrastrutture di trasporto sono variabili in grado di evidenziare la grande varietà di aspetti che caratterizzano i
comportamenti di viaggio. Infatti, queste variabili descrivono l'accessibilità in termini di caratteristiche delle aree residenziali, possibilità di opportunità di lavoro e connettività mediante le infrastrutture stradali. Lo studio condotto da Cao et al. (2009) ha lo scopo di individuare le caratteristiche dei quartieri che influenzano gli spostamenti “asistematici” (cioè gli spostamenti effettuati per un motivo diverso dal lavoro) e di valutare se la scelta della residenza ha influenza sui trasporti. Lo studio è basato sui dati relativi alle famiglie residenti in otto quartieri della regione settentrionale della California. Le variabili esplicative considerate sono state classificate in quattro gruppi: caratteristiche del quartiere, preferenze del quartiere, atteggiamenti di viaggio, caratteristiche socio-demografiche. La dipendenza tra le variabili è stata elaborata mediante un modello di regressione ad equazioni apparentemente non correlate. Dai risultati è emerso che le caratteristiche del quartiere sono associate alle decisioni di viaggio degli individui, in particolare alla frequenza degli spostamenti non motorizzati. Inoltre, la diversità nella struttura urbana all‟interno dello stesso quartiere tende a scoraggiare gli spostamenti in auto e facilita l‟uso del trasporto pubblico o la scelta di modi non motorizzati, soprattutto nel caso in cui sono presenti servizi di trasporto pubblico efficienti e infrastrutture che facilitano la mobilità pedonale. Molto interessante risulta anche la dipendenza osservata tra la distanza percorsa e le variabili di land use.
Bagley e Moktharian (2002) hanno elaborato un sistema di equazioni strutturali per esaminare l‟influenza del tipo di quartiere di residenza sui comportamenti di viaggio, considerando variabili attitudinali, di stile di vita e demografiche. Questo studio è stato basato su dati del 1993 relativi ai residenti di cinque quartieri della baia di San Francisco. Nel modello sono state considerate diverse variabili, relative al tipo di quartiere, alla domanda di trasporto, alle caratteristiche attitudinali e alla localizzazione dei posti di lavoro. Gli autori hanno verificato che le variabili relative alle attitudini e allo stile di vita hanno un importante impatto sulla domanda di trasporto, in particolare sulle distanze percorse. Inoltre, quando si tengono in considerazione le variabili attitudinali, di stile di vita e socio-demografiche, le caratteristiche del tipo di quartiere hanno uno scarso impatto sui comportamenti di viaggio.
Alcuni studi analizzano la relazione land use/trasporti considerando contemporaneamente le diverse variabili del sistema dei trasporti. Van Acker et al. (2007) hanno studiato l'influenza delle variabili spaziali, socio-economiche e demografiche sui comportamenti di viaggio
costruendo un modello ad equazioni strutturali. L‟analisi è stata svolta sulla base dei dati relativi ad una città fiamminga e mette in evidenza le differenze esistenti fra le città europee e quelle americane in riferimento alle interazioni trasporti/territorio. Gli autori hanno verificato che i comportamenti di viaggio (distanza percorsa, tempo di viaggio, frequenza degli spostamenti) sono influenzati prevalentemente dalle caratteristiche socio-economiche delle famiglie. Infatti, ad uno stato sociale alto corrisponde un comportamento di viaggio più complesso. Peng e Lu (2007) hanno studiato gli impatti che la densità urbana può avere sulla domanda di trasporto. Lo studio è stato svolto su due città cinesi aventi differenti caratteristiche morfologiche (una situata in pianura, l‟altra in collina). Sono stati considerati i diversi aspetti della densità urbana, distinguendo fra densità semplici (densità della popolazione, densità dei posti di lavoro, densità delle attività commerciali) e densità composte (densità lavoro-casa, densità scuola-casa, densità negozi-casa). L‟elaborazione dei dati è stata svolta utilizzando le tecniche di analisi spaziale e di statistica spaziale con l‟ausilio di un GIS opportunamente costruito. Sono state valutate le relazioni tra ogni densità urbana e le caratteristiche della domanda di trasporto, quali spostamenti prodotti, distanza percorsa, tempo di viaggio, modo di trasporto. Gli autori hanno osservato che le diverse densità urbane hanno determinati effetti sulla domanda di trasporto.
Bhat e Waddell1 (2007) dimostrano quali siano gli impatti dell‟ambiente costruito sulle scelte residenziali e in che modo essi possano influire su l‟uso del territorio e sul sistema trasportistico presente. Sono invece Bin
Zhou e Kara Kockelman2 (2008) ad affrontare il tema dell‟autoselezione nella scelta residenziale che attraverso uno studio condotto in Texas hanno verificato gli effetti dell‟autoselezione (intesa come quel processo secondo cui ogni individuo è destinato a vivere in un determinato luogo senza possibilità di scelta) nella scelta dell‟abitazione distinguendo tra ambito urbano ed ambito suburbano.
In relazione alle scelte residenziali sono anche numerosi gli studi riguardanti l‟interdipendenza con le scelte lavorative. I primi ad utilizzare
1 Abul Rawoof Pinjari, Ram M. Pendyala, Chandra R. Bhat, Paul A. Waddell “Modeling residential sorting effects to understand the impact of the built environment on commute mode choice”
2 Bin Zhou, Kara M. Kockelman “Self-selection in home choice: use of treatment effects in evaluating the relationship between the built environment and travel behavior”
a tal proposito un nuovo tipo di approccio sono sempre Bhat e Waddell3
(2006) che modellizzano il processo per cui la scelta residenziale
influenza la scelta del luogo in cui lavorare e viceversa. L‟obiettivo principale è quello di creare un modello di struttura dell‟interdipendeza tra le scelte che una famiglia fa rispetto alla localizzazione residenziale e le scelte che i lavoratori appartenenti alla famiglia stessa fanno nella localizzazione del luogo di lavoro. Un ulteriore passo avanti che viene fatto è quello di non considerare più la popolazione come un‟unica entità che ragiona allo stesso modo, ma utilizzare piuttosto un approccio di segmentazione, che prevede cioè la suddivisione della popolazione in diversi segmenti ognuno caratterizzato da particolari variabili decisionali.
Xinyu Cao e Patricia Mokhtarian4 (2005) studiano invece il tipo di relazione esistente tra comportamento di viaggio ed ambiente costruito. L‟indagine è stata condotta nel Nord California ed è stata effettuata una suddivisione tra quartieri tradizionali (costruiti prima della seconda guerra mondiale) e quartieri suburbani.
Sono stati creati poi due database: uno comprendente i cosiddetti “movers” ovvero coloro che si sono trasferiti nel quartiere nell‟ultimo anno, e un altro contenente i “non movers”. I risultati hanno mostrato la forte relazione che c‟è tra il design del quartiere e il comportamento di viaggio. Infatti coloro che scelgono di vivere nell‟ambiente suburbano sono anche coloro che sono più legati alla modalità di trasporto privata. Per questo motivo con delle politiche di uso del territorio corretto che permettessero di avvicinare le residenze alle destinazioni si potrebbe diminuire l‟utilizzo del mezzo di trasporto privato.
Uno degli studi più recenti nell‟ambito delle scelte residenziali è quello di
Marcucci e Danielis5 (2010) che sviluppa l‟argomento in modo
innovativo tenendo conto sia delle scelte del singolo componente della famiglia (scelta individuale) sia della scelta dell‟intera famiglia (scelta di gruppo). La probabilità che una famiglia scelga di risiedere in una specifica zona dipende da numerosi fattori. Volendo studiare
3
Paul Waddell, Chandra Bhat, Naveen Eluru, Liming Wang, Ram M. Pendyala “Modeling the interdependence in household residence and workplace choices” 4 Susan Handy, Xinyu Cao, Patricia Mokhtarian “Correlation or causality between the built environment and travel behavior?Evidence from Northern California
5 Edoardo Marcucci, Amanda Stathopoulos, Romeo Danielis, Lucia Rotaris “Residential choices and interaction in three member households: a choice experiment”
analiticamente la scelta si deve, in primo luogo, individuare il „soggetto decisore‟ che può essere sia un singolo individuo (il capofamiglia) sia un‟entità collettiva (la coppia dei genitori o l‟intera famiglia). Vi sono, inoltre, caratteristiche proprie del decisore che possono avere un impatto rilevante sulla scelta quali ad esempio, il reddito, la composizione familiare, la condizione professionale, la sensibilità all‟ambiente, ed altro ancora. Negli ultimi tempi, diversi studi hanno utilizzato il metodo delle preferenze dichiarate, raccogliendo dati attraverso esperimenti d‟analisi congiunta, per stimare modelli di scelta discreta relativamente alla localizzazione residenziale delle famiglie. Questo approccio presenta due vantaggi apprezzabili rispetto a metodi concorrenti per lo studio dell‟analisi delle scelte residenziali. In primo luogo, la scelta della zona di residenza è studiata impiegando la teoria microeconomica assieme a modelli d‟utilità casuale in cui attraverso la definizione di ipotetici esercizi di scelta si modellizza la scelta attraverso trade-off tra i vari attributi che caratterizzano le diverse zone come ad esempio, il tempo di viaggio, il costo d‟affitto/acquisto e la possibilità di accedere ai servizi. In secondo luogo, l‟approccio permette di testare se la sensibilità per gli attributi varia in funzione delle caratteristiche socio-demografiche del soggetto decisore.
Il benessere individuale è basato, in larga misura, su una serie complessa di interazioni tra i membri della famiglia. Fino a poco tempo fa, sia la teoria sia le analisi empiriche volte a formulare raccomandazioni di politiche di intervento hanno implicitamente caratterizzato la famiglia attraverso un unico insieme di preferenze. Un crescente corpo di evidenze empiriche sottolinea, tuttavia, i rischi connessi all‟adozione di una tale prospettiva. Il costo implicito connesso a tale scelta è ascrivibile alle possibili distorsioni previsionali. Infatti, dato che molte scelte compiute dalla famiglia vengono prese in modo collegiale gli errori commessi nella loro valutazione si tradurranno in previsioni approssimate e interventi inappropriati. Mentre è possibile che gli elementi d‟interazione di gruppo si compensino reciprocamente nel processo di aggregazione delle scelte, producendo previsioni assimilabili a quelle derivanti dal cosiddetto modello unitario, che ipotizza una struttura unica delle preferenze della famiglia, è probabile che il comportamento di scelta sarà meglio
modellizzato riconoscendo espressamente il ruolo della
negoziazione/interazione di gruppo, delle strategie di processamento dell‟informazione, dei singoli e dei gruppi, oltre che della distribuzione di potere fra i membri che partecipano al processo decisionale.
In realtà l‟analisi bibliografica sul tema non si poteva concludere analizzando solamente gli studi effettuati sulle relazioni appena descritte ma doveva approfondire anche i temi legati all‟experimental design e alla calibrazione dei modelli di utilità. Pertanto nell‟ottica di condurre uno studio che partisse dall‟acquisizione delle informazioni sullo stato dell‟arte delle ricerche già effettuate si è analizzato quale fosse il miglior metodo per la progettazione di un questionario di intervista oltre che per la calibrazione del modello di utilità successivamente elaborato.
Gli studi riguardanti le tipologie di indagini sono basati su due aspetti principali: RP ("revealed preferences") e SP ("stated preferences”). In generale però, in accordo con Swait et al.6 (1994), il principale
vantaggio di usare indagini RP ("revealed preferences") è che rappresentano in modo migliore il mercato attuale; gli studi SP invece vanno ad esaminare come cambiano le scelte degli intervistati al variare degli attributi e dei loro livelli per quanto riguarda degli scenari futuri e quindi ipotetici.
Questi due tipi di indagini hanno comunque i loro limiti (Wang et
al7.,2000). Sono sicuramente limitate dall'abilità degli intervistati di
comprendere le situazioni ipotetiche che gli vengono presentate e dalla loro capacità di fornire risposte affidabili.
La creazione di un'indagine di tipo SP è basata sulla generazione di un "experimental design" (J.Rose8 2009) in cui si specificano alternative,
attributi e livelli di scelta per determinare i diversi scenari da sottoporre a ciascun intervistato. Una volta creato il progetto deve poi essere valutata la sua efficienza e la sua robustezza (J.Rose9,2009). Nella
maggioranza dei casi la creazione di questi progetti viene fatta attraverso l'utilizzo di software opportunamente realizzati.
6 Swait J., Louviere J.J., Williams M., 1994. “A sequential approach to exploiting the combined approach of stated preference and revealed preference data: applications to freight shipper choice. Trasportation 21, 135-152
7 Wang D., Borgers A., Oppewal H., Timmermans H., 2000. “A stated choice approach to developing multi-faceted models of activity behavior. Transportation Research Part A: Policy and Practice 34, 625-643.
8
John M.Rose, Riccardo Scarpa&Michiel C.J. Bliemer, “Incorporating model uncertainty into the generation of efficient stated choice experiments: A model averaging approach” April 2009
3. L
’experimental design – il progetto
L‟obiettivo alla base della costruzione degli esperimenti è di determinare l‟influenza di variabili differenti sui risultati osservati. Negli studi riguardanti gli “stated choice”, questo si traduce nel desiderio di determinare l‟influenza degli attributi sulle scelte che sono state osservate sottoponendo questo esperimento ad un campione di intervistati.
Gli studi “stated choice” generalmente consistono di un campione di intervistati a cui si chiede di scegliere un‟alternativa per ogni scenario di scelta che gli viene proposto.
Concettualmente un experimental design non è altro che una matrice di valori che viene utilizzata per determinare cosa deve esserci in un‟indagine. All‟interno della matrice abbiamo i diversi livelli degli attributi, mentre sulle righe e sulle colonne abbiamo gli attributi e le alternative.
Alcuni ricercatori costruiscono la matrice dell‟experimental design in modo tale che ogni riga rappresenti un differente scenario di scelta ed ogni colonna un attributo differente. In altri casi, invece, gruppi di colonne formano diverse alternative all‟interno di ogni choice task. Infine, la matrice si può costruire in modo tale che ogni riga rappresenti un‟alternativa ed ogni colonna un attributo; in questo caso più righe vengono raggruppate insieme per formare differenti scenari di scelta. Indipendentemente da come viene costruita la matrice, l‟experimental design ha sempre la stessa funzione ovvero l‟allocazione dei livelli di attributi per ogni choice task.
Fig. 2 – Choice Experiment
Quando si crea uno “stated choice experiment” abbiamo tre fasi principali:
Fase 1: specificazione del modello
E‟ la fase in cui vengono specificati le alternative, gli attributi e i relativi livelli per determinare le situazioni di scelta da sottoporre a ciascun intervistato. Il numero di choice tasks da sottoporre agli intervistati deriva di solito da un‟indagine pilota che fornisce mediamente a quanti choice tasks l‟intervistato riesce a rispondere senza perdere la concentrazione. Inoltre per ciascuna alternativa devono essere distinti gli attributi generici da quelli specifici, quelli che hanno forma dummy o meno, gli effetti principali e l‟interazione degli effetti e deve essere anche deciso il modello econometrico da utilizzare.
Fase 2: creazione del design
Viene dapprima creato un design iniziale che può essere ortogonale o random. Viene valutata l‟efficienza del design attraverso il D-error e l‟A-error. Viene poi creato un nuovo design mescolando i diversi attributi. Si ripete l‟operazione fino a quando non viene trovato il design più efficiente.
Viene fatto poi un primo test, che verifica la robustezza del design, andando a modificare i parametri a priori e un secondo test, che utilizzando il metodo Monte-Carlo, verifica la correttezza dei dati.
Fase 3: creazione del questionario
L‟experimental design rappresenta una tabella di numeri priva di significato per gli intervistati, quindi ha bisogno di essere trasformata in qualcosa di significativo. Ogni riga viene quindi trasformata in una possibile situazione di scelta.
Alla fine il questionario potrà essere rappresentato su carta,programmato attraverso l‟uso di un software o implementato come un‟indagine internet.
Per quello che riguarda la vera e propria creazione di un experimental design definiamo prima i tipi di experimental designs esistenti:
- Comparative designs Randomize block designs - Completely randomized designs
- Screening designs
- Full factorial designs (2 livelli) - Fractional factorial designs (2 livelli) - Plackett-Burman designs
- Fractional factorial designs (più livelli) - Response surface
- Regression modeling - D-optimal designs
ORTHOGONAL DESIGN
Full factorial design e fractional factorial design
Il full factorial design considera ogni possibile situazione di scelta e ogni possibile combinazione dei livelli degli attributi. In generale se abbiamo J alternative, ognuna con Kj attributi, dove l‟attributo k appartenente a Kj, ha un numero di livelli pari a ljk, quindi il numero totale di scenari di scelta è dato da:
Poiché questo design genera un numero elevato di scenari è utile da utilizzare per problemi di piccole dimensioni o può essere utile per determinare altri design, come per esempio il Fractional Factorial design. Con il fractional factorial design ad ogni intervistato viene mostrato un subset di scenari di scelta rispetto al totale. Questo subset si può scegliere in modo casuale oppure si può dare uno scenario di scelta a ciascuno degli intervistati. In entrambi i casi si generano degli errori. Per selezionare il subset in modo corretto intervengono gli Orthogonal designs e gli Efficient designs.
Orthogonal design
E‟ il design più utilizzato nonostante la recente nascita degli efficient designs.
Un design è ortogonale quando soddisfa il bilanciamento tra i livelli degli attributi e quando tutti i parametri sono stimabili separatamente. Questo si traduce nel fatto che i livelli degli attributi per ogni colonna degli attributi non devono essere correlati. Questi designs soddisfano la proprietà per cui la somma del prodotto interno delle colonne prese a due a due è pari a zero:
Una volta trovato il design ortogonale, potrebbe risultare troppo grande da sottoporre a ciascun intervistato. Per questo si utilizza la tecnica del “blocking” che divide il design trovato in design più piccoli. Ogni piccolo design non è necessariamente ortogonale, basta che lo sia la somma di tutti. I vari blocchi vengono determinati usando un‟altra colonna non correlata con un numero di livelli uguale al numero di blocchi.
I blocchi possono essere creati manualmente o possono essere generati direttamente dal software Ngene.
I motivi per cui si usano gli orthogonal designs sono diversi, ma tra questi abbiamo la facilità di costruzione anche se per un numero limitato di livelli e attributi e il fatto che minimizzano la varianza dei parametri stimati: dove è la varianza del modello e X è la matrice dei livelli degli attributi del design. Fissando la varianza , gli elementi della matrice VC per un modello di regressione sono minimizzati quando X è ortogonale.
Un design proveniente da un modello in cui gli elementi all‟interno della matrice VC sono minimizzati è preferibile per due ragioni:viene prodotto il più piccolo standard error (radice quadrata della varianza) cosi da massimizzare il t-ratio prodotto da modello;viene assicurata la non multicollinearità (non correlazione tra i parametri).
Orthogonal optimal design
E‟ un tipo speciale di design ortogonale sequenziale (OOD: orthogonal optimal design). Alcuni ricercatori hanno dimostrato che per mantenere l‟ortogonalità, gli “stated choice experiments” possono essere costruiti in modo tale che gli attributi comuni alle diverse alternative non abbiano mai lo stesso numero di livelli. Per usare questo approccio,bisogna forzare tutti gli intervistati ad utilizzare tutti gli attributi presenti nell‟esperimento,in questo modo l‟ortogonalità ci dimostra l‟influenza che ciascun attributo ha sulla scelta. I optimal designs differiscono dai D-efficient designs in quanto i primi hanno l‟obiettivo di massimizzare le differenze tra i livelli degli attributi,mentre i D-efficient designs minimizzano gli elementi che hanno la probabilità di essere contenuti all‟interno delle matrici AVC stimate a partire dai dati di input. Per questi design,inoltre,non c‟è bisogno di stabilire dei parametri a priori.
Questi tipi di designs presentano anche alcune difficoltà: non possono avere alternative “etichettate”; potrebbero favorire delle risposte comportamentali (es. scelte lessicografiche).
In pratica gli OOD sono dei designs ortogonali limitati in quanto sono ortogonali all‟interno dell‟alternativa ma hanno una correlazione tra le alternative. Per questo motivo vengono utilizzati in casi in cui i parametri vengono trattati come generici.
EFFICIENT DESIGN
In contrasto con gli orthogonal designs ci sono gli efficient design che non servono solo a minimizzare la correlazione tra i dati per poter fare delle previsioni, ma hanno l‟obiettivo di generare dei parametri andando a minimizzare gli standard error. Questi design si basano sul fatto che la matrice dei parametri possa essere derivata se i parametri sono conosciuti. Però fino a quando l‟oggetto di questi studi sarà quello di stabilire questi parametri, questi ovviamente saranno sconosciuti. Bisognerà quindi
stabilire dei parametri a priori (attraverso degli studi già fatti o attraverso delle indagini pilota) in modo da determinare la matrice di varianza-covarianza, assumendo che i parametri a priori siano corretti. Si può affermare che un design ortogonale è efficiente solo nei casi in cui non si conoscano i parametri; nel caso in cui si abbiano delle informazioni sui parametri a priori il design può essere migliorato.
Dato un campione di N intervistati e S situazioni di scelta,la matrice AVC (varianza-covarianza) dipende dall‟experimental design X=[Xn], dai valori dei parametri β e dai risultati dell‟indagine Y=[Yjsn] dove Yjsn=1 se l‟intervistato n sceglie l‟alternativa j, Yjsn=0 altrimenti. Se i β sono sconosciuti si utilizzeranno dei parametri a priori βtilde. La matrice AVC si può determinare o con il metodo Montecarlo o analiticamente. Spesso si tende ad usare il metodo MonteCarlo perché se la matrice AVC viene determinata analiticamente, il vettore dei risultati è una parte della funzione di verosimiglianza. La matrice AVC corrispondente ad un campione N può essere derivata direttamente dalla matrice AVC di un singolo intervistato,utilizzando la quantità . In questo modo può essere calcolato l‟impatto della dimensione del campione sul design. In questo caso lo standard error diminuisce asintoticamente. Questo significa che spendere più soldi per collezionare un maggior numero di dati non porta ad un miglioramento significativo dei parametri (* in figura), invece creare un design con un‟elevata efficienza fa diminuire significativamente lo standard error (** in figura).
Esistono poi alcune misure per valutare l‟efficienza:
D-error: Calcola il determinante della matrice AVC assumendo un unico intervistato. Se si trova il minimo D-error si parla di D-optimal, ma poiché è molto difficile da trovare ci si accontenta di un D-error molto basso chiamato D-efficient. Abbiamo diversi tipi di D-error a seconda delle informazioni disponibili sui parametri a priori. In particolare si possono distinguere tre casi:
Dz-error: nessuna informazione disponibile, quindi βtilde=0;
Dp-error: informazioni disponibili con una buona approssimazione dei β; Db-error: informazioni disponibili ma con un‟incertezza sulle approssimazioni dei β. Invece di assumere dei parametri a priori βtilde,questi vengono assunti casuali.
Il D-error è funzione dell‟experimental design X e dei parametri a priori βtilde e può essere formulato matematicamente in questo modo:
A-error
Calcola la traccia della matrice (somma di tutti gli elementi diagonali) ed è associata alla varianza invece che alla covarianza. In modo simile al D-error possono essere calcolati diversi tipi di A-D-error a seconda delle informazioni disponibili.
S-optimality
Il design viene ottimizzato rispetto alla taglia del campione e serve semplicemente per confrontare tra loro i diversi design.
BAYESIAN DESIGN
Con l‟approccio bayesiano si ottiene che l‟efficienza di un design è valutata attraverso diverse configurazioni provenienti dalle distribuzioni dei parametri a priori. L‟efficienza di un design è poi calcolata come il valore atteso di una qualunque misura di efficienza assunta tra tutte le configurazioni scelte. L‟approccio bayesiano necessita di metodi di
simulazione per approssimare i valori attesi dei differenti designs. Per misurare l‟efficienza dell‟approccio bayesiano sono disponibili diverse procedure di simulazione,la più semplice si basa sull‟utilizzo di configurazioni pseudo-casuali. Indipendentemente dal tipo di configurazioni utilizzate è il ricercatore che sceglie il numero di configurazioni da utilizzare. Se sono poche, è probabile che le misure di efficienza risultino lontane dall‟efficienza reale; se sono troppe il tempo utilizzato per generare un design efficiente risulterà troppo elevato.
ORTHOGONAL VS EFFICIENT DESIGN
Nel caso in cui si ottengono delle informazioni sui parametri, si preferisce usare un efficient design, questo perché questi design utilizzano i parametri a priori per ottimizzare il design in cui la maggior parte delle informazioni è ottenuta da ogni situazione di scelta.
Cosa succede se non abbiamo delle informazioni sui parametri? E‟ opportuno utilizzare un design ortogonale o un D-optimal assumendo βtilde=0 ?
Abbiamo una corrispondenza tra design ortogonale e D-optimal, infatti quando tutti i parametri sono specifici dell‟alternativa il D-optimal design è ortogonale. Nel caso in cui tutti i parametri siano generici non è necessario scegliere tra ortogonalità ed efficienza ma è possibile generare un optimal design ortogonale.
In questo caso abbiamo però delle limitazioni di altro tipo: in primo luogo, si può utilizzare solamente un MNL; in seconda istanza, questi risultano ottimi solo nel caso in cui tutti i parametri sono uguali a zero. Il fatto che questi design sono sub-ottimi nel caso in cui i parametri sono diversi da zero è dovuto al fatto che hanno tutti le stesse probabilità nel MNL. Infatti se sono presenti dei parametri specifici per l‟alternativa non esiste il D-optimal design.
Se le correlazioni nel design hanno un impatto negativo sui parametri stimati questi dovrebbero ripercuotersi sulla matrice AVC invece di esplicitarsi nel design ortogonale. Di conseguenza un design efficiente cercherà di minimizzare queste correlazioni e non risulterà quindi necessario aggiungere l‟ortogonalità come ulteriore criterio di efficienza.
I valori dei parametri a priori
L‟obiettivo degli esperimenti “stated choice” è quello di stimare i parametri del modello specificati. Anche senza una loro stima, però, alcune informazioni e/o ipotesi plausibili sui parametri, sono di solito disponibili. Infatti è sempre possibile determinare a priori almeno il segno dei parametri. Inoltre se sono stati già condotti degli studi precedenti sull‟argomento si possono utilizzare dei parametri simili, altrimenti si può condurre un‟indagine pilota per avere un‟idea dei valori iniziali (soluzione migliore). Ovviamente un Dp-optimal è sensibile alla scelta dei parametri a priori infatti, se questi non sono corretti, il design risulta essere sub-ottimo. Fortunatamente, può essere testata la robustezza del design per vedere se alcuni parametri non sono corretti. Fissando un design X e calcolando la matrice AVC per differenti valori dei βtilde , si può effettuare un‟analisi sulla sensitività del design. Una volta determinata l‟efficienza del design si può decidere o di andare a migliorare i parametri a priori più sensibili oppure si può determinare un nuovo design.
Un altro modo di trattare l‟incertezza dei parametri a priori è quello dei design efficienti bayesiani. Questi design ottimizzano l‟efficienza aspettata su un range di valori dei parametri a priori rendendolo più robusto del caso in cui non ci siano a priori. I parametri a priori con un‟incertezza superiore dovrebbero vedere questa incertezza riflessa in una maggiore deviazione standard o nella distribuzione di probabilità.
Discussione sugli efficient design
I ricercatori sono sempre più propensi all‟utilizzo di design efficienti e ottimali per la progettazione di esperimenti “stated choice”, mentre coloro che li utilizzano tendono ancora a preferire e quindi ad utilizzare design ortogonali.
Una domanda che spesso ci si pone è: “fare la scelta giusta sul numero di livelli prima di generare un efficient design ha degli impatti positivi sull‟efficienza?”. La risposta è “Si”.
Generalmente meno livelli ma con un più alto range migliorano l‟efficienza del progetto, infatti questo si traduce in piccoli standard error. Quindi la più alta efficienza teoricamente è ottenuta usando degli “end-point” design che sono a due livelli con un ampio range. Lo svantaggio di questi progetti è la non linearità che non può essere stimata. Infatti i livelli
estremi devono essere realistici. Il numero di situazioni di scelta non sembra avere un grande impatto sull‟efficienza del design anche se ovviamente più situazioni di scelta ci sono e più l‟efficienza aumenta. Generalmente comunque 10-20 scenari sono sufficienti.
Questi design possono essere ulteriormente migliorati tenendo conto di alcune ipotesi restrittive. Per prima cosa il bilanciamento tra i livelli è stato imposto per i design efficienti quando invece di solito è richiesto solo per i design ortogonali.
Il bilanciamento dei livelli degli attributi è visto come una proprietà desiderata per garantire che tutti i livelli degli attributi appaiano uguali nel set di dati. Questo però comporta un altro vincolo al problema di minimizzazione dell‟efficiency error e quindi porta a dei problemi meno efficienti.
4. Introduzione ai modelli di utilità aleatoria
Daniel McFadden, che nel 2001 vince il premio nobel per l‟economia, nel 1979 espone la sua teoria dell‟utilità aleatoria, ponendo le basi dell‟analisi formalizzata e della costruzione di modelli matematici della domanda di trasporto. Il fondamento della teoria dei Sistemi di Trasporto è costituito dal paradigma topologico/comportamentale, ovvero da un insieme di ipotesi e un limitato numero di relazioni funzionali che rappresentano in modo astratto e generale l‟offerta di servizi di trasporto di una certa area (modello di offerta), la domanda ed i comportamenti di viaggio degli utenti del sistema (modello di domanda) e le relative interazioni, ovvero il modo in cui offerta e domanda si influenzano reciprocamente (modello di interazione domanda/offerta)
Il flusso di domanda di trasporto in un fissato periodo di riferimento e in una data area risulta dall'aggregazione di spostamenti individuali. Ogni spostamento, a sua volta, è il risultato di numerose scelte compiute dagli utenti del servizio di trasporto: il viaggiatore nella mobilità di persone, gli operatori (produttori, spedizionieri, commercianti) nel trasporto delle merci. Nel caso dei viaggiatori le scelte vanno da quella del luogo di residenza e di lavoro a quella del possesso di un veicolo fino a quelle più frequenti quali "fare o meno uno spostamento per un certo motivo in una certa fascia oraria", "verso quale destinazione farlo", "con quale modo", "secondo quale percorso". Ognuno dei precedenti contesti di scelta,definito dalle alternative disponibili,dai fattori di valutazione e dalle modalità di decisione,viene comunemente indicato come "dimensione di scelta". Inoltre, nella maggioranza dei casi le scelte connesse alla domanda di trasporto avvengono fra un numero finito di alternative,ovvero fra alternative discrete.
Partendo da questi presupposti molti dei modelli matematici utilizzati per simulare la domanda di trasporto,tentano di riprodurre i comportamenti di scelta degli utenti (modelli comportamentali). Tra questi i modelli di utilità aleatoria, o casuale, rappresentano i modelli più utilizzati per simulare le scelte di trasporto e, più in generale, le scelte fra alternative discrete.
I modelli di utilità aleatoria (o casuale) si basano sull'ipotesi che ogni utente, eventualmente appartenente ad una classe di utenti omogenei da un punto di vista comportamentale, sia un decisore razionale ovvero un
massimizzatore dell'utilità relativa alle proprie scelte. Più in particolare,i modelli di utilità aleatoria si basano sulle seguenti ipotesi:
Il decisore i associa a ciascuna alternativa i del suo insieme di scelta un‟utilità o un‟attrattività percepita Uij
e sceglie l‟alternativa che massimizza tale utilità.
L‟utilità associata a ciascuna alternativa di scelta dipende da una serie di caratteristiche misurabili, o attributi, propri dell‟alternativa stessa e del decisore, Uij=Ui(Xij), doe Xij è il vettore degli attributi relativi all‟alternativa j e al decisore i. In altri termini il decisore sceglie un‟alternativa in base agli attributi propri di quella alternativa confrontandoli con quelli delle altre alternative disponibili.
A causa di vari fattori l‟utilità associata dal generico decisore i all‟alternativa j non è nota con certezza all‟osservatore esterno (analista) che cerca di simulare il comportamento di scelta del decisore, e pertanto deve essere rappresentata con una variabile aleatoria.
Sulla base delle ipotesi precedenti non è possibile in generale prevedere con certezza quale alternativa sceglierà il generico decisore. E' invece possibile esprimere la probabilità che egli scelga l'alternativa j condizionata al suo insieme di scelta Ii. E' possibile ottenere diverse forme funzionali dei modelli di utilità aleatoria. Qui di seguito verranno descritti quelli più diffusi nelle applicazioni alla domanda di trasporto.
IL MODELLO LOGIT MULTINOMIALE
E' il modello di utilità aleatoria più semplice,esso si basa sull'ipotesi che i residui aleatori j relativi alle diverse alternative siano indipendentemente e identicamente distribuiti secondo una variabile aleatoria di Gumbel a media nulla e di parametro .
La variabile di Gumbel gode di un'importante proprietà detta di stabilità rispetto alla massimizzazione,ovvero il massimo di variabili di Gumbel indipendenti e di uguale parametro è ancora una variabile di Gumbel di parametro .
La stabilità rispetto alla massimizzazione fa si che la variabile di Gumbel sia un'ipotesi particolarmente conveniente per la distribuzione dei residui
nei modelli di utilità aleatoria, in quanto questi esprimono la probabilità di scelta di un'alternativa come la probabilità che l'utilità percepita per tale alternativa sia la massima fra quelle relative a tutte le alternative disponibili.
Sotto l'ipotesi, solitamente assunta, che il parametro sia indipendente dal valore dell'utilità sistematica,cioè dagli attributi che lo compongono,esso è un modello invariante.
Un‟altra proprietà fondamentale di questo modello è che il rapporto tra le probabilità di scelta di due alternative è costante e indipendente dalla numerosità e dall‟utilità sistematica delle altre, eventuali, alternative di scelta. Più in generale in un modello Logit Multinomiale, la variazione delle caratteristiche di un‟alternativa è tale che la variazione di probabilità di scelta di questa alternativa comporta delle variazioni proporzionali delle probabilità di tutte le altre alternative, in quanto i loro rapporti rimangono costanti.
Da quanto detto,si evince che nelle applicazioni il modello Logit Multinomiale dovrebbe essere utilizzato in contesti di scelta con alternative sufficientemente distinte perché sia plausibile l‟ipotesi di indipendenza dei residui aleatori.
IL MODELLO LOGIT GERARCHIZZATO A UN
LIVELLO
Questo modello (Nested Logit) consente di superare, almeno in parte, l'ipotesi di indipendenza dei residui aleatori alla base del modello Logit Multinomiale,pur conservando un'espressione analitica chiusa.
Si assume che l'errore di percezione globale j si scomponga nella somma di due variabili aleatorie a media nulla,di cui una, k ,assume lo stesso valore per tutte le alternative appartenenti allo stesso gruppo anche se può assumere valori diversi per i diversi gruppi;l'altra, j/k ,assume valori diversi per ciascuna alternativa appartenente a ciascun gruppo. Si ipotizza inoltre che le variabili k e j/k siano statisticamente indipendenti. L'insieme di queste ipotesi implica che il decisore percepisca in modo simile le alternative appartenenti allo stesso gruppo.
La struttura dell'utilità e il meccanismo di scelta relativi a un modello Logit Gerarchizzato possono essere rappresentati da un particolare albero di scelta che può essere visto come la rappresentazione del processo di scelta.
In questo modello l‟espressione della probabilità di scelta della generica alternativa p[j] è ottenuta come il prodotto della probabilità p[j/k] di scegliere l‟alternativa elementare j condizionata all‟aver scelto il gruppo k cui essa appartiene, moltiplicata per la probabilità p[k] di scegliere il gruppo k fra tutti quelli disponibili. Il nome del modello deriva appunto da questa struttura di calcolo delle probabilità:
A livello più alto la scelta avviene fra gruppi di alternative,con ciascun gruppo k che può essere considerato come un'alternativa composta. La probabilità p[k] di scegliere il gruppo k equivale alla probabilità di
scegliere un'alternativa appartenente a tale gruppo fra tutte quelle disponibili. Tale probabilità può essere ottenuta associando al gruppo k un'utilità percepita complessiva,ottenuta come l'utilità dell'alternativa più conveniente,ovvero come il massimo delle utilità delle alternative del gruppo stesso.
IL MODELLO LOGIT GERARCHIZZATO A PIU’
LIVELLI
In questo modello le alternative elementari di scelta sono rappresentate dalle foglie o nodi finali dell‟albero. Ciascun nodo intermedio rappresenta una scelta condizionata nella quale il decisore sceglie fra un insieme di alternative elementari e/o composte disponibili, rappresentate dai nodi foglia e/o intermedi direttamente collegati al nodo intermedio.
Ad ogni nodo di scelta, intermedio o iniziale, si assume che il decisore effettui una scelta condizionata fra tutte le alternative disponibili.