• Non ci sono risultati.

Specificazione, calibrazione e validazione dei modell

2.1. Generalità

Sulla base dei dati raccolti nelle indagini campionarie, è stato definito un sistema di modelli seguendo tre approcci diversi: approccio trip-based, approccio quantity-based, approccio purchase-based (figura 43).

La struttura così definita permette di analizzare simultaneamente la mobilità passeggeri di tipo acquisti nonché stimare le quantità movimentate in ambito urbano per differenti tipologie merceologiche.

Considerando il primo livello della sequenza di modelli, l’approccio trip-based permette di effettuare la stima del numero di spostamenti giornalieri di passeggeri per motivo acquisto beni di tipologia k con origine nella zona o e destinazione nei negozi della zona d.

L’approccio quantity-based permette, per i beni non durevoli, di stimare direttamente le quantità giornaliere di merce di tipologia k acquistate da ciascun utente con origine in o e destinazione nei negozi della zona d.

Per beni durevoli, l’approccio purchase-based permette di stimare il numero di acquisti giornalieri di merce di tipologia k effettuati da ciascun utente con origine in o e destinazione nei negozi della zona d.

Sono stati sviluppati anche modelli di regressione familiare che permettono di stimare gli spostamenti effettuati per l’acquisto della categoria merceologica k (approccio trip-based) e le quantità o le unità acquistate per ciascuna categoria merceologica k (approccio purchase-

based) tenendo conto della dimensione della generica famiglia residente nella zona origine o

e di attributi socio-economici quali il reddito annuo netto e la disponibilità di auto.

Al secondo livello, il modello di distribuzione, nell’approccio trip-based, fornisce l’aliquota p (d/ok) di spostamenti che, partendo dalla zona o per l’acquisto della merce di tipologia k, hanno destinazione nella zona d.

Sono stati sviluppati modelli di distribuzione per spostamenti finalizzati all’acquisto di categorie di beni a ricambio quotidiano, di beni a ricambio settimanale e per spostamenti finalizzati all’acquisto di differenti tipologie di beni durevoli.

Analogamente all’approccio trip-based, i modelli di distribuzione delle quantità e delle unità acquistate sono stati specificati per differenti categorie di beni a ricambio quotidiano, di beni a ricambio settimanale e di beni durevoli.

Infine, per convertire gli spostamenti (approccio trip-based) e gli acquisti (approccio

purchase-based) in quantità sono stati specificati e calibrati modelli di scelta degli acquisti,

imballo e merce durevole sfusa. Sono modelli logit multinomiali in cui l’utilità sistematica è funzione lineare di alcuni attributi socio-economici degli utenti che realizzano gli acquisti e di caratteristiche della merce oggetto di scelta.

Nel seguito, i modelli citati saranno illustrati nel dettaglio, riportando i risultati delle fasi di specificazione, calibrazione e validazione.

2.2. Specificazione e calibrazione

Per effettuare la stima della domanda mediante l’applicazione di un modello matematico, è necessario specificare, calibrare e validare il modello stesso.

Specificare un modello vuol dire identificare la struttura matematica, quindi le variabili che in esso vi compaiono.

La procedura che viene usualmente utilizzata per la specificazione delle variabili non è un

semplice processo con chiare regole, ma piuttosto una combinazione di applicazione di formali teorie di comportamento e di metodi statistici con valutazioni e giudizi soggettivi (Ben-

Akiva e Lerman, 1985).

Quindi, per quanto riguarda la scelta delle variabili esplicative, questa dipende dal modello che si vuole costruire. Nella fase iniziale la scelta scaturisce da considerazioni e ipotesi comportamentali formulate a priori sulla base di una conoscenza generale del fenomeno.

Nel seguente studio sono stati utilizzati modelli di tipo statistico – descrittivo, relazioni di tipo statistico in base alle quali si descrive il fenomeno oggetto di studio, e di tipo

probabilistico-comportamentale, i quali tendono a riprodurre il comportamento degli utenti e

possono essere ripartiti a loro volta in varie classi.

Calibrare un modello significa stimare i coefficienti o parametri relativi alle variabili specificate nel modello.

I modelli statistico-descrittivi descrivono le relazioni fra la domanda e le variabili senza formulare ipotesi specifiche sul comportamento dei decisori.

La formulazione più semplice è del tipo “indice per categoria” ovvero per ogni categoria di utenti, supposta omogenea rispetto al motivo in esame, viene stimato direttamente il numero medio di spostamenti (o di acquisti) mi[osh] per lo scopo (o la categoria merceologica) s nel periodo di riferimento h, senza cioè esprimerlo in funzione di variabili esplicative.

I modelli di “regressione per categoria” costituiscono una specificazione più sofisticata dei modelli descrittivi di emissione.

Questi modelli esprimono l’indice medio mi[osh] per il generico elemento della categoria i per il motivo s come una funzione, quasi sempre lineare, di variabili relative alla categoria e alla zona di origine:

[ ]

=

j i jo j i

X

β

osh

m

Gli attributi Xjo sono di solito i valori medi delle variabili socioeconomiche quali il reddito, il numero di auto possedute, etc., ma possono anche comprendere attributi di livello di servizio, quali, ad esempio, l’accessibilità di una zona.

Il nome di regressione per categoria deriva dal modello statistico, la regressione lineare appunto, utilizzato per la specificazione delle variabili Xj e la stima dei coefficienti

β

j. Il modello viene di solito applicato alle zone di traffico (regressione zonale) e le variabili che vi

compaiono sono relative all’intera zona (ad esempio popolazione, numero di attivi, metri quadri di superficie di vendita, etc.).

Più recentemente, si sono utilizzate categorie più disaggregate, tipicamente i nuclei familiari o gli individui stessi (regressione familiare o individuale).

La specificazione delle variabili e la stima dei coefficienti può essere effettuata utilizzando il metodo della regressione lineare semplice (se si ha una sola variabile indipendente) o multipla (se si considerano più variabili indipendenti).

Nel modello di regressione lineare si assume che ogni valore osservato della variabile dipendente può essere espresso come funzione lineare del corrispondente valore della variabile esplicativa più un termine residuo che traduce l’incapacità del modello di riprodurre con esattezza la realtà osservata:

i i

i

a

b

x

e

y

=

+

+

(i=1,2,...,n)

dove:

yi e xi sono i valori, rispettivamente, della variabile dipendente e della variabile esplicativa rilevati nella i-esima unità statistica;

a è l’intercetta o costante;

b è il coefficiente angolare della retta (coefficiente di regressione); ei è il residuo non spiegato relativo all’osservazione i-esima;

n è il numero di osservazioni delle due variabili.

La funzione lineare dei valori xi rappresenta la retta di regressione che assume la seguente forma:

i i

a

b

x

yˆ

=

+

(i=1,2,...,n)

dove con

i si indicano i valori teorici o stimati della variabile dipendente.

I residui ei sono definiti come la differenza tra i valori osservati e i corrispondenti valori teorici che si collocano sulla retta di regressione:

i i

i

y

y

e

=

ˆ

.

Per la stima dei parametri a e b si utilizza il metodo dei minimi quadrati, che consiste nella scelta della retta che rende minima la somma dei quadrati dei residui:

(

ˆ

)

min

1 2 1 2

=

=

= = n i i i n i i

y

y

e

Il modello ottenuto seguendo questa procedura è del tipo indice per categoria ed esprime l’indice medio mi[ok] per ciascuna tipologia merceologica k come una funzione lineare di variabili

X

kjo relative alla zona o:

i j k jo j i

ok

X

a

m[

]=∑β

+

dove:

Xjo sono le variabili del modello;

β

jsono i coefficienti del modello;