• Non ci sono risultati.

Capitolo 1 Esperimenti e Risultati

N/A
N/A
Protected

Academic year: 2021

Condividi "Capitolo 1 Esperimenti e Risultati"

Copied!
33
0
0

Testo completo

(1)

Capitolo 1

Esperimenti e Risultati

Gli esperimenti hanno ricoperto un ruolo fondamentale nello svolgimento di questa tesi sperimentale, permettendo di avere un riscontro sull'intuizione iniziale, e facendo capire come, a partire dagli spostamenti umani determi-nati considerando il traco veicolare, si potesse ridenire i conni territoriali in modo da preservare maggiormente tali spostamenti. Questo ci ha consen-tito di denire i conni sulla base dei comuni che sono stati maggiormente interessati dagli spostamenti veicolari.

E' stato necessario eettuare un'analisi statistica per determinare i parame-tri opportuni da utilizzare negli algoritmi di clustering e per individuare la corretta soglia di taglio del dendrogramma del clustering gerarchico, in modo da identicare correttamente i cluster.

Anche per l'algoritmo del Simulated Annealing, è stato necessario determi-nare il corretto valore dei numerosi parametri che caratterizzano l'algoritmo: temperatura iniziale, cooling rate, tolleranza (per la terminazione dell'al-goritmo), numero delle mosse individuali e collettive, numero di iterazioni per ogni livello di temperatura. La scelta di tali parametri ha inuenzato il comportamento dell'algoritmo, soprattutto per quanto riguarda la velocità di convergenza, inoltre la massimizzazione della funzione obiettivo utilizzata, che ricordiamo è la modularità, ha permesso di ottenere varie partizioni con un alto valore di modularità ma con una diversa struttura (degenerazione della modularità).

(2)

1.1 Misure di similarità utilizzate

Per lo svolgimento degli esperimenti abbiamo considerato due tassellature della Toscana: le sezioni istat e una aggregazione di queste sezioni in zone di mobilità (riferite nel seguito come zone aleph, dall'azienda che ci ha for-nito tale aggregazione [?]), un nuovo livello aggiunto alla gerarchia esistente caratterizzata da provincia/comune/sezione. Abbiamo trasformato le traiet-torie in coppie (fromcell, tocell) indicanti rispettivamente la zona di mobilità di origine e di destinazione della traiettoria. Queste aree sono state messe in relazione fra di loro stimando il volume del usso degli spostamenti veicolari che è transitato tra di esse. Abbiamo creato una matrice dei pesi contenente tutte le possibili origini e destinazioni, e per ogni coppia il relativo valore di usso. In particolare abbiamo utilizzato sei diverse stime (spiegate di se-guito) per valutare tale usso che sono state poi scelte come metriche per calcolare la similarità negli algoritmi di clustring e nel Simulated Annealing. Vediamo più in dettaglio come tale metriche sono state determinate:

1. dCOU N T(A, B) = count1

2. dP OP(A, B) = pop(A)∗pop(B)count

3. dDEN(A, B) = den(A)∗den(B)count =

pop(A) area(A)∗

pop(B) area(B)

count

4. dOCT OP ISA_P OP(A, B) = 1 − pop_octo(A)+popcount _octo(B)

5. dCEN T ROID_P OP(A, B) = dOCT OP ISA_P OP(A, B) ∗centroid_1distance

6. dBORDERS_P OP(A, B) = dOCT OP ISA_P OP(A, B) ∗ borders_1distance

dove:

• count indica il numero di traiettorie con origine e destinazione rispet-tivamente A e B.

• pop indica la popolazione dell'area considerata (cella ISTAT o zona ALEPH).

• den indica la densità di popolazione, ossia il rapporto tra la popola-zione e la supercie dell'area.

(3)

• pop_octo è la popolazione OctoTelematics, ossia il numero di vettu-re che sono dotate del dispositivo di tracciamento. In verità esistono due distinte, seppur correlate, popolazioni OctoTelematics; il traco veicolare entrante nell'area e quello uscente. Una scelta a prima vista ragionevole, sembrerebbe quella di considerare il traco totale (en-trante ed uscente) dell'area. Bisogna però tenere in considerazione un fattore che riguarda il dispositivo installato sulle vetture, tale dispositi-vo all'accensione necessita di un certo periodo di tempo - seppur breve - prima di essere operativo, tempo durante il quale un veicolo potreb-be uscire dall'area dove inizialmente era situato ed entrare in un'area adiacente; le vetture entranti in un'area avendo già il dispositivo acce-so non hanno questo inconveniente. Per tale ragione come popolazione OctoTelematics abbiamo considerato il traco entrante in un'area. Le misure dCEN T ROID_P OP(A, B)e dBORDERS_P OP(A, B)sono varianti

del-la metrica octopisa_pop in cui si considera espressamente del-la contiguità spa-ziale fra la aree ALEPH o ISTAT. In particolare nella metrica denominata centroid_pop si moltiplica la metrica octopisa per l'inverso della distanza fra i centroidi delle aree, mentre in quella chiamata borders_pop la metrica originaria è moltiplicata per l'inverso della distanza fra i bordi delle aree. I due fattori, seppur correlati, hanno caratteristiche leggermente diverse: la distanza fra centroidi è sempre strettamente positiva, a dierenza della di-stanza fra i bordi che è nulla quando le aree sono contigue - quindi ha il vantaggio di poter identicare facilmente le aree connanti; la distanza fra i bordi però è maggiormente soggetta al problema della cosiddetta geometria imperfetta ossia alla non perfetta coincidenza dei bordi dovuta ad esempio a piccoli errori di misurazione o di digitalizzazione per cui potrebbero esserci in realtà delle aree contigue ma con distanza non nulla.

• centroid_distance distanza calcolata fra i centroidi delle zone ALE-PH e ISTAT.

• borders_distance distanza calcolata fra i bordi delle zone ALEPH e ISTAT, tale distanza è nulla se le due aree sono contigue

Il clustering utilizza le misura di dissimilarità per raggruppare gli elementi in cluster; per questo sono stati utilizzati i reciproci nelle metriche sopra citate; in caso di usso nullo, che nel nostro caso sta ad indicare l'assenza di traiettorie fra due zone di mobilità, la distanza viene posta a +∞.

La motivazione per l'utilizzo di tutte queste misure di similarità è dovuta al fatto che queste sono state ottenute come ranamenti successivi della prima

(4)

metrica, considerando altri fattori caratterizzanti le due zone di origine e di destinazione. La prima metrica si basa semplicemente sul numero di traiet-torie fra due zone A e B. Essendoci una correlazione tra la popolazione della sezione ISTAT e quella della popolazione OctoTelematics (vedi Figura 1.2) abbiamo deciso di considerare nella metrica la popolazione delle due aree di origine e di destinazione. La popolazione, però, non permette di considerare l'estensione delle zone, quindi nella metrica si assegna lo stesso peso a due zone aventi la stessa popolazione ma diversa densità di popolazione. Que-ste considerazioni ci hanno portato alla terza metrica, ossia all'utilizzo della densità di popolazione delle due zone invece della popolazione. La densità di popolazione, però, nonostante globalmente sia fortemente correlata con il numero di macchine dotate di dispositivo di tracciamento, non è così corre-lata se consideriamo singolarmente due aree di mobilità (ISTAT o ALEPH). Il vero dato interessante è la popolazione OctoTelematics, cioè il numero di veicoli, con a bordo il dispositivo GPS, che transitano da una zona all'altra. Come detto precedentemente, abbiamo considerato solo il usso veicolare en-trante. In tutte queste misure di similarità non è stata mai stato introdotto un fattore che considerasse la contiguità spaziale delle zone da aggregare. Questa è stata una scelta motivata dal fatto che non volevamo in qualche modo forzare la partizione risultante ad avere aree contigue ma vedere quali zone venivano individuate rispetto alla mobilità umana. Comunque ai ni sperimentali, abbiamo utilizzato anche altre due metriche derivate da quella basata sulla popolazione OctoTelematics, entrambe introducono un fattore che dipende dalla distanza fra l'origine e la destinazione della traiettoria. In particolare, la prima calcola la distanza rispetto ai centroidi delle aree mentre la seconda fra i bordi di tali aree.

(5)

1.2 Correlazione tra la popolazione

OctoTele-matics e quella ISTAT

Le gura seguenti mostrano la correlazione fra la popolazione residente in Toscana e il numero di macchine, dotate di dispositivo di tracciamento Oc-toTelematics [?], che sono partite/arrivate/transitate nelle zone di mobilità considerate. Il numero delle persone residenti in Toscana è stato fornito dal-l'Istituto Italiano per le Statistiche (ISTAT). I veicoli dotati di dispositivo GPS per il tracciamento, sono stati partizionati in residenziali, cioè persone che passano la notte all'interno delle aree coperte dal dataset, e visitatori. In particolare la Figura 1.1 considera tale correlazione fra sezioni ISTAT, la Figura 1.2 fra zone ALEPH e inne la Figura 1.3 fra Comuni. Da tali gure è possibile osservare l'evidente correlazione (indicata dalla linea verde) fra la popolazione dei residenti e quella delle persone tracciate dai dispositivi Oc-toTelematics. Tale correlazione è una conferma sperimentale del fatto che i risultati ottenuti analizzando il dataset OctoTelematics sono signicativi per modellare il comportamento della popolazione, quindi possiamo utilizzare tale informazioni per determinare i conni sulla base della mobilità umana. La Figura 1.1 sembra non evidenziare un comportamento analogo alle altre due gure, ed in eetti a livello di sezioni ISTAT non esiste una correlazione fra la popolazione ISTAT e quello OctoTelematics, questo fatto è dovuto alla grana troppo piccola delle aree considerate; infatti per tali aree la popola-zione OctoTelematics non è rappresentativa. Per questo motivo, nonostante gli esperimenti siano stati eseguiti anche per sezioni ISTAT, il limite della risoluzione non ha permesso di ottenere risultati soddisfacenti per quanto riguarda la denizione dei conni.

(6)

Figura 1.1: Correlazione fra la popolazione OctoTelematics e quella ISTAT (sezioni ISTAT)

Figura 1.2: Correlazione fra la popolazione OctoTelematics e quella ISTAT (zone ALEPH)

(7)

Figura 1.3: Correlazione fra la popolazione OctoTelematics e quella ISTAT (Comuni)

(8)

1.3 Conni individuati

Avendo la modularità i problemi del limite della risoluzione e della degenera-zione della modularità (come mostrato nella Sedegenera-zione ??), invece di utilizzare un'unica partizione ottimale, abbiamo considerato un insieme di 100 par-tizioni ottimali. A partire da tale insieme è stato possibile determinare la partizione ottimale in base alla frequenza con la quale i conni individuati erano presenti nelle partizioni ottenute. In particolare i conni più signi-cativi sono risultati quelli relativi alle aree con un'estensione maggiore, in quanto non hanno risentito del limite della risoluzione.

Nei paragra successivi sono mostrate le partizioni ottenute utilizzando le va-rie metriche considerate. Nonostante le dierenze fra le vava-rie partizioni indi-viduate, dovute alle diverse politiche di accorpamento delle aree, che caratte-rizzano le metriche, è possibile individuare, con un semplice sovrapposizione, delle aree contigue comuni.

(9)

1.3.1 Hierarchical Clustering

Correlazione tra la popolazione OctoTelematics e quella ISTAT

Figura 1.4: Clustering Gerarchico: correlazione popolazione OctoTelematics e quella ISTAT

(10)

Metrica COUNT

Figura 1.5: Conni ottenuti con il Clustering Gerarchico utilizzando celle ALEPH e metrica dCOU N T(A, B)

(11)

Metrica POP

Figura 1.6: Conni ottenuti con il Clustering Gerarchico utilizzando celle ALEPH e metrica dP OP(A, B)

(12)

Metrica DEN

Figura 1.7: Conni ottenuti con il Clustering Gerarchico utilizzando celle ALEPH e metrica dDEN(A, B)

(13)

Metrica OCTOPISA

Figura 1.8: Conni ottenuti con il Clustering Gerarchico utilizzando celle ALEPH e metrica dOCT OP ISA(A, B)

(14)

Metrica OCTO_BORDERS

Figura 1.9: Conni ottenuti con il Clustering Gerarchico utilizzando celle ALEPH e metrica dOCT O_BORDERS(A, B)

(15)

Metrica OCTO_CENTROID

Figura 1.10: Conni ottenuti con il Clustering Gerarchico utilizzando celle ALEPH e metrica dOCT O_CEN T ROID(A, B)

(16)

Tabella 1.1: Cluster più frequenti utilizzando il clustering Gerarchico Cluster più frequenti

La Tabella 1.1 è stata ottenuta considerando i cluster più frequenti indivi-duati fra tutte le varie partizioni, fra parentesi quadre altri Comuni che sono stati spesso aggregati nei cluster.

(17)

1.3.2 OPTICS Clustering

Correlazione tra la popolazione OctoTelematics e quella ISTAT

Figura 1.11: OPTICS Clustering: correlazione popolazione OctoTelematics e quella ISTAT

(18)

Metrica COUNT

Figura 1.12: Conni ottenuti con il Clustering OPTICS utilizzando celle ALEPH e metrica dCOU N T(A, B)

(19)

Metrica POP

Figura 1.13: Conni ottenuti con il Clustering OPTICS utilizzando celle ALEPH e metrica dP OP(A, B)

(20)

Metrica DEN

Figura 1.14: Conni ottenuti con il Clustering OPTICS utilizzando celle ALEPH e metrica dDEN(A, B)

(21)

Metrica OCTOPISA

Figura 1.15: Conni ottenuti con il Clustering OPTICS utilizzando celle ALEPH e metrica dOCT OP ISA(A, B)

(22)

Metrica OCTO_BORDERS

Figura 1.16: Conni ottenuti con il Clustering OPTICS utilizzando celle ALEPH e metrica dOCT O_BORDERS(A, B)

(23)

Metrica OCTO_CENTROID

Figura 1.17: Conni ottenuti con il Clustering OPTICS utilizzando celle ALEPH e metrica dOCT O_CEN T ROID(A, B)

(24)

Tabella 1.2: Cluster più frequenti utilizzando OPTICS clustering Cluster più frequenti

La Tabella 1.2 è stata ottenuta considerando i cluster più frequenti indivi-duati fra tutte le varie partizioni, fra parentesi quadre altri Comuni che sono stati spesso aggregati nei cluster.

(25)

1.3.3 Simulated Annealing

Correlazione tra popolazione OctoTelematics e quella ISTAT

Figura 1.18: Simulated Annealing: correlazione popolazione OctoTelematics e quella ISTAT

(26)

Clustering risultante utilizzando le varie metriche (Celle ALEPH) La Figura 1.19 mostra una sovrapposizione lineare dell'insieme di partizioni risultanti, in cui un conne è tanto più signicativo, ossia è più frequente nelle partizioni risultanti, quanto più la linea blu è marcata (per facilitare il confronto i conni più signicativi sono stati evidenziati anche attraverso una linea più spessa).

(27)

Metrica COUNT

Figura 1.20: Conni ottenuti con l'algoritmo Simulated Annealing utilizzando celle ALEPH e metrica dCOU N T(A, B)

(28)

Metrica POP

Figura 1.21: Conni ottenuti con l'algoritmo Simulated Annealing utilizzando celle ALEPH e metrica dP OP(A, B)

(29)

Metrica DEN

Figura 1.22: Conni ottenuti con l'algoritmo Simulated Annealing utilizzando celle ALEPH e metrica dDEN(A, B)

(30)

Metrica OCTOPISA

Figura 1.23: Conni ottenuti con l'algoritmo Simulated Annealing utilizzando celle ALEPH e metrica dOCT OP ISA(A, B)

(31)

Metrica OCTO_BORDERS

Figura 1.24: Conni ottenuti con l'algoritmo Simulated Annealing utilizzando celle ALEPH e metrica dOCT O_BORDERS(A, B)

(32)

Metrica OCTO_CENTROID

Figura 1.25: Conni ottenuti con l'algoritmo Simulated Annealing utilizzando celle ALEPH e metrica dOCT O_CEN T ROID(A, B)

(33)

Tabella 1.3: Cluster più frequenti utilizzando il Simulated Annealing Cluster più frequenti

La Tabella 1.3 è stata ottenuta considerando i cluster più frequenti indivi-duati fra tutte le varie partizioni, fra parentesi quadre altri Comuni che sono stati spesso aggregati nei cluster.

Figura

Figura 1.2: Correlazione fra la popolazione OctoTelematics e quella ISTAT (zone ALEPH)
Figura 1.3: Correlazione fra la popolazione OctoTelematics e quella ISTAT (Comuni)
Figura 1.4: Clustering Gerarchico: correlazione popolazione OctoTelematics e quella ISTAT
Figura 1.5: Conni ottenuti con il Clustering Gerarchico utilizzando celle ALEPH e metrica d COU N T (A, B)
+7

Riferimenti

Documenti correlati

Inserisci nella cella B7 la formula corretta per calcolare la somma del contenuto delle celle da B4 a B6 utilizzando l'apposito pulsante della barra degli

L’agricoltore deve decidere il numero di cassette di frutta da trasportare al mercato con il furgone, con l’obiettivo di massimizzare il profitto complessi- vo derivante dalla

Nelle ultime 2 colonne rosso e verde indicano il superamento, o meno, della soglia di saturazione del 15% per l’area medica e del 10% per le terapie intensive

LA LINGUA DELLE COMMEDIE: IL METRO E LA PROSA..

I risultati riportati in Tabella manifestano una forte incompatibilità per quanto riguarda il primo salto, quello relativo alla rottura di 50 legami peptidici: possiamo spiegare

Determinare le componenti ortogonali incidenti della forza risultante sapendo che R misura 108 Kg forma con la componente F 1 un angolo α di 30°... Calcola il

La seconda affermazione si puo’ dedurre dalla

Desidero ringraziare sentitamente tutti coloro che hanno permesso la realizzazione di questo lavoro. Ringrazio inoltre gli amici di Polartechnics, per la potente iniezione di