• Non ci sono risultati.

Gestire la mancanza di informazioni

6.5 Identificazione di Stop, Semafori e temporizzazioni

6.5.3 Gestire la mancanza di informazioni

Se un incrocio non può essere identificato né come regolato da stop, né da semaforo, può essere perché mancano informazioni su qualcuna delle strade che lo costitui- scono. Nonostante l’elevato numero di tracce disponibili su database come Open-

6.5 Identificazione di Stop, Semafori e temporizzazioni CAPITOLO 6. ESTRAZIONE INFORMAZIONI TOPOLOGICHE: SEMAFORI E STOP

StreetMap infatti, nella realtà è abbastanza comune che un incrocio abbia alcune strade prive di tracce. Per questo, si è cercato di trattare anche questi casi al meglio. Nel caso che una o due strade non abbiano informazioni, si riprocessa l’incrocio alla ricerca del suo regolatore di traffico, questa volta senza considerare le strade senza informazioni, proprio come se non facessero parte dell’incrocio. I risultati di questa seconda elaborazione sono sicuramente un po’ forzati, in quanto si devono fare delle supposizioni su dati non disponibili; per questo motivo vengono eviden- ziati in maniera diversa dai risultati certi, e definiti come stime al meglio delle no- stre conoscenze. In ogni caso, come verrà mostrato nel capitolo 7 sulla valutazione sperimentale, il risultato è più che soddisfacente anche in questo caso.

La stima in presenza di dati mancanti viene utilizzata anche in un secondo sce- nario. Come visto, uno stop può venir identificato anche in assenza di informazioni su alcune strade. Potremmo quindi avere un incrocio che sicuramente è regolato da stop, di cui alcune strade sono marcate come sicuramente dotate di stop, alcune come sicuramente prive di stop, ed altre invece prive di informazione. Qui, si appli- ca il criterio di stima per decidere se queste strade hanno o meno lo stop, in modo da poter dare un’informazione il più completa e dettagliata possibile.

Studiando la topologia degli incroci tipici delle strade americane, si vede come la maggior parte di essi coinvolga 2 strade che si incrociano a formare, appunto, una croce ( + ). In questo caso poi, la disposizione degli stop è simmetrica. Ovvero, se ad esempio solo la strada secondaria ha lo stop, esso sarà presente su entrambi i suoi lati, così come se un lato della principale ha la precedenza, lo stesso varrà per l’altro.

Nel particolare caso di un incrocio di questo tipo quindi, si procede propagan- do l’informazione di stop o precedenza sulle strade che non hanno informazioni, partendo dal loro proseguimento nel caso che esso abbia l’informazione. Per iden- tificare una strada come il proseguo di un’altra, si confrontano i due orientamenti, e se la loro distanza angolare è inferiore a 10 si considerano le strade in tale re- lazione. Questa propagazione di informazione si rivela corretta in più del 90% dei casi studiati.

È stato fin qui descritto il sistema sviluppato, sia dal punto di vista dei passaggi logici seguiti nella sua realizzazione, sia nella spiegazione dettagliata del funzio- namento di ogni sua singola parte. Si procederà quindi ora ad un’analisi del suo funzionamento, valutandone le prestazioni e l’accuratezza complessiva.

Capitolo 7

Valutazione del sistema

In quest’ultimo capitolo, viene presentata una valutazione del sistema sviluppato. Per questa valutazione, vengono utilizzati due differenti insiemi di dati; una prima sezione perciò presenterà le caratteristiche di questi data set, mentre successiva- mente verranno presentati ed analizzati i risultati sperimentali ottenuti.

7.1

Caratteristiche dei Data Set

Per verificare le performance del sistema sviluppato, lo si è testato su due insiemi di tracce GPS: tracce estratte da OpenStreetMap, ed un insieme di tracce che noi stessi abbiamo raccolto guidando veicoli adeguatamente equipaggiati per diversi giorni nell’area di Los Angeles.

OpenStreetMap OpenStreetMap è un database gratuito di mappe editabili del- l’intero pianeta [50]. È costruito con il contributo di utenti da ogni parte del mondo. Concettualmente, gli utenti caricano le tracce GPS da loro registrate e, se vogliono, possono editare le strade che hanno percorso. In seguito, gli amministratori del sistema controllano i risultati dell’editing ed eventualmente validano le modifiche.

7.1 Caratteristiche dei Data Set CAPITOLO 7. VALUTAZIONE DEL SISTEMA

Questo approccio garantisce una mappa sempre aggiornata ad un costo virtual- mente nullo. Inoltre, tutte le tracce GPS che vengono caricate, sono disponibili alla comunità di utenti per il download, in modo tale che un utente possa contribuire anche editando strade sulla base di percorsi registrati da qualcun altro. Al momento in qui sono stati svolti i test qui presentati sul database di OpenStreetMap erano disponibili 307’000 tracce, ma questo numero è in continua crescita, man mano che nuovi utenti si uniscono alla comunità.

In tabella 7.1 sono riportati i dati sul numero di tracce presenti in alcune regioni in cui la comunità è più attiva, in Germania e Stati Uniti. La Germania è, fra l’altro, lo stato in cui la comunità di utenti OpenStreetMap è più attiva in assoluto, e la sua mappa digitale è quasi interamente creata dagli utenti, nonché molto dettagliata e ricca di informazioni aggiuntive, come punti di interesse e descrizioni di alcune caratteristiche delle strade ad esempio.

Regione Numero di Tracce

Baviera, Germania 37795

Los Angeles County, California 2584

Marion County, Indiana 1133

Orange County, California 876

Santa Clara County, California 848

Travis County, Texas 845

Tabella 7.1: Distribuzione delle tracce di OpenStreetMap nelle regioni più attive di Germania e USA.

Negli Stati Uniti invece la mappa è derivata dal database TIGER [38], con modi- fiche e correzioni introdotte dagli utenti. Nonostante il numero di tracce sia alquanto alto, la loro copertura geografica è molto lontana dall’essere completa. Basta infatti mettere mentalmente a confronto il numero di incroci stradali che possono esistere nelle aree considerate, col numero di tracce presenti, per capire come molti di essi non vengano in alcun modo coperti.

La figura 7.1 mostra la distribuzione cumulativa degli incroci in funzione del numero di tracce che li attraversano. Si può osservare come più del 95% degli in- croci sia attraversato da meno di 10 tracce, anche nel caso più favorevole (la regione della Baviera). Questi numeri poi peggiorano ulteriormente se si considera come le

CAPITOLO 7. VALUTAZIONE DEL SISTEMA 7.1 Caratteristiche dei Data Set

Figura 7.1: Distribuzione cumulativa degli incroci in funzione del numero di tracce che li attraversano

tracce attraversano gli incroci. In figura 7.2 si mostra il numero di incroci che sono attraversati da un numero minimo di tracce su tutte (N) le strade entranti, su tutte tranne una (N-1) e tutte tranne due (N-2) delle strade entranti per la regione della Baviera, Germania e per la contea di Los Angeles.

(a) Baviera, Germania (b) Contea di Los Angeles

Figura 7.2: Distribuzione degli incroci in funzione del numero di tracce che li attraversano sulle diverse strade che vi confluiscono

Si può osservare come il numero di incroci che abbiano almeno 5 tracce su ogni strada entrante sia prossima a 0. Inoltre, i dati mostrano che la maggior parte degli incroci siano attraversati nella stessa direzione, che solitamente coinvolge la strada principale. È infatti abbastanza comune avere decine di tracce su un incrocio, senza