• Non ci sono risultati.

ApplicazioniSmart City

N/A
N/A
Protected

Academic year: 2021

Condividi "ApplicazioniSmart City"

Copied!
44
0
0

Testo completo

(1)

Analisi della Mobilità per Applicazioni Smart City

Marco Mamei

[email protected]

(2)

Marco Mamei

• Tesi e Dottorato nel Agent and Pervasive Computing Group

• Insegno ad Ingegneria Gestionale ICT

• Fondamenti di Informatica

• Tecnologie Internet e Web

• Attività di Ricerca:

• Pervasive Computing

• Analisi di Dati di Mobilità

• Collaborazioni con:

• Telecom Italia

• Yahoo Research (Barcellona)

• …

(3)
(4)

Dati di posizione

User ID User Info Timestamp Lat, Lon Radius Info

45xx76hj CDR, 222 10/12/2014, 15:11.23 (45.23, 10.1) 500 -

34gg76x CDR, 222 10/12/2014, 15:11.23 (45.23, 10.1) 500 SMS to 45xx76hj mmamei Twitter 10/12/2014, 15:13.23 (45.13, 11.1) 20 Shopping #Natale

• Telecom CDR 600K all'ora per regione

• Twitter 500K messaggi al giorno in Italia (5% geo-localizzato) [2012]

• Numeri molto maggiori se si considerano DDR, altri social network

(5)

Applicazioni Innovative

• Possibile monitorare posizione, mobilità e comportamento delle persone su larga scala ad un grande livello di dettaglio

• Dal controllo del traffico ai social network…

(6)

Flickr data in Rome

(7)

Nokia Sport Tracker Data

(8)

Orange Data – D4D Challenge (Ivory Coast)

(9)

Orange Data – D4D Challenge (Ivory Coast)

(10)

Telecom CDR Data (Milano)

Home Places Sundays

(11)
(12)

Applicazioni

• Pianificazione/gestione urbana e statistiche

• Gestione eventi

• Trasporto urbano e car sharing

• Analisi di mercato/ pubblicità

• Social network geo-localizzati & applicazioni innovative

• Applicazioni D4D

(13)

Problematiche

• Mole di dati

• Gestione

• Ottimizzazione

• Parallelismo

• Architetture dedicate (Bigdata)

• Mancanza di Groundtruth

• Riscontro con altri dataset

• Privacy

• Unicità e re-identificazione

(14)

Identificazione e

Analisi di Eventi

(15)

Analisi di Eventi

• Identificazione degli eventi

• Trovare situazioni anomale

• Analisi (descrizione) degli eventi

• Quante persone c'erano?

• Cosa stavano facendo?

• Da dove venivano? Dove sono andate dopo?

• Predizione degli eventi

• Ci sono correlazioni tra eventi

• È possibile fare predizioni

(16)

Identificazione Eventi

• Diviso l'area della città in celle

• Contato il numero di persone che

generano eventi in una data ora e

in una data cella

(17)
(18)

Cella del centro

(19)

San Siro

(20)

Approccio

1. Create a statistic of the

behavior of an area over an extended period of time

• Number of people per area per

hour

(21)

1. Create a statistic of the

behavior of an area over an extended period of time

75° percentile

25° percentile

median IQR

Approccio

(22)

1. Create a statistic of the

behavior of an area over an extended period of time

2. Events are outliers w.r.t. that statistic.

Approccio

(23)

Thresholding

(24)

Thresholding

(25)

Thresholding

(26)

Q3 Q1

Thresholding

(27)

IQR

Thresholding

(28)

IQR

T = Q3 + K · IQR

Thresholding

(29)

What is the best K?

(No Training Set)

(30)

What is the best K?

(Training Set)

(31)

Risultati (Grand Emilia – Modena)

(32)

Risultati (San Siro – Milano)

(33)
(34)

Risultati

• Groundtruth raccolto manualmente da Google News

• Eventi con solo dati Telecom:

* Precision = 100%, Recall = 64%

• Eventi con dati Telecom, Twitter:

* Precision = 42%, Recall = 100%

* We run the analysis only on the cells associated to groundtruth events.

Considering all the cells would notably lower precision, but there could be

events that were not recorded in the groundtruth.

(35)

Analisi (Descrizione Degli Eventi)

• Quante persone c'erano?

• Cosa stavano facendo?

• Da dove venivano? Dove sono andate dopo?

(36)

Quante persone c'erano? (approccio naive)

(37)

Quante persone c'erano?

• Analisi dell'area d'interesse per un evento

• Stima probabilistica delle presenze

• f1 = fraction of time in which the user is at the event.

• f2 = fraction of time in which the user is in the event area without the event.

• p = f1 * (1-f2)

• Regressione lineare per scalere i numeri

(38)

• R = 0.95

• Median % error = 10%

(39)

Cosa stavano facendo?

• Abbiamo usato il testo dei Tweet prodotti nella zone dell'evento

• Latent Dirichlet Allocation (LDA)

TOP WORDS: inter:milan:formazioni:probabili:pagelle:difesa:livorno:bravo TOP LOCATION: 45.478:9.124

(40)

Da dove venivano? Dove sono andate dopo?

Flusso verso lo stadio Flusso in uscita dallo stadio

(41)

Da dove venivano? Dove sono andate dopo?

Flusso verso lo stadio Flusso in uscita dallo stadio

(42)

Da dove venivano? Dove sono andate dopo?

• Identificazione abitazione utenti

• Il luogo più visitato di notte

durante la settimana

(43)

Applicazioni

• Gestione degli eventi e del traffico

• Pubblicità e marketing

• Social network

(44)

Tesi Disponibili

• Meccanismi migliori per identificare eventi

• Integrazione con dati social network, per una migliore descrizione delle attività

• Confronti con dati ISTAT e misurazione degli utenti "invisibili"

• Confronti con la cartografia e le attività sul territorio

• Correlazione e predizione tra eventi

• Confronto per piattaforme big-data (file, DB, Google Dremel)

• Stream processing

Riferimenti

Documenti correlati

5 – Bruel & Kjaer type 8202 (martello grosso con punta metallica grossa). Martello

Il presente lavoro di tesi ha cercato di delineare il profilo delle comunità uigure residenti nella Regione Autonoma Uigura dello Xinjiang, di comprendere quali siano le

Available Open Access on Cadmus, European University Institute Research

Hakata Gion Yamakasa ha dunque influenzato il panorama delle festività religiose del Kyūshū e gli elementi che contribuiscono alla sua attrattiva e al suo fascino

Available Open Access on Cadmus, European University Institute Research Repository.... European University

Exploiting the properties of the azobenzene molecules under different wavelengths for the creation of host-guest supramolecular intermediates in a dynamic system for the

Molte di queste celle di carico con più travi in essione sono state approvate, ad esempio, dall’Istituto Nazionale di Metrologia Tedesco (PTB), per l’integrazione in bilance usate

Anche l’accettazione è molto alta e c’è la possibilità, dopo 72 ore dal traslar- vo, di produrre una freschissima, anche se limitata, quantità di pappa reale che può