Nella seconda parte dell’elaborato, l’analisi dei dati si è focalizzata sulla serie temporali del traffico generato dalle singole celle

(1)

75

C^ONCLUSIONI

In questo elaborato sono stati presi in considerazione grandi quantità di dati relativi alle celle di telefonia radiomobile per una grande porzione della città di Milano. Partendo quindi da dei semplici dataset, catalogati e rilasciati sotto licenza Open dall’operatore proprietario della rete, è stata effettuata un’analisi di tipo duale.

Nella prima parte (Capitolo II), analizzando e filtrando opportunamente le informazioni sui Country Code contenute nativamente nei dataset, è stata proposta una georeferenziazione antropologica delle informazioni analizzate, mettendo in evidenza le probabili abitudini di determinate comunità sul territorio e per il periodo di validità dei dati. Spesso ciò ha confermando informazioni già assodate da altre fonti e settori diversi dalle Telecomunicazioni, come ad esempio la permanenza in zone turistiche di etnie extra- EU, a volte, al contrario, sono emersi andamenti non propriamente noti a priori come la presenza di piccole etnie di probabile origine migratoria ma stanziali in alcune zone del territorio analizzato.

Nella seconda parte dell’elaborato, l’analisi dei dati si è focalizzata sulla serie temporali del traffico generato dalle singole celle. A questo scopo è stato implementato un algoritmo, lo SW-CLT, che in modo automatico ha lo scopo di rilevare variazioni in valor medio di una serie temporale. L’idea di fondo è stata quella di applicarlo alle tracce di traffico delle celle di rete radiomobile con l’obiettivo di “scovare”, in modo del tutto automatico, probabili anomalie nel traffico analizzato (assumendo come “anomalia” un variazione in valor medio dei livelli di traffico cellulare). Una trattazione teorica e sperimentale dello SW-CLT è stata affrontata nel Capitolo III, mettendo in evidenza l’andamento delle sue prestazioni al variare delle condizioni di lavoro. Punto di forza dell’algoritmo proposto è risultato essere la sua natura “sequenziale” ovvero la capacità di lavorare “on-the-fly” con i dati della serie temporale in esame, senza aver alcun bisogno della visione totale della stessa, introducendo, per gli allarmi rilevati solo il ritardo di processing e un ritardo massimo consentito in fase implementativa. Nel IV ed ultimo capitolo l’algoritmo è stato applicato alle tracce di traffico di alcune delle zone del territorio di pertinenza dei dati a disposizione:

ciò ha rilevato pregi e difetti dell’algoritmo a parità di parametri di lavoro rispetto alla variazione del “pattern” di traffico delle zone usate come test.

In definitiva, le varie sezioni dell’elaborato hanno messo in evidenza come, da grandi quantità di dati, sia stato possibile estrarre importanti informazioni in essi contenute ma non note a priori, proponendo un risultato finale qualitativo (I parte) e dei risultati quantitativi (II parte). Entrambi i tipi di risultati potrebbero essere utilizzabili a loro volta come punto di partenza per altre analisi, secondo il concetto oggi molto attuale dei “dati che generano dati”.