63
C APITOLO 4: A PPLICAZIONE DELL ’ ALGORITMO SW-CLT AL TRAFFICO DI RETE RADIOMOBILE
Dopo aver affrontato analiticamente la trattazione dell’algoritmo SW-CLT nel capitolo precedente, in questo IV ed ultimo capitolo l’algoritmo viene applicato alle tracce di traffico (per cella) estratte dai dataset di cui al paragrafo 1.3.1 a pagina 10. Si ricorda che, a differenza delle tracce utilizzate nell’analisi temporale del paragrafo 2.2, quelle utilizzate ora si riferiscono, per una data cella, al traffico generato da tutti i CC senza distinzione alcuna: in sintesi si tratta del traffico complessivo della cella, con la stessa risoluzione temporale offerta nativamente dai dataset (time-slot da 10 minuti) e relativo, come al solito, al solo mese di Dicembre 2013. Le tracce consistono in serie temporali di 4464 campioni poiché per ogni ora si considerano 6 time-slot da 10 minuti i quali, moltiplicati per 24 ore giornaliere e 31 giorni del mese originano, per l’appunto, 4464 campioni (6 × 24 × 31 = 4464).
Le tracce sono state memorizzate per cella, all’interno di una matrice di traffico TR di dimensione 10^4 × 4464.
4.1 I POTESI DI LAVORO
Nell’applicare l’algoritmo alle tracce di traffico “reali” estratte dai dataset, devono esser necessariamente fatte delle ipotesi di lavoro al fine di interpretare al meglio i risultati finali proposti da tale elaborazione.
4.1.1 S CELTA DEI PARAMETRI
Innanzitutto, per come è stato implementato lo SW-CLT, esso riceve in ingresso la serie temporale da analizzare, la Probabilità di falso allarme a Priori ϵ e la lunghezza m di una delle due finestre adiacenti.
La prima ipotesi è stata quella di scegliere valori di m piccoli per ottenere le migliori
prestazioni possibili come suggerito dalle tabelle prestazionali del paragrafo 3.2.3 a pagina
53. Nello specifico si è scelto di applicare l’algoritmo con m = 3 in modo tale da far lavorare
sulla serie temporale due finestre adiacenti che coprono complessivamente 6 campioni
corrispondenti a 6 time-slot da 10 minuti ovvero ad un’ora. Così facendo si vogliono
individuare le anomalie di traffico di breve durata.
64
La Probabilità di Falso Allarme a Priori è stata scelta pari a 10^-4, scegliendo come ordine di grandezza il reciproco del numero di campioni delle serie da analizzare, pari a 4464
6. Valori più bassi avrebbero diminuito la numerosità dei falsi allarmi sperimentati, rendendo però inconsistenti i risultati ottenuti avendo a disposizione solo 4464 campioni.
4.1.2 F ILTRAGGIO DEGLI ALLARMI
L’algoritmo implementato, dati in ingresso i parametri m e ϵ , restituisce le posizioni temporali dei fronti in salita e discesa individuati. Per ipotesi, un allarme sulla serie temporale reale inizia con un fronte in salita e termina con il corrispettivo fronte in discesa.
Da prove sperimentali su tracce campione analizzate, è emerso un certo numero di situazioni inconsistenti che sono state filtrate secondo la strategia sequenziale riportata di seguito:
1 Se non sono presenti fronti in salita, si ipotizza che l’algoritmo, con i parametri usati, non abbia individuato alcun allarme (per reale assenza di allarmi o per fallimento dell’algoritmo stesso);
2 Se il passo 1 non è verificato, dunque esistono fronti in salita rilevati.
Ad ogni fronte in salita viene associato uno ed un solo fronte in discesa. L’allarme finale è quindi quello tra ogni fronte in salita ed il suo corrispettivo fronte in discesa, per la durata pari alla distanza temporale T tra le due entità. Sempre da prove sperimentali, è emersa l’eventualità di fronti in salita e discesa molto distanti tra loro: si è scelto, quindi di limitare la durata di un allarme a 𝑻𝑻 𝒎𝒎𝒎𝒎𝒎𝒎 = 𝟕𝟕𝟕𝟕 campioni (numero di time-slot presenti in mezza giornata) considerando allarmi 𝑻𝑻 ≥ 𝑻𝑻 𝒎𝒎𝒎𝒎𝒎𝒎 come falsi allarmi (si ipotizza cioè che un allarme di durata maggiore di 72 time-slot è eccessivamente lungo per essere considerato valido). Detto ciò si possono distinguere 3 casi:
2.1 Tra due fronti in salita consecutivi 𝑼𝑼𝑼𝑼 𝟏𝟏 e 𝑼𝑼𝑼𝑼 𝟕𝟕 non esiste alcun fronte in discesa:
𝑼𝑼𝑼𝑼 𝟏𝟏 è quindi “orfano” del proprio fronte in discesa, è quindi da considerarsi inconsistente e viene scartato;
2.2 Tra due fronti in salita consecutivi 𝑼𝑼𝑼𝑼 𝟏𝟏 e 𝑼𝑼𝑼𝑼 𝟕𝟕 (rispettivamente agli istanti 𝒕𝒕 𝒖𝒖𝒖𝒖𝟏𝟏 e 𝒕𝒕 𝒖𝒖𝒖𝒖𝟕𝟕 ) esiste un solo fronte in discesa 𝑫𝑫𝑫𝑫𝑫𝑫𝑫𝑫 𝟏𝟏 (istante 𝒕𝒕 𝒅𝒅𝒅𝒅𝒅𝒅𝒅𝒅𝟏𝟏 ): l’allarme reale è quindi quello tra 𝑼𝑼𝑼𝑼 𝟏𝟏 e 𝑫𝑫𝑫𝑫𝑫𝑫𝑫𝑫 𝟏𝟏 a condizione che 𝒕𝒕 𝒅𝒅𝒅𝒅𝒅𝒅𝒅𝒅𝟏𝟏 − 𝒕𝒕 𝒖𝒖𝒖𝒖𝟏𝟏 < 𝑻𝑻 𝒎𝒎𝒎𝒎𝒎𝒎 . Se la
6