• Non ci sono risultati.

Autenticazione basata sulla camminata utilizzando i sensori inerziali di un dispositivo indossato al polso

N/A
N/A
Protected

Academic year: 2021

Condividi "Autenticazione basata sulla camminata utilizzando i sensori inerziali di un dispositivo indossato al polso"

Copied!
54
0
0

Testo completo

(1)

DIPARTIMENTO DI INGEGNERIA DELL’INFORMAZIONE

Autenticazione basata sulla camminata

utilizzando i sensori inerziali di un dispositivo

indossato al polso

Laurea magistrale in Computer Engineering

Candidato: Relatori:

Andrea ANZILOTTI Prof. Marco AVVENUTI

Ing. Guglielmo COLA

(2)

“Sometimes it is the people no one imagines anything of who do the things that no one can imagine”

(3)

Abstract

Con l’avvento di dispositivi indossabili sempre più intelligenti e connessi alla rete, la protezione dei dati sensibili in essi contenuti rappresenta un aspetto di fondamentale importanza per tutelare la privacy degli utenti. Nei dispositivi attuali, l’accesso ai contenuti viene solitamente protetto da sistemi che utilizzano password, PIN o proprietà biometriche del proprietario, come l’impronta digitale. Questi approcci solitamente richiedono un’azione esplicita da parte dell’utente, e non possono essere applicati in tutti i dispositivi. Ad esempio, la dimensione relativamente ridotta dei dispositivi indossati al polso rende poco pratico l’utilizzo di PIN o di un sensore delle impronte digitali. Una valida alternativa è rappresentata dall’utilizzo di tecniche passive di autenticazione, dove l’utente è riconosciuto in base ai suoi comportamenti. In generale, ogni azione che un utente svolge in una maniera diversa dagli altri può essere utilizzata per autenticarlo: il modo in cui cammina è quella più utilizzata in letteratura. Il segnale della camminata campionato al polso presenta un rumore più significativo rispetto al campionamento sul busto dell’utente, a causa all’oscillazione del braccio durante la camminata o ad altri movimenti imprevedibili del braccio.

L’obiettivo di questa tesi è quello di valutare l’utilizzo aggiuntivo del giroscopio in tecniche di autenticazione basate sulla camminata che utilizzano solo il sensore accelerometrico. Lo studio si divide in due parti: la prima propone un algoritmo di riconoscimento della camminata che sfrutta

(4)

entrambi i sensori, mentre la seconda parte valuta il contributo del giroscopio all’autenticazione degli utenti con una tecnica di anomaly detection.

Sono stati utilizzati i dati di quindici utenti, che hanno effettuato camminate in modalità differenti in termini di velocità e di postura (e.g. con la mano in tasca). Lo studio ha valutato due approcci per l’autenticazione dell’utente, differenti nell’unità di autenticazione: sono stati infatti utilizzati come unità il singolo passo o un segmento di otto passi consecutivi. I risultati mostrano che l’introduzione del giroscopio nel processo di autenticazione porta un miglioramento solo se utilizzato in combinazione con l’accelerometro. Il suo utilizzo esclusivo mostra performance inferiori rispetto alla tecnica puramente accelerometrica. Nell’approccio in cui l’autenticazione è basata su un segmento di otto passi il miglioramento è meno netto rispetto alla tecnica basata su un singolo passo, dove si ottiene un EER minore di 0,8 punti percentuali rispetto all’autenticazione basata sull’accelerometro.

Keywords: Anomaly detection, Autenticazione basata su camminata, Accelerometro, Giroscopio, Sensore indossato al polso

(5)

Indice

Abstract ... iii

Lista delle tabelle ... vii

Lista delle figure... viii

1 Introduzione ... 1

1.1 Autenticazione dell’utente ... 1

1.2 Autenticazione e identificazione ... 3

1.3 Consumo di energia ... 3

1.4 Obiettivo della tesi ... 4

1.5 Struttura della tesi ... 5

2 Individuazione della camminata ... 6

2.1 Il segnale del giroscopio ... 6

2.2 Algoritmo ... 9

2.2.1 Algoritmo sul giroscopio ... 11

2.2.2 Aggregazione dei dati ... 12

2.3 Risultati ... 14

2.4 Conclusioni ... 15

3 Metodo di autenticazione dell’utente ... 16

(6)

3.2 Autenticazione dell’utente ... 21 3.3 Filtro AC ... 23 3.4 Esperimenti effettuati ... 26 4 Risultati e conclusioni ... 28 4.1 Risultati ... 28 4.1.1 Majority Voting ... 39 4.2 Conclusioni ... 41 5 Bibliografia ... 43

(7)

Lista delle tabelle

Tabella 3.1: Features estratte dall'intero dataset ... 18

Tabella 4.1: Features selezionate per l’approccio a segmento ... 29

Tabella 4.2: Risultati analitici dell’approccio a segmento ... 31

Tabella 4.3: Risultati per utente singolo confrontati con tutti gli altri ... 32

Tabella 4.4: Features selezionate per l’approccio a passo singolo ... 34

Tabella 4.5: Risultati analitici della tecnica a passo singolo ... 35

Tabella 4.6: Risultati per utente singolo confrontati con tutti gli altri ... 36

Tabella 4.7: Risultati analitici ottenuti dall’eliminazione della camminata con mano in tasca ... 38

Tabella 4.8: Risultati, in termini di EER, ottenuti dall'applicazione del majority voting all'autenticazione basata sul singolo passo ... 40

Tabella 4.9:Confronto dei risultati medi ottenuti nell'approccio senza Majority Voting e con Majority Voting, nei due casi ... 40

(8)

Lista delle figure

Figura 2.1 : I tre assi di rotazione del giroscopio di uno smartwatch... 7

Figura 2.2: Un esempio di traccia del giroscopio, sui 3 assi e la loro norma8 Figura 2.3: Esempio di traccia sull’asse Z del giroscopio ... 8

Figura 2.4: Schema dell’algoritmo utilizzato ... 10

Figura 2.5: Esempio di passi di una camminata. Traccia su asse Z ... 12

Figura 2.6: Confronto delle tracce usate dai due algoritmi ... 13

Figura 2.7: Grafico dei risultati ottenuti dall’algoritmo misto, comparati con l’algoritmo di Cola modificato per singoli passi e il conteggio dei passi reali... 14

Figura 3.1: Diagramma di funzionamento dell'intera tecnica di autenticazione ... 17

Figura 3.2: Esempio di funzione di autocorrelazione per il segnale dell’accelerometro ... 20

Figura 3.3: Esempio di funzione AC di un segnale pulito ... 24

Figura 3.4: Esempio di autocorrelazione di un segnale spurio ... 25

Figura 4.1: Curva ROC ottenuta dalla classificazione sul segmento ... 30

Figura 4.2: Dettaglio della curva ROC per FRR in [0, 0.5] e FMR in [0.5, 1] ... 30

Figura 4.3: Curva ROC ottenuta dalla classificazione sul singolo passo, considerata nell’intervallo FRR in [0, 0.5] e 1-FMR in [0.5 1] ... 35

Figura 4.4: Curva ROC ottenuta eliminando la parte della camminata con mano in tasca, considerata nell’intervallo FRR in [0, 0.5] e 1 – FMR in [0.5 1] ... 37

(9)

Capitolo 1

1 Introduzione

1.1 Autenticazione dell’utente

La diffusione di dispositivi mobili ha vissuto un aumento enorme nell’ultimo decennio. Al giorno d’oggi chiunque possiede uno smartphone che, con il suo hardware, può essere considerato molto più di un semplice telefono cellulare. La presenza di sensori ha portato alla nascita di una nuova area di ricerca, chiamata Ubiquitous Sensing, che punta ad estrarre informazioni dalla vita quotidiana degli utenti, senza richiedere nessun intervento e in maniera completamente autonoma [1]. Gli ultimi anni hanno visto crescere il mercato dei cosiddetti orologi intelligenti, o smartwatch che, indossati al polso, possono essere utilizzati per le più disparate attività, dal leggere la mail a monitorare lo stato di salute di un paziente [2]. Lo studio della camminata utilizzando sensori indossabili, come un orologio, rappresenta un metodo innovativo per individuare condizioni di salute che possono provocare disagi nell’attività motoria. Il principale vantaggio dell’utilizzare dispositivi al polso consiste nella possibilità di monitorare continuamente l’utente senza che l’installazione del dispositivo di rilevamento possa demotivare l’utente stesso dal suo utilizzo. Se da un lato l’utilizzo del sensore al polso porta vantaggi significativi, dall’altro, la gestione del segnale campionato al polso richiede un trattamento particolare, a causa della moltitudine di fattori di rumore, come ad esempio la gesticolazione durante la camminata. In questo senso, il sensore posizionato più vicino al busto,

(10)

come ad esempio in tasca o sulla schiena, fornisce tracce più pulite. Un’applicazione dei dispositivi indossabili al polso che negli ultimi tempi ha riscosso interesse da parte della comunità scientifica è l’autenticazione continua e passiva dell’utente. Nei sistemi attuali, il rispetto della privacy e delle informazioni personali è ottenuto tramite sistemi di password, PIN [3] e, negli ultimi anni, tecniche biometriche, come l’impronta digitale. Il riconoscimento continuo della camminata al polso può essere utilizzato come una proprietà biometrica dell’utente [4] e consente di autenticare continuamente l’utente durante una semplice passeggiata, senza la necessità di sensori aggiuntivi (es. lettore di impronte). I sistemi di autenticazione biometrici si basano sul fatto che ogni utente abbia il suo modo di eseguire un’azione o un gesto, diverso da tutti gli altri. Il modo di camminare e il movimento degli arti riflettono questa caratteristica e possono essere utilizzati come proprietà distintiva di ogni utente. Utilizzare un’azione semplice come camminare per effettuare autenticazione ha il vantaggio di fornire frequenti possibilità di autenticare l’utente senza il bisogno di alcuna azione esplicita da parte dell’utente stesso. Il metodo di autenticazione consiste nell’acquisire segmenti di camminata durante una fase di setup e utilizzare questo set per verificare che i rilevamenti successivi appartengano all’utente proprietario del dispositivo. Oltre alla semplice autenticazione al fine di preservare la privacy del dispositivo, la certezza che l’utilizzatore sia effettivamente il proprietario è un aspetto molto importante in campo medico. In applicazioni di telemedicina, può capitare che il paziente faccia indossare il dispositivo ad altri individui per raggiungere un obiettivo di attività fisica impostato [5]. In questi casi, una tecnica per capire se l’effettivo utilizzatore e il paziente siano la stessa persona risulta fondamentale per l’attendibilità dello studio.

(11)

1.2 Autenticazione e identificazione

I metodi biometrici basati sulla camminata di un utente si dividono in due categorie ben distinte: autenticazione e identificazione [6].

Per autenticazione di un utente si intende il riconoscimento di un solo utilizzatore sulla base di un insieme di dati estratti da camminate proprie di quell’utente. Una ipotetica applicazione di autenticazione può infatti riconoscere se l’utilizzatore attuale è il proprietario del dispositivo o meno, ed eventualmente bloccarlo. L’identificazione, invece, consiste nel riconoscere l’utilizzatore attuale all’interno di un gruppo di possibili utilizzatori. Per realizzare il suo compito, un’ipotetica applicazione di identificazione richiede un insieme di camminate di ciascun utente che essa può riconoscere.

1.3 Consumo di energia

I dispositivi indossabili sono solitamente limitati in termini di memoria, potenza di calcolo e batteria. Diventa quindi fondamentale tenere conto di questi aspetti durante lo sviluppo di un algoritmo che dovrà essere eseguito su hardware di questo tipo. La durata della batteria ricopre un ruolo fondamentale in applicazioni di tipo medico e militare e deve essere preservata. Alcuni sensori, infatti, utilizzano un tasso di acquisizione adattivo per diminuire il consumo dei sensori durante l’acquisizione [7]. Uno dei fattori che ha un maggiore impatto sulla durata della batteria è la comunicazione, a causa dell’alto consumo di energia dell’apparato di rete. Una scelta architetturale possibile consiste nell’inviare i dati dei sensori ad un server che si occupi di effettuare l’autenticazione dell’utente e di

(12)

comunicare al dispositivo l’esito del processo. Questa operazione presenta un costo elevato in termini di energia. Tecniche come la compressione o l’aggregazione riducono la mole dei dati da scambiare ma introducono un consumo dovuto all’organizzazione dei dati da inviare. Un altro motivo per realizzare la logica di autenticazione sul dispositivo è l’indipendenza verso un collegamento di rete. In particolare, utilizzando un server esterno, si renderebbe necessario un collegamento permanente, sia wireless o wired, per lo scambio dati, consentendo una mobilità ridotta intorno al calcolatore. Dall’altro lato, l’utilizzo di un server esterno alleggerisce la logica dell’applicativo sul dispositivo, ottenendo un’applicazione veloce e leggera. Eseguire autenticazione sul dispositivo significa ridurre la quantità di dati da scambiare, aumentando la complessità dell’applicativo. Eventuali tecniche di Machine Learning dovranno essere valutate attentamente per non vanificare il risparmio ottenuto dalla mancata comunicazione.

1.4 Obiettivo della tesi

Il principale obiettivo della tesi consiste nell’introduzione del segnale del giroscopio al polso per autenticare l’utilizzatore di un dispositivo. Numerosi studi sono stati effettuati utilizzando esclusivamente il segnale proveniente dall’accelerometro [8]. L’introduzione del giroscopio rappresenta dunque una novità in questo campo. L’autenticazione dell’utente richiede la presenza di un algoritmo di riconoscimento della camminata che sfrutti il segnale proveniente dai due sensori. Obiettivo secondario della tesi è quello di ottenere un algoritmo semplice e leggero per individuare la camminata su cui applicare il meccanismo di autenticazione.

In particolare, l’obiettivo della tesi è quello di ottenere dei risultati, in termini di Equal Error Rate, che confermino l’utilità di introdurre il giroscopio.

(13)

1.5 Struttura della tesi

La tesi si articola su quattro capitoli. Nel Capitolo 2 si riporta una breve panoramica sull’algoritmo usato in fase di individuazione della camminata. Nel Capitolo 3 viene descritto il sistema di autenticazione dell’utente. Per concludere, nel Capitolo 4 vengono riportati e discussi i risultati ottenuti.

(14)

Capitolo 2

2 Individuazione della camminata

L’algoritmo di individuazione della camminata si presenta come una versione modificata dell’algoritmo di Cola et al. [12]. La versione aggiornata che sarà descritta in questo capitolo prevede l’utilizzo del giroscopio da affiancare all’accelerometro, già presente nella prima versione. L’algoritmo viene eseguito da un dispositivo indossato al polso e deve, quindi, essere leggero, per non incidere negativamente sulla durata della batteria.

La prima analisi fatta durante questa fase riguarda lo studio della forma d’onda del giroscopio, cercando di capire quali informazioni possono essere significative per migliorare l’algoritmo esistente. In seguito, è stato studiato un metodo per combinare i due sensori, cercando di aumentare l’affidabilità dell’algoritmo.

L’ambiente utilizzato per l’implementazione dell’algoritmo comprende il linguaggio di programmazione Java. Questa scelta riflette la praticità e portabilità del linguaggio e l’esperienza maturata in anni di studi.

2.1 Il segnale del giroscopio

Il giroscopio è un sensore MEMS che permette di misurare la velocità angolare sui 3 assi del dispositivo. I dati generati sono dunque espressi in [deg/s]. I tre assi del giroscopio sono mostrati in figura 2.1.

(15)

Figura 2.1 : I tre assi di rotazione del giroscopio di uno smartwatch

Come viene mostrato in figura, immaginando il dispositivo indossato durante una camminata, i tre assi hanno il seguente comportamento:

- L’asse Z esce dallo schermo ed ha direzione opposta al corpo

- L’asse Y ha stessa direzione del braccio su cui si indossa il dispositivo - L’asse X esce lateralmente dallo smartwatch, in direzione della

camminata

Uno dei vantaggi di utilizzare un dispositivo al polso riguarda il suo posizionamento, infatti, uno smartwatch, a differenza di un dispositivo in tasca, come uno smartphone, non ha possibilità di muoversi e quindi di invertire gli assi. L’algoritmo di Cola, utilizzando un dispositivo in tasca con orientamento non noto a priori, era costretto ad utilizzare la norma dei tre assi. Invece, utilizzando un orologio, gli assi possono essere studiati singolarmente. A tal proposito si riporta un esempio di traccia del giroscopio, sui 3 assi e la loro norma, in figura 2.2.

(16)

Figura 2.2: Un esempio di traccia del giroscopio, sui 3 assi e la loro norma

Dalla figura si vedono chiaramente i passi che compongono la camminata. L’asse Z ricopre una particolare importanza, infatti, oltre ad avere una forma d’onda molto pulita, la componente Z rappresenta la velocità angolare intorno all’asse uscente dal polso, quindi la velocità con cui si muove il braccio durante la camminata. Analizzando nel dettaglio una traccia, riportata in figura 2.3, si evidenziano i seguenti pattern:

Figura 2.3: Esempio di traccia sull’asse Z del giroscopio

- Il segnale assume il valore zero nel momento in cui il polso si trova nella posizione più distante dal corpo

(17)

- Il segnale assume il valore massimo o minimo nel momento in cui il polso si trova nella posizione più vicina al corpo. Il valore massimo viene registrato quando la direzione del braccio coincide con il verso dell’asse e viceversa per il valore minimo

- Il segnale è crescente o decrescente nel passaggio dalle due posizioni precedenti

Come si può intuire, gli istanti di tempo descritti sopra coincidono con le fasi che attraversa il movimento del braccio durante la camminata. Dal punto di vista fisico, applicando il modello del pendolo, il polso descrive una traiettoria parabolica. Gli istanti di tempo in cui il valore è zero coincidono con i punti di massima altezza del polso, quelli in cui la velocità è infatti nulla. I punti di massimo o minimo, invece, sono i punti massima velocità positiva o negativa, quindi i punti di altezza minima occupati dal polso.

2.2 Algoritmo

Utilizzando questi concetti per definire un algoritmo si possono seguire due approcci: il primo consiste nell’utilizzare i punti in cui il segnale sull’asse Z assume in valore zero oppure cercare consecutivamente picchi positivi e negativi.

Lo scopo principale di questo algoritmo consiste nell’implementare un algoritmo semplice per incrementare il numero dei segmenti di 8 passi rilevati utilizzando il giroscopio a supporto dell’accelerometro, partendo dal già esistente algoritmo di Cola [9]. Per non stravolgere il comportamento dell’algoritmo, la seconda opzione si presenta come più percorribile e semplice da affrontare.

(18)

Figura 2.4: Schema dell’algoritmo utilizzato

L’algoritmo presenta due flussi che agiscono in maniera indipendente e ad ogni passo trovato aggiornano una struttura comune.

L’algoritmo usato per l’accelerometro è una variante dell’algoritmo di Cola, impostato con valori più appropriati per l’utilizzo al polso. In particolare, le soglie sono state abbassate in modo da riconoscere la camminata a varie velocità. Un primo studio effettuato ha escluso la possibilità di implementare un algoritmo a soglie dinamiche, da adattare in base alla velocità dell’andatura. L’algoritmo può essere utilizzato per identificare il passo singolo o per identificare segmenti di otto passi. In caso di identificazione del passo singolo, si rende necessaria una ricerca preventiva del segmento, una volta che il segmento di otto passi è stato identificato, l’algoritmo individua singoli passi, fino alla rilevazione di camminata finita. Risulta

(19)

chiaro che, l’algoritmo, utilizzando un segmento di n passi, può individuare un numero di passi multiplo di n. Considerando il caso peggiore, l’utente che effettua k*n + (n – 1) passi avrebbe solamente k segmenti rilevati dall’algoritmo, perdendo gli (n - 1) rimanenti. Per questo motivo si utilizza la modalità a passo singolo.

La ricerca del segmento viene eseguita utilizzando esclusivamente l’algoritmo sull’accelerometro, successivamente i due algoritmi saranno eseguiti parallelamente.

2.2.1 Algoritmo sul giroscopio

L’algoritmo che agisce sui dati provenienti dal giroscopio ha come caratteristica principale la semplicità e la facilità di implementazione. Lo scopo principale di questo algoritmo non è ottenere la perfezione in termini di passi individuati, ma individuare tracce di camminate su cui applicare il processo di autenticazione. L’algoritmo utilizza in input i dati collezionati dall’asse Z del giroscopio. Riprendendo la figura 2.3 si possono individuare facilmente i passi, riportati in figura 2.5.

(20)

Figura 2.5: Esempio di passi di una camminata. Traccia su asse Z

Come si nota in figura, il passo viene identificato come il tempo trascorso tra il picco positivo e il picco negativo. Dal punto di vista fisico, questo intervallo indica il tempo trascorso tra due passaggi del braccio dal punto più vicino al corpo. L’algoritmo di ricerca dei picchi di Cola è dunque modificato per individuare successivamente picchi positivi e picchi negativi.

2.2.2 Aggregazione dei dati

I dati in output di entrambi gli algoritmi vengono convogliati in un’unica struttura che consente di estrarre informazioni veritiere riguardo alla camminata. I dati arrivano all’aggregatore sottoforma di passi singoli individuati, sia sull’accelerometro che sul giroscopio. L’aggregatore svolge

(21)

un compito semplice e che risponde al concetto secondo il quale un passo, per essere considerato tale, deve essere individuato da entrambi gli algoritmi. Una situazione comune è riportata in figura 2.6.

Figura 2.6: Confronto delle tracce usate dai due algoritmi

Sperimentalmente si nota che in corrispondenza di un passo vero, si devono avere due passi rilevati, uno dall’algoritmo sull’accelerometro e uno dall’algoritmo sul giroscopio. La successione dei due passi non è fissata e può succedere che in alcuni casi un passo venga rilevato prima da uno dei due sensori.

L’aggregatore riceve i dati dei passi trovati e li combina per trovare un passo vero. La compensazione avviene utilizzando un array, dove vengono memorizzati i passi registrati e non ancora compensati. Naturalmente, i passi hanno un tempo limite per essere compensati, oltre il quale saranno scartati.

(22)

2.3 Risultati

I risultati ottenuti confermano l’utilità del giroscopio in fase di individuazione della camminata. Il grafico viene riportato in figura 2.7. L’algoritmo è stato applicato ad un insieme di quindici utenti ai quali è stato chiesto di percorrere sei volte un corridoio. La prima coppia di camminate è stata eseguita ad una velocità normale, la seconda coppia con un passo più veloce mentre, per la terza coppia è stata inserita la mano, su cui si indossa il sensore, in tasca. I dati sono stati campionati ad una frequenza di 20 Hz, utilizzando un dispositivo Shimmer 3 [10].

Figura 2.7: Grafico dei risultati ottenuti dall’algoritmo misto, comparati con l’algoritmo di Cola modificato per singoli passi e il conteggio dei passi reali

Come si può vedere dal grafico, l’algoritmo, per la maggior parte delle volte, migliora il risultato ottenuto dall’algoritmo di Cola, avvicinando il numero di passi trovati al numero reale. Solamente in due casi si ottengono risultati negativi: per l’utente otto e per l’utente nove. Analizzando il video delle camminate dei due utenti si nota come il braccio non segua il naturale movimento della camminata, ma resti molto vicino al busto. Questo comportamento può essere una causa dei molti passi persi dall’algoritmo. In

(23)

particolare, l’utente nove presenta un totale di novantacinque passi trovati sull’accelerometro non compensati dal giroscopio.

Come spiegato in precedenza, lo scopo dell’algoritmo, non è quello di ottenere il numero esatto di passi, ma essere preciso nell’individuare camminate. Quello che interessa, dunque, non è trovare il numero di passi esatto, ma avere la “sicurezza” che le tracce trovate siano effettivamente camminate. In linea generale, l’obiettivo è quello di avvicinarsi al numero di passi effettivo, preferendo una differenza negativa ad una positiva, rispetto al numero reale.

2.4 Conclusioni

In questa sezione è stato presentato l’algoritmo di riconoscimento della camminata. L’algoritmo offre, generalmente, risultati migliori dell’algoritmo di Cola modificato, che utilizza solo l’accelerometro come sensore. L’algoritmo è stato testato su quindici utenti utilizzando velocità e posture diverse ed ha confermato la propria efficienza rispetto agli obiettivi preposti.

(24)

Capitolo 3

3 Metodo di autenticazione dell’utente

Per autenticazione dell’utente si intende il processo che permette di capire se l’utilizzatore del sistema sia l’utente proprietario, ovvero l’utente di cui si conosce il modo di camminare. Si distingue dall’identificazione, processo in cui si identifica l’utente utilizzatore, tra un insieme di utenti conosciuti. Il processo di autenticazione dell’utente utilizza il dataset delle tracce raccolte utilizzando l’algoritmo spiegato nel capitolo precedente. I dati appartengono a quindici utenti e identificano i segmenti di camminata individuati. L’algoritmo di individuazione della camminata riconosce il singolo passo ma, con una semplice aggregazione, può essere utilizzato per estrarre segmenti di camminata, di una lunghezza predefinita. Il processo di autenticazione verrà testato su entrambi gli scenari.

In questo capitolo verrà descritto l’intera tecnica di autenticazione dell’utente, partendo dal processo di feature extraction fino al processo di classificazione. Durante lo svolgimento del capitolo si farà riferimento a tre dataset utilizzati:

- Utilizzando solamente feature calcolate sui campioni di accelerazione - Utilizzando solamente feature calcolate sui campioni di velocità

angolare

- Utilizzando feature calcolate su campioni di accelerazione e velocità angolare

(25)

Per questo studio vengono considerate due unità di autenticazione: il singolo passo e il segmento di otto passi. Entrambi presentano vantaggi e svantaggi. Usare come unità di autenticazione il singolo passo ha il vantaggio di ottenere un alto valore di responsiveness, ovvero si riesce ad autenticare l’utente in un minor tempo. Il segmento di otto passi, invece, impiega più tempo per essere individuato ma, avendo più dati a disposizione, potrebbe ottenere risultati più precisi. L’autenticazione sul singolo passo può essere migliorata utilizzando un meccanismo di majority voting, in cui i risultati delle singole autenticazioni vengono utilizzate per prendere una decisione comune. In figura 3.1 è riportato un diagramma che descrive il processo nella sua interezza.

Figura 3.1: Diagramma di funzionamento dell'intera tecnica di autenticazione

Il training set rappresenta un insieme di istanze conosciute dell’utente proprietario e viene utilizzato per classificare una traccia come anomalia o

(26)

come autenticata. L’algoritmo di individuazione della camminata fornisce tracce contenenti segmenti di otto passi o passi singoli, a seconda dell’approccio che si affronta. Dalle tracce vengono estratte alcune feature, scelte tramite la procedura di feature selection. L’insieme delle feature calcolate su una traccia prende il nome di istanza e viene utilizzata per calcolare il valore dell’Anomaly Score. L’AS è un valore che indica quanto l’istanza si discosta dal training set dell’utente proprietario e viene confrontato con una soglia di riferimento. In caso di AS maggiore della soglia, l’istanza (e di conseguenza la traccia) viene considerata come un’anomalia, altrimenti si considera come appartenente all’utente proprietario e si aggiunge al training set delle istanze conosciute.

3.1 Estrazione delle feature

Il primo step nella definizione del processo di autenticazione consiste nella feature extraction, processo mediante il quale si estraggono informazioni dalla mole di dati raccolta. Le feature consistono solitamente in valori statistici, come la media, deviazione standard, mediana etc. In questo studio sono stati utilizzate le seguenti feature:

media, deviazione standard, curtosi, scarto interquartile (IQR), massimo, minimo, mediana, indice di asimmetria (skewness), deviazione media assoluta (MAD), scarto quadratico medio (RMS), differenza massimo-minimo (P2P), variazione assoluta media (AAV), AC_C1, AC_C2, AC_DP1, AC_DP2, durata della camminata

(27)

Alcune di queste feature sono di uso comune, altre sono meno conosciute. Ad esempio, la variazione assoluta media (Average Absolute Variation) rappresenta la media delle variazioni assolute tra due campioni consecutive e viene calcolata come segue [9] [11]:

𝐴𝐴𝑉 = ∑ |𝑥𝑖+1− 𝑥𝑖|

𝑁−1 𝑖=1

𝑁

Dove, 𝑥𝑖 rappresenta l’i-esimo campione della traccia e N rappresenta il numero totale di campioni del segmento.

Altre feature importanti sono AC_C1, AC_C2, AC_DP1, AC_DP2. Esse rappresentano i picchi dominanti dell’autocorrelazione. La funzione autocorrelazione è definita come segue:

𝐴𝐶𝑘 = 1

𝑁 − 𝑘 ∑ 𝑥̅ ∗ 𝑥𝑖+𝑘

𝑁−𝑘

𝑖=1

𝑥̅𝑖 = 𝑥𝑖− 𝑥̅

Dove N rappresenta il numero di campioni all’interno del segmento, e xi è

l’i-esimo campione. L’autocorrelazione misura il grado di periodicità di un campione di dati [12]. Un esempio di grafico risultante è riportato in figura 3.2.

(28)

Figura 3.2: Esempio di funzione di autocorrelazione per il segnale dell’accelerometro

Dalla figura risultano evidenti i periodi dominanti. AC_C1 e AC_C2 rappresentano le ampiezze dei primi due periodi dominanti, mentre AC_DP1 e AC_DP2 rappresentano i lag a cui essi si verificano. Gli intervalli in cui cercare i picchi possono essere stimati empiricamente sulla base della durata del passo. Il primo picco determina la correlazione con il secondo passo del segmento ed è generalmente più basso rispetto al secondo picco poiché rappresenta un passo eseguito con il piede opposto. Il secondo picco, invece, ha un’ampiezza maggiore dovuta alla maggiore somiglianza tra il primo passo e il terzo del segmento. Stimando una durata di seicento millisecondi per passo, e ipotizzando una frequenza di campionamento di 20Hz, il primo passo cadrà intorno al centoventesimo campione, mentre il secondo passo intorno al duecentoquarantesimo.

Le feature riguardanti l’autocorrelazione sono calcolate solamente sulla norma dei segnali sui tre assi, mentre le altre sono calcolate separatamente per ogni asse e per la loro norma, sia per l’accelerometro che per il

(29)

giroscopio. In totale, dunque, si ottengono centocinque valori, di cui cinquantadue per ogni sensore, più la durata della camminata.

3.2 Autenticazione dell’utente

Il processo di autenticazione viene effettuato con una tecnica semi-supervised di anomaly detection, basata sulla distanza euclidea dal nearest-neighbour. In questo contesto, semi-supervised significa che il training set contiene solamente istanze dell’utente da autenticare. Il processo di autenticazione consiste nell’assegnare ad ogni istanza un Anomaly Score, che verrà confrontato con una soglia per capire se l’istanza appartiene al proprietario o rappresenta un’anomalia (i.e., appartiene a un intruso). Il calcolo dell’Anomaly Score (AS) avviene considerando l’istanza del training set più vicina (nearest neighbour), usando la distanza euclidea. Formalmente, definendo 𝑔 come l’istanza di camminata rilevata dall’algoritmo, si può definire

𝑑𝑖𝑠𝑡𝑚𝑖𝑛(𝑔) = 𝑑𝑖𝑠𝑡(𝑔, 𝑛𝑔)

dove 𝑛𝑔 è l’istanza più vicina a 𝑔 nel training set. Il valore di distanza viene poi normalizzato secondo la media e la deviazione standard del training set.

𝑠𝑑𝑋 = √1 𝑀∑(𝑑𝑖𝑠𝑡𝑚𝑖𝑛(𝑥𝑖) − 𝑑𝑖𝑠𝑡̅̅̅̅̅𝑋) 2 𝑀 𝑖=1 𝑑𝑖𝑠𝑡 ̅̅̅̅̅𝑋 = 1 𝑀∑ 𝑑𝑖𝑠𝑡𝑚𝑖𝑛(𝑥𝑖) 𝑀 𝑖=1

(30)

Dove, M rappresenta il numero di campioni del segmento e 𝑥𝑖 rappresenta l’i-esimo campione.

Infine, il valore di AS viene calcolato sottraendo la media e dividendo per la deviazione standard:

𝐴𝑆𝑔 = 𝑑𝑖𝑠𝑡𝑚𝑖𝑛(𝑔) − 𝑑𝑖𝑠𝑡̅̅̅̅̅𝑋 𝑠𝑑𝑋

Il risultato di questo calcolo fornisce un valore di AS che dipende dalle proprietà del training set.

La tecnica di autenticazione verrà valutata in base a determinati parametri:

- Ogni istanza di un utente è usata per stimare il valore di FRR (False Rejection Rate), usando le istanze rimanenti dello stesso utente come training set (approccio leave-one-out)

- Le istanze degli altri utenti vengono utilizzate per stimare il valore di FMR (False Match Rate), usando le istanze dell’utente genuino come training set

Ricapitolando, FRR rappresenta il tasso di istanze classificate come non autenticate anche se le istanze appartengono effettivamente all’utente genuino. Invece, FMR rappresenta il tasso di istanze classificate come autenticate nonostante siano appartenenti ad altri utenti.

La modalità più comune per valutare le performance di una classificazione consiste nella curva ROC (Receiver operating characteristic), che permette di avere una visione di come variano i valori di FMR e FRR al variare della soglia scelta [13]. La traiettoria della curva è formata da coppie di punti FRR, 1-FMR generati dalla scelta di una particolare soglia, l’insieme dei punti generati al variare della soglia formano la curva. Le performance possono

(31)

essere valutate in termini di AUC (Area Under the Curve) e EER (Equal Error Rate). Una classificazione viene considerata perfetta quando i punti (0,0), (0,1) e (1,1) giacciono sulla curva. In questo caso, la perfezione è raggiunta perché i tassi di FMR e FRR sono entrambi nulli. La curva dunque, forma un angolo retto nel punto (0,1) e l’area sottesa ha un valore pari a uno. Si può dedurre che la classificazione è tanto migliore quanto il valore di AUC si avvicina ad uno. Il valore di EER indica il punto in cui i valori di 1 - FMR e FRR sono complementari a uno e individua l’errore della classificazione. Geometricamente questo punto viene individuato tramite l’intersezione tra la curva e la retta

𝑦 = −𝑥 + 1

3.3 Filtro AC

L’insieme delle istanze individuate dall’algoritmo possono essere affette da rumori, dovuti ad una camminata poco regolare o ad un errore di individuazione. Una traccia pulita rappresentante una camminata dovrebbe avere una forma d’onda simile a quella riportata in figura 3.3. Frequentemente si ottengono dei segnali con forme d’onde spurie. Si riporta un esempio in figura 3.4.

(32)

Figura 3.3: Esempio di funzione AC di un segnale pulito

La figura riporta un esempio di autocorrelazione sui segnali dei due sensori. Si può notare che l’autocorrelazione del giroscopio assume una traiettoria simil-sinusoidale. Questo è dovuto al fatto che l’autocorrelazione è calcolata sull’asse Z del giroscopio, mentre si utilizza la norma del segnale dell’accelerometro. In corrispondenza del lag relativo al primo passo, l’autocorrelazione sull’accelerometro mostra un piccolo picco, mentre sul giroscopio si ottiene un minimo, causato dal fatto che, sull’asse Z, passi consecutivi sono rappresentati da picchi opposti.

(33)

Figura 3.4: Esempio di autocorrelazione di un segnale spurio

L’utilizzo di queste tracce nel training set può portare ad un peggioramento delle prestazioni della tecnica di autenticazione. Per questo motivo, si introduce un modulo con il compito di ignorare i segnali rumorosi che non soddisfano i requisiti in termini di autocorrelazione. È importante evidenziare che l’utilizzo del filtro nell’approccio a passo singolo non risulta significativo. Valutare la periodicità di un singolo passo rappresenta un’operazione inutile, pertanto, nell’autenticazione basata su passo singolo, il filtro non sarà utilizzato.

(34)

3.4 Esperimenti effettuati

Come spiegato in precedenza, in questo studio sono stati tenuti in considerazione tre dataset contenenti rispettivamente feature calcolate sul segnale del giroscopio, feature calcolate sul segnale dell’accelerometro e feature calcolate su entrambi i segnali. Questa divisione permette di capire se l’introduzione del giroscopio porta vantaggi alla tecnica di autenticazione. Gli esperimenti effettuati sono due:

- Autenticazione basata sul segmento di camminata (8 passi) - Autenticazione basata sul singolo passo

L’autenticazione basata sul segmento riceve un’istanza contenente otto passi dall’algoritmo di individuazione della camminata e lo classifica come autorizzato o non autorizzato, sulla base dell’Anomaly Score che esso ha generato. L’autenticazione basata sul singolo passo, invece, riceve un’istanza contenente un passo dall’algoritmo di individuazione della camminata e lo classifica secondo gli stessi criteri.

È evidente che l’autenticazione sul singolo passo risulti più veloce e più facile da attuare rispetto all’approccio basato sul segmento di otto passi: esso, infatti, richiede una camminata prolungata per essere individuato. Se dal punto di vista pratico, usare il singolo passo, porta vantaggi, dal punto di vista implementativo si evidenziano delle complicazioni, che rendono questa tecnica più stimolante da applicare.

In primo luogo, il singolo passo contiene meno informazioni rispetto ad un segmento, per esempio, le feature basate sulla funzione di autocorrelazione perdono di significato e non possono essere utilizzate. Inoltre, bisogna considerare l’eventualità di un riconoscimento errato del passo da parte dell’algoritmo. Mentre un’individuazione errata del segmento di otto passi risulta più difficile, l’errore sul singolo passo può verificarsi più

(35)

frequentemente. Per limitare il numero degli errori in fase di autenticazione, si prevede l’utilizzo di un sistema aggregatore basato sul majority voting. In questo modo, la decisione finale sulla classificazione viene presa solamente dopo aver considerato individualmente i singoli passi.

(36)

Capitolo 4

4 Risultati e conclusioni

4.1 Risultati

Il primo esperimento effettuato riguarda l’approccio basato sul segmento di otto passi. Dai segmenti individuati dall’algoritmo di individuazione vengono estratte le feature utili per classificare la camminata. Le feature sono selezionate usando il metodo basato sulla correlazione Feature Subset Selection con una ricerca greedy hill climbing [14]. Per questo approccio le feature selezionate sono riportate in tabella 4.1.

La tabella mostra le feature scelte per i tre dataset utilizzati. Sulle righe sono riportati i dataset utilizzati, mentre sulle colonne sono riportate i sensori su cui sono calcolate le feature selezionate. Le righe relative ad accelerometro e giroscopio avranno solamente una colonna popolata, mentre la riga relativa al dataset misto sarà popolata su entrambe le colonne.

(37)

Feature Accelerometro Giroscopio D a t a s e t A c c

mediaX, mediaZ, curtosiX, curtosiM,

IQRY, IQRZ, maxX, maxZ, minX,

medianaX, medianaZ, medianaM,

skewnessX, skewnessM, RMSZ,

RMSM, AAVX, AAVZ, AC_C1,

AC_DP1, AC_DP2

G i r o

durata, mediaX, mediaZ, stDevY,

curtosiX, curtosiZ, curtosiM,

IQRX, maxX, maxY, maxZ,

medianaY, medianaZ, skewnessX,

skewnessY, skewnessZ, MADY,

MADZ, P2PZ, AAVX, AC_DP1,

AC_DP2 M i s t o

mediaX, mediaZ, curtosiX, curtosiM,

IQRY, IQRZ, maxX, maxZ, minX,

medianaX, medianaZ, medianaM,

skewnessX, skewnessM,

AAVX, AAVZ, AC_C1, AC_DP1

mediaX, mediaZ, stDevY,

curtosiX, curtosiZ, curtosiM,

IQRX, maxX, maxY, medianaZ,

skewnessX, AC_DP2

(38)

I risultati ottenuti, in termini di curva ROC sono riportati nella figura 4.1. In figura 4.2 è riportato il dettaglio della curva ROC nel riquadro più significativo.

Figura 4.1: Curva ROC ottenuta dalla classificazione sul segmento

(39)

Si riportano i risultati analitici in termini di AUC e EER in tabella 4.2.

Accelerometro Giroscopio Misto

AUC = 99,13% EER = 4,64% AUC = 95,00% EER = 12,63% AUC = 99,33% EER = 4,43%

Tabella 4.2: Risultati analitici dell’approccio a segmento

I risultati mostrano che il giroscopio non è particolarmente utile nell’approccio a segmento: la tecnica mista ottiene risultati comparabili con la tecnica esclusivamente accelerometrica. Infatti, il miglioramento introdotto dall’uso del giroscopio migliora il valore dell’EER di 0,2 punti percentuali. La tecnica esclusivamente giroscopica ottiene risultati peggiori delle altre due tecniche. È interessante analizzare alcuni casi limite: gli utenti otto, quindici e uno sono gli unici che ottengono risultati migliori con il segnale dell’accelerometro rispetto al misto. Per gli altri utenti, la tecnica mista fornisce risultati migliori, con alcuni risultati ottimi. Si riportano in tabella 4.3 i risultati per utente. La tabella presenta quindici righe e cinque colonne. Le righe rappresentano i quindici utenti, mentre le colonne riportano i risultati in termini di AUC e EER per la tecnica puramente accelerometrica e la tecnica mista. L’ultima colonna riporta il delta in termini di EER tra le due tecniche.

(40)

Accelerometro Misto

AUC EER AUC EER EER

U_01 99,81% 2,74% 99,40% 5,56% +2,82% U_02 98,95% 2,94% 99,56% 2,94% - U_03 99,95% 0,45% 99,98% 0,23% -0,22% U_04 99,65% 2,94% 99,89% 1,59% -1,35% U_05 99,98% 0,46% 99,96% 1,6% +1,14% U_06 97,58% 6,77% 98,83% 3,23% -3,54% U_07 100% 0% 100% 0% - U_08 98,22% 4% 97,27% 8% +4% U_09 99,48% 4,76% 99,91% 1,99% -2,77% U_10 98,83% 8% 98,94% 8% - U_11 99,21% 3,94% 99,59% 2,33% -1,61% U_12 96,56% 7,14% 97,80% 3,57% -3,57% U_13 100% 0% 100% 0,45% +0,45% U_14 99,88% 2,71% 99,93% 2,03% -0,68% U_15 97,97% 3,23% 97,84% 9,48% +6,25%

Tabella 4.3: Risultati per utente singolo confrontati con tutti gli altri

Dai risultati si notano alcuni miglioramenti significativi. Ad esempio, per l’utente sei, la tecnica mista dimezza l’Equal Error Rate, mentre per l’utente nove il miglioramento è ancora più evidente, passando da un errore del 4,76% ad uno inferiore al 2%.

Il secondo tipo di esperimento effettuato riguarda l’autenticazione basata sul singolo passo. In questo caso, l’algoritmo di riconoscimento fornisce tracce contenenti un passo. Dai segmenti vengono estratte le feature, con la stessa

(41)

tecnica dell’esperimento precedente. Si riportano in tabella 4.4 le feature selezionate. Come spiegato in precedenza, su un’istanza contenente un singolo passo, la funzione di autocorrelazione perde significato e le feature AC_DP1, AC_DP2, AC_C1, AC_C2 non saranno utilizzate.

I risultati, sotto forma di curva ROC sono riportati in figura 4.3 e mostrano alcune differenze rispetto all’esperimento precedente. Come si nota, la curva relativa all’approccio misto sottende la curva dell’approccio accelerometrico, ottenendo, in termini analitici, risultati migliori sia di AUC che di EER.

(42)

Feature Accelerometro Giroscopio D a t a s e t A c c

mediaX, mediaZ, stDevY, curtosiZ,

maxX, maxZ, minX, medianaX,

medianaM, skewnessM, AAVY,

AAVZ

G i r o

durata, mediaX, mediaY, mediaZ,

stDevZ, curtosiZ, curtosiM, IQRY,

maxX, maxY, maxZ, minX, minY,

minZ, medianaX, medianaY,

medianaZ, medianaM, skewnessX,

skewnessZ, MADX, MADY,

RMSX, P2PX, P2PZ, AAVZ M i s t o

mediaX, mediaZ, stDevY, curtosiZ,

maxX, maxZ, minX, medianaX,

medianaZ, skewnessM, AAVY,

AAVZ

mediaY, mediaZ, curtosiX, IQRY,

medianaX, skewnessY, P2PX,

P2PZ

(43)

Figura 4.3: Curva ROC ottenuta dalla classificazione sul singolo passo, considerata nell’intervallo FRR in [0, 0.5] e 1-FMR in [0.5 1]

I risultati analitici sono riportati in tabella 4.5

Accelerometro Giroscopio Misto

AUC = 97,71% EER = 7,18% AUC = 96,73% EER = 8,76% AUC = 98,21% EER = 6,39%

Tabella 4.5: Risultati analitici della tecnica a passo singolo

I risultati mostrano un marcata differenza tra l’approccio misto e accelerometrico, confermata anche dai risultati analitici. Infatti, dal punto di

(44)

vista di EER e AUC si ottengono miglioramenti rispettivamente di circa 0,8 e di 0,5 punti percentuali. L’approccio puramente giroscopico conferma i risultati dell’esperimento precedente, mostrando risultati peggiori dell’approccio puramente accelerometrico, che indicano una scarsa importanza se usato in maniera esclusiva. Si riporta la tabella 4.6 contenente i risultati dei singoli utenti.

Accelerometro Misto

AUC EER AUC EER EER

U_01 97,49% 6,64% 97,92% 5,77% -0,87% U_02 98,83% 4,38% 98,92% 4,38% - U_03 99,45% 3,25% 99,60% 2,62% -0,63% U_04 99,97% 0,92% 99,93% 1,94% +1,02% U_05 99,29% 3,83% 99,41% 3,83% - U_06 95,53% 11,92% 97,89% 7,95% -3,97% U_07 99,20% 3,01% 99,30% 3,76% +0,75% U_08 94,47% 11,68% 95,95% 11,64% -0,04% U_09 95,84% 9,24% 97,07% 7,91% -1,33% U_10 97,36% 7,54% 97,58% 8,39% +0,85% U_11 96,69% 8,48% 98,45% 4,81% -3,67% U_12 95,06% 10,53% 95,70% 9,94% -0,59% U_13 97,92% 7,57% 97,56% 7,32% -0,25% U_14 99,44% 3,36% 98,71% 3,36% - U_15 97,67% 6,51% 97,60% 6,04% -0,47%

(45)

I risultati del confronto delle tecniche esclusivamente accelerometrica e mista sono riportati nell’ultima colonna. In generale si nota un miglioramento che passa da essere minore di un punto percentuale, ad essere maggiore di un fattore 3,5%, per gli utenti undici e sei. I risultati sono molto positivi se rapportati alle difficoltà introdotte dall’utilizzo del singolo passo. Per dare una spiegazione alla poca utilità del giroscopio riscontrata in questi esperimenti, si riporta una curva ROC derivata dall’eliminazione della parte della camminata con mano in tasca, sempre utilizzando l’approccio a passo singolo. La curva è riportata in figura 4.4.

Figura 4.4: Curva ROC ottenuta eliminando la parte della camminata con mano in tasca, considerata nell’intervallo FRR in [0, 0.5] e 1 – FMR in [0.5 1]

(46)

I risultati analitici di questo ultimo esperimento, in tabella 4.7, mostrano una diminuzione generale delle prestazioni della tecnica di autenticazione, dovuta ad un minor numero di istanze nel training set.

Accelerometro Giroscopio Misto

AUC = 96,14% EER = 10,68% AUC = 95,38% EER = 11,15% AUC = 97,32% EER = 8,88%

Tabella 4.7: Risultati analitici ottenuti dall’eliminazione della camminata con mano in tasca

Sebbene i risultati non migliorino la situazione, è importante notare che le prestazioni dell’approccio esclusivamente giroscopico si avvicinano ai risultati ottenuti dall’approccio accelerometrico, con la differenza, in termini di EER e AUC, che passa, rispettivamente, da 1,60% e 1%, ottenuti considerando la camminata completa, a 0,5% e 0,7%. Il motivo di questo miglioramento va ricercato nel fatto che la mano in tasca non genera informazioni importanti sul segnale del giroscopio. Il movimento della mano libera è profondamente diverso dal movimento vincolato, che risente maggiormente del rumore dovuto all’impatto del piede a terra [15].

I risultati mostrano che un utilizzo esclusivo del giroscopio non porta vantaggi dal punto di vista dell’autenticazione. Negli esperimenti effettuati, l’uso esclusivo del giroscopio ha ottenuto risultati peggiori confrontati agli altri due casi presi in esame. Mentre sull’esperimento basato sul segmento si ottengono risultati nettamente inferiori, sul singolo passo sono quantomeno comparabili, ottenendo uno scarto di circa un punto percentuale sia per il valore di EER che di AUC. I risultati sono comunque negativi per pensare di introdurre il giroscopio in un sistema che già utilizza il segnale

(47)

dell’accelerometro. L’introduzione del giroscopio risulta comunque vantaggiosa in un sistema di autenticazione basato sul singolo passo, utilizzando un approccio misto. In questo caso, i risultati mostrano che la tecnica mista ottiene miglioramenti non trascurabili rispetto all’approccio esclusivamente accelerometrico. La tecnica esclusivamente giroscopica continua ad ottenere performance peggiori delle altre due anche in questo caso.

Ne segue che il segnale del giroscopio non contiene un elevato information gain, e risulta utile solamente se utilizzato in combinazione con l’accelerometro. Inoltre, considerando l’ultimo esperimento, va tenuto in considerazione che circa un terzo delle istanze utilizzate consistono in camminate con la mano in tasca, sicuramente più rumorose degli altri due terzi.

4.1.1 Majority Voting

Come appendice si riporta l’implementazione del sistema a votazione per la classificazione di più passi. Come spiegato ampiamente, e confermato dai risultati, classificare un singolo passo risulta un’operazione più complessa della classificazione basata sul segmento di camminata. Un modo per ridurre l’errore in fase di classificazione è quello di classificare un gruppo di passi, sulla base della votazione singola. Il processo è semplice e considera gruppi di passi in numero dispari: ogni passo viene classificato singolarmente e le singole decisioni vengono unite in modo da classificare l’intero gruppo in base alla decisione presa dalla maggioranza delle singole classificazioni.

I risultati sono riportati in tabella 4.8 e mostrano un miglioramento dell’Equal Error Rate ottenuto nell’esperimento precedente, i cui risultati sono riportati in tabella 4.6.

(48)

3 Passi 5 Passi

Accelerometro Misto Accelerometro Misto

U_01 5,28% 4,51% 5,16% 4,30% U_02 3,35% 2,96% 2,79% 3,01% U_03 2,96% 2,44% 2,79% 2,15% U_04 0,77% 1,80% 0,64% 2,15% U_05 2,70% 3,09% 1,72% 2,79% U_06 10,82% 5,92% 9,67% 5,37% U_07 2,57% 3,35% 2,58% 3,44% U_08 9,66% 10,05% 9,24% 9,24% U_09 8,50% 7,21% 7,52% 6,45% U_10 6,82% 7,08% 6,45% 6,02% U_11 6,44% 2,96% 6,23% 1,72% U_12 9,27% 9,40% 8,81% 8,38% U_13 5,41% 5,54% 3,44% 4,73% U_14 3,22 % 3,22% 3,44% 3,01% U_15 4,21% 4,15% 3,87% 4,51%

Tabella 4.8: Risultati, in termini di EER, ottenuti dall'applicazione del majority voting all'autenticazione basata sul singolo passo

Per una visione generale, si riporta in tabella 4.9 il miglioramento rispetto alla tecnica senza votazione, nei due casi considerati.

Accelerometro Misto

No MV 3 passi 5 passi No MV 3 passi 5 passi

Media 7,18% 5,46% 4,96% 6,39% 4,91% 4,48%

- 1,72% 2,22% - 1,48% 1,91%

Tabella 4.9:Confronto dei risultati medi ottenuti nell'approccio senza Majority Voting e con Majority Voting, nei due casi

(49)

Risulta chiaro che il majority voting contribuisce a diminuire l’errore che si otteneva precedentemente, ottenendo miglioramenti che vanno da 1,48 a 2,22 punti percentuali. Anche in questo caso, i migliori risultati sono ottenuti dalla tecnica mista, confermando prestazioni migliori rispetto, se pur lievi, rispetto al solo utilizzo dell’accelerometro.

4.2 Conclusioni

Il lavoro si divide in due parti, nella prima è stato proposto un nuovo algoritmo di individuazione della camminata con un dispositivo al polso, che utilizza il segnale del sensore del giroscopio unitamente all’accelerometro. Nella seconda parte, che rappresenta il contributo principale di questa tesi, è stato valutato il contributo del segnale del giroscopio nell’autenticazione di un utente basata sull’analisi della camminata. Questo per capire se l’introduzione del giroscopio potesse migliorare le performance rispetto ad una tecnica basata sull’utilizzo esclusivo dell’accelerometro. Per valutare i risultati dei singoli sensori sono stati utilizzati tre dataset: uno per ciascun sensore ed un dataset misto, con feature basate su entrambi i sensori. Sono stati considerati due approcci: autenticazione basata su segmento di otto passi e autenticazione basata sul singolo passo, che introduce una maggiore difficoltà. I risultati ottenuti, con un dataset esistente formato da tracce di quindici utenti, mostrano che il giroscopio utilizzato in maniera esclusiva non porta miglioramenti significativi in termini di EER e AUC, ma risulta utile se usato congiuntamente all’accelerometro, soprattutto nell’approccio a passo singolo, che può essere migliorato ulteriormente introducendo un meccanismo di majority voting. I risultati infatti mostrano che l’EER viene ridotto utilizzando un gruppo composto da tre o cinque passi. Nella tecnica

(50)

basata sul segmento di otto passi la differenza tra l’approccio puramente accelerometrico e l’approccio misto, in termini di EER, è minima, ottenendo, rispettivamente, EER pari a 4,64% e 4,43%. Nella tecnica basata sul singolo passo la differenza tra i due approcci aumenta, ottenendo EER pari a 7,18% e 6,39%. Con l’introduzione del meccanismo di majority voting le prestazioni migliorano ulteriormente, ottenendo errori pari a 5,46% e 4,91% usando un gruppo composto da tre passi, e 4,96% e 4,48% usando un gruppo da cinque passi.

Possibili sviluppi futuri potrebbero prendere in considerazione feature diverse in base al sensore: in questo studio sono state utilizzate le stesse feature sia per l’accelerometro che per il giroscopio, mentre potrebbe essere utile introdurre feature specifiche basate sulle caratteristiche del segnale del giroscopio. Un altro sviluppo potrebbe riguardare lo studio delle tipologie di camminata: il giroscopio risulta poco utile in alcuni tipi di camminata, ad esempio nella camminata con mano in tasca. Potrebbe quindi essere utile studiare il riconoscimento di queste tracce e l’utilizzo selettivo del sensore più adatto in base al contesto.

(51)

5 Bibliografia

[1] A. J. Perez, M. A. Labrador e S. J. Barbeau, «G-sense: a scalable architecture for global sensing and monitoring,» IEEE Network, p. 24(4):57–64, 2010.

[2] S. Patel, H. Park, P. Bonato, L. Chan e M. Rodgers, « A review of wearable sensors and systems with application in rehabilitation,» Journal of NeuroEngineering and Rehabilitation, p. 9(1), 2012.

[3] J. Tang, V. Terziyan e J. Veijalainen, «Distributed pin verification scheme for improving security of mobile devices,» Mob. Netw. Appl., p. 8(2):159– 175, 2003.

[4] L. Bianchi, D. Angelini e F. Lacquaniti, «Individual characteristics of human walking mechanics,» Pflugers Archiv, p. 436(3):343–356, 1998.

[5] J. Kirby, C. Tibbins, C. Callens, B. Lang, M. Thorogood, W. Tigbe e W. Robertson, «Young people’s views on accelerometer use in

physical activity research: Findings from a user involvement investigation,» ISRN Obesity, 2012.

[6] J. Kwapisz, G. Weiss e S. Moore, « Cell phone-based biometric identification,» In Proceedings of the Fourth IEEE International

(52)

Conference on Biometrics: Theory Applications and Systems (BTAS), pp. 1-7, 2010.

[7] H. Liu, A. Chandra e J. Srivastava, «esense: energy efficient

stochastic sensing framework scheme for wireless sensor platforms,» Proceedings of the 5th international conference on Information processing in sensor networks, pp. 235-242, 2006.

[8] G. Cola, M. Avvenuti, A. Vecchio e F. Musso, «Gait-based authentication using a wrist-worn device,» pp. 208-217, 2016.

[9] G. Cola, A. Vecchio e M. Avvenuti, «Improving the performance of fall detection systems throughwalk recognition,» Journal of Ambient Intelligence and Humanized Computing, p. 5(6):843–855, 2014.

[10] «Shimmer. http://www.shimmersensing.com,» 2016.

[11] G. Cola, M. Avvenuti, A. Vecchio, Y. Guang-Zhong e B. Lo, «An on-node processing approach for anomaly detection in gait,» IEEE

Sensors Journal, p. 15(11):6640–6649, 2015.

[12] R. Moe-Nilssen e J. L. Helbostad, «Estimation of gait cycle

characteristics by trunk accelerometry,» Journal of Biomechanics, p. 37(1):121 – 12, 2004.

[13] T. Fawcett, «An introduction to ROC analysis,» Pattern recognition letters, p. 27(8):861–87, 2006.

[14] M. A. Hall e G. Holmes, « Benchmarking attribute selection techniques for discrete class data mining,» IEEE transactions on knowledge and data engineering, p. 15(6):1437–1447, 2003.

(53)

[15] B. Lo, S. Thiemjarus, A. Panousopoulou e G.-Z. Yang, «Bioinspired design for body sensor networks [life sciences],» IEEE Signal

(54)

Ringraziamenti

Il primo ringraziamento va sicuramente al prof. Avvenuti e all’Ing. Cola che mi hanno permesso di concludere questo percorso nel miglior modo possibile. In particolare desidero ringraziare l’Ing. Cola per tutto il supporto, la disponibilità e i consigli che mi ha dato in questi mesi.

Ringrazio la mia famiglia per avermi sempre sostenuto e incoraggiato in questo cammino. È solo grazie a voi se oggi sono qui.

Ringrazio Ilaria, mia sorella, che ha saputo sempre consigliarmi la strada più giusta. Sei la sorella maggiore perfetta, pronta a farmi crescere e ad aiutarmi nei momenti difficili.

Ringrazio Sara, dire che mi hai sempre supportato è dire poco. Spero di aver fatto almeno la metà di quello che fai per me.

Ringrazio nonno Agostino e i nonni che purtroppo non ci sono più. Vedermi oggi vi avrebbe resi orgogliosi di me, ma so che mi vedete da lassù.

Ringrazio gli amici di una vita, con cui ho condiviso alcuni dei momenti più belli della mia vita. Vi ringrazio per esserci sempre stati.

Ringrazio Marco. Sei stata la mia spalla per tutto il percorso universitario e quello lavorativo. Finire insieme questo percorso è la cosa più bella. Senza di te non sarei mai riuscito a fare quello che abbiamo fatto.

Ringrazio Hastega che mi ha permesso di studiare e lavorare, facendomi diventare il professionista che sono oggi.

Riferimenti

Documenti correlati

[r]

Google Authenticator è un’app presente sul Play Store o sull’Apple Store che consente la verifica del secondo passaggio attraverso la generazione di PIN a sei cifre direttamente

La modalità prevista in SPID per il processo di single logout è quella definita dal SAML Single Logout Profile (cfr.[ SAML -profiles] sez. L’insieme dei fornitori di servizi

Registrazione nuovo utente - inserimento proprio codice fiscale... Nuovo sistema di

distensione gassosa di varia entità del colon e del tenue, talora con livelli idro-aerei (simile ad altre forme di ostruzione intestinale).. AGANGLIE E MALATTIA

24 In other words, instead of enacting traditional legal rules backed by sanctions, a government may find it more appropriate to govern through economic means and pursue a

In ogni caso questa nota di copyright e il suo richiamo in calce ad ogni slide non devono mai essere rimossi e devono essere riportati anche in utilizzi parziali?. Nota

© 2010 Pier Luca Montessoro (si veda la nota a pagina 2) 2 Questo insieme di trasparenze (detto nel seguito slide) è protetto dalle leggi sul copyright e dalle disposizioni dei