Vediamo infine i risultati della validazione del processo di apprendimento degli scenari personalizzati temporizzati ; i parametri in questo caso sono la dimensione dell’intervallo temporale di aggregazione t, la percentuale di soglia perc ed il periodo di analisi P.
W = 15 minuti, perc = 80%, P = una settimana:
con questi valori dei parametri possiamo osservare una bassa presenza sia di falsi positivi che di falsi negativi; la specificit`a `e dell’85%, la sensitivit`a dell’88% e l’accuratezza dell’87%.
W = 30 minuti, perc = 80%, P = una settimana:
aumentando l’intervallo temporale di aggregazione diminuiscono i falsi positivi, ma aumentano maggiormente i falsi negativi; la specificit`a `e dell’89%, la sensitivit`a del 79% e l’accuratezza dell’84%.
W = 5 minuti, perc = 80%, P = una settimana:
diminuire l’intervallo temporale non porta nessun vantaggio; la speci- ficit`a `e del 68%, la sensitivit`a dell’88% e l’accuratezza del 79%.
W = 15 minuti, perc = 70%, P = una settimana:
anche diminuire la percentuale di soglia non porta vantaggi; la specifi- cit`a `e del 64%, la sensitivit`a dell’88% e l’accuratezza del 77%.
W = 15 minuti, perc = 90%, P = una settimana:
aumentando la percentuale di soglia diminuiscono sensibilmente i falsi positivi, ma aumentano ancora pi`u sensibilmente i falsi negativi; la specificit`a `e del 93%, la sensitivit`a del 61% e l’accuratezza del 75%.
CAPITOLO 10. VALIDAZIONE E TEST
W = 15 minuti, perc = 80%, P = due settimane:
aumentando il periodo di analisi aumentano sensibilmente i falsi nega- tivi; la specificit`a `e dell’85%, la sensitivit`a del 73% e l’accuratezza del 79%.
W = 15 minuti, perc = 80%, P = tre giorni:
diminuendo il periodo di analisi aumentano sia i falsi negativi che quelli positivi; la specificit`a `e del 75%, la sensitivit`a dell’85% e l’accuratezza dell’80%.
La combinazione di valori ottima prevede pertanto una dimensione pari a 15 minuti per l’intervallo temporale di aggregazione, una percentuale di soglia pari all’80% ed un periodo di analisi pari ad una settimana; con tali valori dei parametri la fase di validazione da come risultato un valore di specificit`a dell’85%, di sensitivit`a dell’88% e di accuratezza dell’87%.
Capitolo 11
Conclusioni e sviluppi futuri
I risultati mostrati nel capitolo 10 dimostrano l’efficacia dell’approccio di apprendimento automatico adottato dal sistema; esso `e in grado di appren- dere quattro differenti tipologie di abitudini, che permettono di coprire gran parte dei comportamenti abituali degli utenti di un sistema Ambient Intel- ligent, ed anticipare tali comportamenti con un buon livello di accuratezza quando la situazione lo richiede.
La scelta seguire un approccio ibrido, utilizzando sia la tecnica di Data Mining dell’apprendimento di regole associative che un approccio di apprendi- mento statistico, ha reso il sistema pi`u versatile ed affidabile; la realizzazione di due moduli di apprendimento cooperanti ha permesso di sommare i pregi dei due differenti metodi di apprendimento, limitando i rispettivi difetti.
Il sistema realizzato riesce nell’intento di rappresentare un primo passo verso la nascente disciplina dell’Ambient Intelligence; la soluzione proposta per l’apprendimento di comportamenti ed abitudini degli utenti di un sistema AmI `e in grado di anticipare i bisogni, e migliora le sue performance nel tempo, man mano che viene accumulata esperienza.
Il numero di errori compiuti dal sistema `e relativamente basso sin dai primi giorni, per poi ridursi ulteriormente man mano che il sistema acquisisce
CAPITOLO 11. CONCLUSIONI E SVILUPPI FUTURI
esperienza; questo `e un fattore chiave per permettere la diffusione di sistemi di questo tipo, dato che nessuno gradirebbe un sistema che continuamente tenta di predirre, spesso sbagliando, ci`o che si vuol fare.
E’ importante sottolineare quanto un sistema di questo tipo necessiti di test approfonditi e duraturi, in modo da perfezionare l’apprendimento e valutare pi`u accuratamente i parametri di sistema; avere a disposizione un dataset di maggiori dimensioni darebbe sicuramente pi`u valore alla fase di validazione, permettendo valutazioni sulla bont`a del sistema pi`u accurate.
Il sistema offre una buona base di partenza per dei potenziali sviluppi futuri, volti al perfezionare le capacit`a di apprendimento ottenute.
Il punto debole del sistema `e sicuramente la generazione di regole sugli scenari non temporizzati appresi; se gli scenari sono composti da azioni mol- to frequenti creare delle implicazioni tra partizioni binarie delle azioni che compongono lo scenario pu`o essere difficile, data l’alta confidenza che tali regole devono avere per ridurre al minimo gli errori di predizione.
Per risolvere tale problema potrebbero essere presi in esame fattori co- me l’intervallo temporale tra le azioni eseguite, oppure la fascia oraria nel quale tali azioni sono effettuate, in modo da aumentare la confidenza delle potenziali regole e permettere quindi di generarne un numero maggiore.
Anche dal punto di vista dello sviluppo software, possono sicuramente essere fatti dei passi in avanti; le scelte implementative sono state guidate anche dalla volont`a di mostrare le funzionalit`a di base del sistema, e pertanto possono essere messe in discussione magari testando le performance otteni- bili con algoritmi di apprendimento di regole associative oppure metodi di apprendimento statistico pi`u complessi.
Dal punto di vista dell’integrazione con domoNet, potrebbe essere presa in esame la possibilit`a di integrare le funzionalit`a di apprendimento nel ser- ver DomoNetServer, in modo da rendere superflua la presenza del modulo DomoPredictClient.
CAPITOLO 11. CONCLUSIONI E SVILUPPI FUTURI
Un altra possibilit`a potrebbe essere quella di portare il sistema, che attualmente `e in esecuzione su un pc, direttamente su un controller em- bedded, ottimizzandone le performance in funzione della potenza di calcolo notevolmente inferiore che tali dispositivi offrono.
Il lavoro di tesi ha dato vita ad un articolo, pubblicato dall’European Research Consortium for Informatics and Mathematics, nella rivista inter- nazionale ERCIM News numero 84 uscito nel gennaio 2011[26], che offre una sintetica visione d’insieme del sistema e pertanto si presta ad essere una buona lettura introduttiva.
Elenco delle tabelle
2.1 Le tecnologie impiegate in Domotica ed Ambient Intelligence . 20
4.1 Matrice di Confusione . . . 44
5.1 Esempio di transazioni ‘basket market’ . . . 78 5.2 Pseudocodice dell’algoritmo Apriori . . . 85 5.3 Pseudocodice della fase di generazione di regole associative per
l’algoritmo Apriori . . . 88 5.4 Pseudocodice della procedura ap-genrules . . . 89 5.5 Calcolo del supporto tramite itemset frequenti chiusi . . . 92
Elenco delle figure
2.1 Modello ISO/OSI . . . 15
3.1 Relazione tra ambient intelligence ed altre aree informatiche . 24 3.2 Layout generico di una Smart Home . . . 26 3.3 Flusso delle informazioni ed architettura generale di un siste-
ma AmI . . . 30
5.1 Un albero di decisione per il problema di classificare i mammiferi 73 5.2 Principio Apriori . . . 82 5.3 Support Based Pruning . . . 83 5.4 Generazione degli itemset frequenti tramite l’algoritmo Apriori 84 5.5 Calcolo del supporto degli itemset mediante una struttura hash 85 5.6 Pruning delle regole associative tramite il calcolo della confidenza 88 5.7 Esempio di itemset frequenti massimali . . . 90 5.8 Esempio di itemset frequenti chiusi, con minsup uguale al 40% 91
ELENCO DELLE FIGURE
Bibliografia
[1] Renato Zaccaria, ICT Pervasiva. La domotica. Mondo Digitale, n. 4, Dicembre 2007.
[2] Rolando Bianchi Bandinelli, Vittorio Miori Appunti di Domotica. CNR- ISTI, 2008.
[3] Mark Weiser, Hot Topics: Ubiquitous Computing. IEEE Computer, Vol. 26, Issue 10, pag. 71-72, Ottobre 1993.
[4] Emile Aarts, Ambient Intelligence: A Multimedia Perspective. IEEE Multimedia, Vol. 11, Issue 1, pag. 12-19, Gennaio - Marzo 2004.
[5] M. Weiser, The Computer for the twenty-first century. Scientific American, 165:94-104, 1991.
[6] Juan Carlos Augusto, Paul McCullagh, Ambient Intelligence: Concepts and Applications. Computer Science and Information Systems (comSIS), Volume Four, Number One, pag 1-27, Giugno 2007.
[7] D. Saha, A. Mukherjee, Pervasive Computing: A Paradigm for the 21st Century. IEEE Computer, Vol. 36, Issue 3, pag. 25-31, Marzo 2003. [8] N. Streitz, P. Nixon, Special issue on the disappearing computer. Com-
munications of The ACM, V 48, N 3, p 32-35, ACM Press, Marzo 2005.
[9] H. Raffler, Other Perspectives on Ambient Intelligence. Password Magazine, Issue 23, 2006.
BIBLIOGRAFIA
[10] D.J. Cook, S. Das, Smart Environments: Technologies, Protocols and Applications. JohnWiley and Sonso, 2004.
[11] J.H. Gilmore, B.J. Pine II, The Experience Economy. Bradford Books, 1999.
[12] J. Baudrillard, M. Poster, Jean Baudrillard: Selected Writings. Stanford University Press, pp. 10-29, 1988.
[13] Tom M. Mitchell, Machine Learning. McGraw-Hill, 1997.
[14] Ethem Alpaydim, Introduction to Machine Learning. MIT Press, 2004. [15] Vladimir Cherkassky, Filip Mulier, Learning from Data. Concepts,
Theory, Methods. Second Edition, IEEE Press, 2007.
[16] Simon Haykin, Neural Network: A Comprehensive Foundation. Second Edition, Pearson Prentice Hall, 2001.
[17] George V. Cybenko, Approximation by Superpositions of a Sigmoidal function. Mathematics of Control, Signals and Systems, vol. 2, pp. 303- 314, 1989.
[18] Scott E. Fahlman, Christian Lebiere, The Cascade-Correlation Learning Architecture. CMU-CS-90-100, Carnegie Mellon University, 1991. [19] Trevor Hastie, Robert Tibshirani, Jerome Friedman, The Element of
Statistical Learning. Springer, 2001.
[20] Richard O. Duda, Peter E. Hart, David G. Stork, Pattern Classification. Second Edition, Wiley, 2001.
[21] Christopher M. Bishop, Pattern Recognition and Machine Learning. Springer, 2006.
[22] Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Introduction to Data Mining. Addison Wesley, 2005.
BIBLIOGRAFIA
[23] Vittorio Miori, Luca Tarrini, Maurizio Manca, Gabriele Tolomei, do- moNet: a framework and a prototype for interoperability of domotics middlewares based on XML and WebServices. ICCE - International Conference on Consumer Electronics, pp. 117 - 118, Suvisoft Oy Ltd, Hermiankatu 3A FIN-33720 Tampere FINLAND, IEEE, 2006.
[24] Vittorio Miori, Dario Russo, Massimo Aliberti, Domotic technologies incompatibility becomes user transparent. Communications of the Acm, vol. 53 (1), pp. 153 - 157, ACM, 2010.
[25] Vittorio Miori, Luca Tarrini, Maurizio Manca, Gabriele Tolomei, An open standard solution for domotic interoperability. IEEE Transactions on Consumer Electronics, vol. 52 (1), pp. 97 - 103, IEEE, 2006.
[26] Vittorio Miori, Dario Russo, Alessandro Pulidori, Learning from Expe- rience to Anticipate Domestic Needs. ERCIM News, n. 84, pp. 36 - 37, ERCIM, 2011.