Un aspetto molto delicato, e da non sottovalutare, riguarda chi e cosa debba essere osservato tramite le telecamere, perché un sistema di videosorveglianza non ha il compito di spiare e monitorare le comuni attività giornaliere che gli individui praticano. Gli operatori hanno delle linee guida da rispettare come, ad esempio, l'obbligo di non tracciare le attività di persone che non stiano praticando delle azioni che potrebbero essere, in qualche modo, sospette. Ma definire quale sia un comportamento sospetto e come individuarlo resta uno dei maggiori problemi della videosorveglianza e, in linea di massima, durante l'addestramento dell'operatore questa parte della formazione viene largamente trascurata ritenendo sufficiente utilizzare il buon senso per capire quando è necessario intervenire.
Inoltre, si deve tenere presente che l'operatore non potrà porre la propria attenzione su tutte le immagini catturate dalle telecamere, ma dovrà focalizzarsi solo su alcune utilizzando, appunto, il buon senso. Un compito che non è assolutamente semplice, perché vi è un ulteriore livello di difficoltà dovuto al fatto che chi osserva le immagini è, in qualche modo, sordomuto perché non può chiedere agli individui spiegazioni del perché stiano agendo in un determinato modo e neanche ascoltare quanto dicono.
In definitiva, gli operatori agiscono e operano secondo “preconcetti” o comunque seguendo idee che sono del tutto personali. Questo accade anche per via della loro formazione la quale, spesso, rimane solo superficiale.
Anche se è vero che gli umani sono molto bravi nell'eseguire determinati compiti di sorveglianza è vero anche che in certi aspetti sono molto limitati. Tuttavia “non esiste una ragione a priori per supporre che un sistema di sorveglianza computerizzata non possa eseguire gli stessi compiti di un essere umano” [6], soprattutto in un contesto come è quello della videosorveglianza dove molto difficilmente, se non mai, la prestazione degli esseri umani può essere considerata ottimale.
Nei sistemi a circuito chiuso di dimensioni più piccole, dove l'obiettivo è osservare una piccola area come, ad esempio, una dimora privata, difficilmente sarà presente un
addetto alla visione delle immagini 24 ore su 24 e, in questo caso, le immagini riprese avranno lo scopo di fornire prove e aiuto alle forze dell'ordine nel caso in cui si verifichi un evento criminale. Con sistemi di questo tipo non si ricerca la prevenzione ma, semmai, la lotta al crimine avviene dopo che questo è stato commesso. Per questo in contesti del genere la presenza o meno di un essere umano che monitori costantemente le immagini è quasi del tutto irrilevante.
Ma in altri contesti, come nel caso di ditte specializzate nella vigilanza che, attraverso sistemi video, offrono copertura totale per tutto l'arco della giornata e si occupano di osservare a tempo pieno le immagini catturate con l'ausilio delle telecamere, è necessario che siano presenti numerosi addetti per, eventualmente, attivare in tempo reale delle misure volte a contrastare le condotte criminali. La figura 31 fa capire bene come si lavora ancora oggi nelle centrali di controllo dei sistemi di videosorveglianza: pochi addetti che controllano contemporaneamente decine di immagini risultanti da altrettante telecamere sul territorio. Un compito molto difficile sia per la limitata capacità degli individui di osservare contemporaneamente più monitor che per la difficoltà di mantenere alto il livello di concentrazione in un lavoro dagli scarsi stimoli, soprattutto nelle ore
notturne. Proprio in organizzazioni del genere si manifesta maggiormente l'inefficienza dell'essere umano, come emerge da numerose ricerche.
In una di queste Martin Gill e Angela Spriggs, nel 2005 [32], hanno analizzato e
comparato tra loro 13 sistemi di CCTV operativi a Leicester, in Inghilterra. Tra gli aspetti analizzati sono emersi con chiarezza due notevoli problemi riguardanti le camere di controllo. Il primo è relativo al monitoraggio perché su 13 camere di controllo analizzate ben 6 avevano carenze di personale con la conseguenza di non riuscire a controllare per 24 ore al giorno tutte le riprese. Il secondo aspetto problematico riguarda la scarsa comunicazione con le forze dell'ordine per cui gli operatori perdono, tendenzialmente, del tempo prezioso prima di intervenire.
Altre problematiche, come emerge dalla ricerca “CCTV Control Rooms Ergonomics” [33] di E. Wallace e C. Diffley, riguardano la struttura fisica delle camere di controllo. Occorre, infatti, fornire delle attrezzature adeguate affinché gli addetti al monitoraggio possano effettuare il loro lavoro in condizioni ottimali. Si fa riferimento ad una serie di accorgimenti, riguardanti le sedie e il comfort della postazione di lavoro ma anche l'ubicazione dei servizi igienici, che dovrebbero essere presi per fornire un ambiente lavorativo sano. Ma la parte della camera di controllo che genera maggiori problemi è anche la parte più importante della stessa ovvero i monitor. Prima di tutto non è possibile osservare per un periodo di tempo eccessivamente lungo le immagini riprodotte senza avere un calo di attenzione o affaticamento della vista per cui gli operatori fanno, in genere, una pausa di 5-10 minuti ogni ora e in questo lasso di tempo le immagini non vengono visionate. Inoltre, come evidenziato anche in altri studi [34, 35], ogni operatore può osservare più schermi contemporaneamente ma all'aumentare del numero di questi il livello di attenzione diminuirà, soprattutto in presenza di scene particolarmente movimentate.
Ogni operatore può, statisticamente, lavorare in modo efficace su un numero massimo di 4 immagini per cui, sulla base di questi dati, “in una tipica installazione con 100 telecamere e 3 operativi, meno del 3% delle immagini può essere monitorato attivamente in uno stesso momento”.
Ma l'inefficienza dell'operatore umano si manifesta anche in base a costruzioni socio-culturali della devianza proprie dell'individuo/operatore. Questo perché, come ben evidenziato da G. J. D. Smith [36], “l'operatore percepisce certi codici di abbigliamento come intrinsecamente devianti”. Dunque, l'attenzione viene focalizzata su certi individui non perché stiano ponendo in essere determinate azioni ma perché vestiti in un modo che l'operatore ritiene, in maniera del tutto soggettiva, associato a crimine e devianza.
Da queste scelte del tutto personali dell'addetto preposto alla visione delle immagini nascono poi una serie di proteste legate alla privacy degli individui. La presenza delle telecamere può essere percepita, infatti, come una violazione della propria libertà individuale. Se poi si è consapevoli che dall'altra parte vi è un individuo sconosciuto che osserva si percepisce la videosorveglianza come una specie di polizia facente capo ad una società totalitaria simile a quella del Grande Fratello. Notevole è anche il problema del voyeurismo, difficilmente controllabile. Sulla base di questi fattori nascono i problemi relativi alla privacy che potrebbero essere risolti utilizzando delle innovazioni tecnologiche sulle quali si sta ancora lavorando.
8 Conclusioni
Progettare un sistema di videosorveglianza attiva è un processo complesso che deve tenere conto delle specificità del contesto applicativo e degli obiettivi che il progettista si pone. Come si è descritto nel documento sono molti i fattori e le problematiche di cui tenere conto.
In questo documento sono state prese in esame diverse metodologie e approcci proposti in letteratura scientifica e sono state descritte soluzioni per affrontare la maggior parte delle problematiche che si possono presentare nella progettazione di un sistema di videosorveglianza che utilizza una o più telecamere.
Ogni soluzione proposta ha le sue peculiarità, i suoi vantaggi e svantaggi, per cui non è semplice stabilire in assoluto quale sia, tra quelle disponibili, la soluzione migliore per ogni problema, inoltre la ricerca propone continuamente nuove tecniche e nuovi approcci per affrontare i problemi ancora aperti.
9 Bibliografia
[1] Amendola, Giandomenico. Città, criminalità, paure: sessanta parole chiave per capire e
affrontare l'insicurezza urbana. Liguori editore, 2008, pag. 214
[2] Mazzette, Antonietta. La vulnerabilità urbana. Segni, forme, e soggetti dell’insicurezza
nella Sardegna settentrionale. Liguori Editore, 2003
[3] Amendola, Giandomenico. Paure in città. Strategie ed illusioni delle politiche per la
sicurezza urbana. Liguori editore, 2003, pag. 21
[4] Cohen, Lawrence E., and Marcus Felson. Social change and crime rate trends: A routine
activity approach. American sociological review, 1979: 588-608
[5] Norris, Clive, and Gary Armstrong. CCTV and the social structuring of surveillance. Crime prevention studies 10.157-178, 1999: 1, pag. 158
[6] Dee, Hannah M., and Sergio A. Velastin. How close are we to solving the problem of
automated visual surveillance? Machine Vision and Applications 19.5-6, 2008: 329-343
[7] Hu, Weiming, et al. A survey on visual surveillance of object motion and behaviors. Systems, Man, and Cybernetics, Part C: Applications and Reviews, IEEE Transactions on 34.3 (2004): 334-352.
[8] Piccardi, Massimo. Background subtraction techniques: a review. Systems, man and cybernetics, 2004 IEEE international conference on. Vol. 4. IEEE, 2004.
[9] C. Stauffer and W. Grimson, Adaptive background mixture models for real-time tracking in Proc. IEEE Conf. Computer Vision and Pattern Recognition, vol. 2, 1999, pp. 246–252.
[10] Barnich, Olivier, and Marc Van Droogenbroeck. ViBe: A universal background
subtraction algorithm for video sequences. Image Processing, IEEE Transactions on 20.6
(2011): 1709-1724.
[11] A. J. Lipton, H. Fujiyoshi, and R. S. Patil, Moving target classification and tracking from
real-time video in Proc. IEEE Workshop Applications of Computer Vision, 1998, pp. 8–14.
[12] J. Barron, D. Fleet, and S. Beauchemin, Performance of optical flow techniques International Journal Computer Vision, 1994, vol. 12, no. 1, pp. 42–77.
[13] R. T. Collins, A. J. Lipton, T. Kanade, H. Fujiyoshi, D. Duggins, Y. Tsin, D. Tolliver, N. Enomoto, O. Hasegawa, P. Burt, and L.Wixson, A system for video surveillance and monitoring Carnegie Mellon University, Pittsburgh, PA, Tech. Rep., CMU-RI-TR-00-12, 2000.
[14] A. J. Lipton, H. Fujiyoshi, and R. S. Patil, Moving target classification and tracking from
real-time video in Proc. IEEE Workshop Applications of Computer Vision, 1998, pp. 8–14.
[15] A. J. Lipton, Local application of optic flow to analyze rigid versus nonrigid motion in Proc. Int. Conf. Computer Vision Workshop Frame-Rate Vision, Corfu, Greece, 1999.
[16] S. McKenna, S. Jabri, Z. Duric, A. Rosenfeld, and H. Wechsler, Tracking groups of people Comput. Vis. Image Understanding, 2000, vol. 80, no. 1, pp. 42–56.
[17 ] Cfr. Editorial. The Growth of CCTV: a global perspective on the international diffusion of
video surveillance in publicly accessible space. CCTV Special, Surveillance & Society, Eds.
Clive Norris, Mike McCahill and David Wood, 2004
[18] The Evolution of Video Surveillance Systems, Fredrik Nilsson,
(http://www.infosectoday.com/Articles/Video_Surveillance_Systems.htm)
[19] T. Tian and C. Tomasi, Comparison of approaches to egomotion computation in Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1996, pp. 315–320.
[20] D. Koller, J. Weber, T. Huang, J. Malik, G. Ogasawara, B. Rao, and S. Russel, Toward robust
automatic traffic scene analysis in real-time in Proc. Int. Conf. Pattern Recognition, Israel,
1994, pp. 126–131.
[21] B. Coifman, D. Beymer, P.McLauchlan, and J. Malik, A real-time computer vision system
for vehicle tracking and traffic surveillance Transportation Res.: Part C, 1998, vol. 6, no. 4,
pp. 271–288.
[22] I. A. Karaulova, P. M. Hall, and A. D. Marshall, A hierarchical model of dynamics for
tracking people with a single video camera, in Proc. British Machine Vision Conf., 2000, pp.
262–352.
[23] H. Yang, J. G. Lou, H. Z. Sun, W. M. Hu, and T. N. Tan, Efficient and robust vehicle
localization, in Proc. IEEE International Conference Image Processing, 2001, pp. 355–358
[24] Xiaogang Wang, Intelligent multi-camera video surveillance: A review, Pattern Recognition Letters, Volume 34, Issue 1, 1 January 2013, Pages 3-19,
[25] Thiago T. Santos, Carlos H. Morimoto, Multiple camera people detection and tracking
using support integration, Pattern Recognition Letters, Volume 32, Issue 1, 1 January 2011,
Pages 47-55
[26] Thiago T. Santos, Carlos H. Morimoto, Multiple camera people detection and tracking
using support integration, Pattern Recognition Letters, Volume 32, Issue 1, 1 January 2011,
Pages 47-55
[27] Stauffer, C., Tieu, K., 2003. Automated multi-camera planar tracking correspondence
modeling. In: Proc. IEEE Internat. Conf. Computer Vision and Pattern Recognition. [28] http://www.cs.cmu.edu/~vsam/index.html [29] I. Haritaoglu, D. Harwood, and L. S. Davis, W4: Real-time surveillance of people and their activities IEEE Trans. Pattern Analysis Machine Intelligence, August 2000, vol. 22, pp. 809– 830. [30] C. R. Wren, A. Azarbayejani, T. Darrell, and A. P. Pentland, Pfinder: real-time tracking of the human body IEEE Trans. Pattern Analysis Machine Intelligence, July 1997, vol. 19, pp. 780–785.
[31] R. T. Collins, A. J. Lipton, T. Kanade, H. Fujiyoshi, D. Duggins, Y. Tsin, D. Tolliver, N. Enomoto, O. Hasegawa, P. Burt, and L.Wixson, A system for video surveillance and monitoring Carnegie Mellon University, Pittsburgh, PA, Tech. Rep., CMU-RI-TR-00-12, 2000.
[32] Martin, and Angela Spriggs. Assessing the impact of CCTV. London: Home Office Research, Development and Statistics Directorate, 2005
[33] Wallace, E., Diffley, C.: CCTV control room ergonomics. Technical Report 14/98, Police Scientific Development Branch (PSDB), UK Home Office (1988)
[34] A.H Tickner, E.C. Poulton, A.K. Copeman e D.C.V. Simmonds, Monitoring 16 Television
Screens Showing Little Movement, Medical Research Council, Applied Psychology Unit,
Cambridge, England, Ergonomics, 1972, Vol. 15, No. 3, pagg. 279-291
[35] A.H. Tickner e E.C. Poulton, Monitoring 16 Television Screens Showing a Great Deal of
Movement, Medical Research Council, Applied Psychology Unit, Cambridge, England,
Ergonomics, 1973, Vol. 16, No. 4, pagg. 381-401
[36] Gavin J.D. Smith, Behind the Screens: Examining Constructions of Deviance and Informal
Practices among CCTV Control Room Operators in the UK, Surveillance & Society CCTV
Special (eds. Norris, McCahill and Wood) 2(2/3) pag. 376-395
http://www.surveillance-and-society.org/cctv.htm
[37] Babaee, Mohammadreza, Duc Tung Dinh, and Gerhard Rigoll. A deep convolutional
neural network for video sequence background subtraction, Pattern Recognition 76 (2018):
635-649.
[38] Zeng, Zhiqiang, et al. Two-stream multirate recurrent neural network for video-based
pedestrian reidentification, IEEE Transactions on Industrial Informatics 14.7 (2017): 3179-3186.
[39] Muhammad, Khan, et al. Convolutional neural networks based fire detection in
surveillance videos. IEEE Access 6 (2018): 18174-18183.
NOTA: Le sezioni 1, 2, 3 e 7 sono basate sulla tesi di laurea magistrale La videosorveglianza.
Aspetti tecnologici e sociologici. del Dott. Paolo Sanna, (Relatore Dott. Andrea Lagorio,
Università di Sassari AA 2014/15)