Università di Roma “Sapienza”, Italia - [email protected]
ABSTRACT
Il patrimonio culturale online è a rischio deperimento. La capacità di conservare e valorizzare le risorse ormai datate è una questione di cui si dibatte da tempo, specie in ambito umanistico. In campi di studio ove predomina l'analisi e l'interpretazione di ogni singola risorsa testuale e/o documentale è fondamentale stabilire metodi e strumenti condivisi e standardizzati, che consentano alla ricerca scientifica di recuperare ed utilizzare materiali di lavoro attraverso il tempo.
In tal senso si propone l'analisi di una sezione specifica di Internet Archive, la biblioteca senza scopo di lucro fondata nel 1996. La "Wayback Machine", infatti, rappresenta una risorsa per quanti intendano provare una sorta di archeologia informatica. Messa a punto e gestita da Mark Graham, essa è uno strumento per catturare, preservare e aiutare le persone a scoprire e utilizzare dati presenti in rete, con più di 1 miliardo di nuove acquisizioni web ogni settimana.
La Wayback Machine può consentire anche di recuperare dati ormai cancellati da server obsoleti o rovinati, come è accaduto a centri di ricerca nati a fine millennio che hanno perduto anni di lavoro di innovazione tecnologica.
Dunque si vuole restituire voce ad alcuni reperti dell'archeologia informatica come esempio per un fattivo e consapevole utilizzo della risorsa messa a punto nell'ambito dell'ambizioso progetto dell'Internet Archive. Ciò può essere utile per il recupero della memoria storica, per la valorizzazione di strumenti informatici creati nel passato e fermi per questioni di obsolescenza o di semplice incuria istituzionale, infine per ricostruire una più completa storia della cultura digitale.
PAROLE CHIAVE
Internet archive, archeologia informatica, storia della cultura digitale
1. PREMESSA
Il patrimonio culturale online è a rischio deperimento. La capacità di conservare e valorizzare le risorse ormai datate è una questione di cui si dibatte da tempo, specie in ambito umanistico. In campi di studio ove predomina l'analisi e l'interpretazione di ogni singola risorsa testuale e/o documentale è fondamentale stabilire metodi e strumenti condivisi e standardizzati, che consentano alla ricerca scientifica di recuperare ed utilizzare materiali di lavoro attraverso il tempo.
Tale necessità va sempre più prendendo corpo nelle Facoltà Umanistiche vista la mole di dati testuali che dalla fine degli anni Ottanta sono stati digitalizzati in formati diversi e con linguaggi di marcatura ormai superati. All'SGML, infatti, è seguito nel tempo l'XML che ha avuto numerose implementazioni, fino ad arrivare alla complessità del web semantico.
Gli umanisti stanno sperimentando l'obsolescenza digitale, specie in questo momento storico, visto che si trovano a dover utilizzare computer dotati di lettore CD-Rom – ormai una chimera nei pc/mac di ultima generazione – oppure mantenere in vita vecchi pc su cui sono montati programmi che non riescono ad essere letti da hardware contemporanei. Il web supplisce in minima parte alle difficoltà di lettura della LIZ, come anche della LIE – in campo letterario – poiche molte delle risorse disponibili rete non sono attendibili dal punto di vista scientifico.
7. METODO: IN DIREZIONE CONTRARIA
In tal senso si propone l'analisi di una sezione specifica di Internet Archive, la biblioteca senza scopo di lucro fondata nel 1996. Un insieme composito di risorse multimediali tra le quali sono compresi strumenti di reperimento e download di testi disponibili in diversi formati: pdf, txt, ePub e molti altri.
Tra le risorse dell'archivio testuale è importante notare uno strumento interessantissimo: la "Wayback Machine". Infatti, essa rappresenta un porto sicuro per l'umanista che voglia scandagliare i fondali del web, ovvero per quanti intendano provare una sorta di archeologia informatica. Messa a punto e gestita
da Mark Graham, la Wayback Machine è uno strumento per catturare, preservare e aiutare le persone a scoprire e utilizzare dati presenti in rete fin dal 1996, con più di 1 miliardo di nuove acquisizioni web ogni settimana. L'ottica entro cui nasce e cresce lo strumento è quella della preservazione della cultura digitale conservandone traccia. Come archeologi di una storia dell'informatica umanistica italiana, ad esempio, è possibile rintracciare contenuti ormai superati e recuperare materiali che sono stati messi a disposizione in rete fin dagli anni Novanta del Novecento.
In tal senso, la documentazione riguardante i centri di ricerca che in Italia si sono occupati della commistione tra discipline umanistiche e informatica vede nella Wayback Machine un ottimo strumento di reperimento dei materiali ormai dimenticati.
2. RISULTATI
Come moderni Ulisse alla ricerca di una conoscenza che ci era preclusa, è dunque possibile ricostruire percorsi di ricerca, oltre a tracciare i progressi nelle discipline umanistiche che abbiano utilizzato l'informatica per accrescere le proprie conoscenze. La “Wayback Machine” può consentire anche di recuperare dati ormai cancellati da server obsoleti o rovinati, come è accaduto a centri di ricerca nati a fine millennio che hanno perduto mesi di lavoro e di innovazione tecnologica. In tal senso si illustrerà il caso di un centro di ricerca italiano, il CRILeT di Giuseppe Gigliozzi, i cui server sono andati distrutti all'inzio del XXI secolo, ma di cui resta una traccia nella macchina del tempo gestita da Internet Archive. Un centro di ricerca all'avanguardia negli anni Novanta rischiava di vedere persi gli esiti di un lavoro decennale. Grazie alla Wayback Machine si può arricchire e in un certo senso anche riscrivere la storia della Scuola Romana di Informatica Umanistica.
3. CONCLUSIONI
Dunque si può restituire voce ad alcuni reperti dell'archeologia informatica come esempio per un fattivo e consapevole utilizzo della risorsa messa a punto nell'ambito dell'ambizioso progetto dell'Internet Archive. Ciò può essere utile per il recupero della memoria storica, per la valorizzazione di strumenti informatici creati nel passato e fermi per questioni di obsolescenza o di semplice incuria istituzionale, infine per ricostruire una più completa storia della cultura digitale.
4. BIBLIOGRAFIA
[1] Andrews, T. 2015. Digital Humanities, Living Book, http:// www.livingbooksabouthistory.ch/fr/book/digital-humanities
[2] Bar-Yossef, Z., Broder, A.Z., Kumar, R., Tomkins, A. 2004. Sic transit gloria telae: towards an understanding of the web’s decay. In: Proceedings of the 13th International Conference on World Wide Web. WWW ’04, ACM, pp. 328–337
[3] Burkhardt, M. 2009. Is There a Way Back or Can the Internet Remember its Own History? In A. Maj, & D. Riha (Eds.), Digital
Memories: Exploring Critical Issues. Oxford: Inter-Disciplinary Press, pp. 129-138.
[4] Cohen, D. J., & Rosenzweig, R. 2005. The fragility of digital materials. In Digital history: a guide to gathering, preserving, and
presenting the past on the web. http://chnm.gmu.edu/digitalhistory/preserving/1.php
[5] Daquino, M.; Tomasi, F. 2016. Digital Humanities e Library and Information Science. In: BIBLIOTHECAE.IT, 5, pp. 130-150 [6] Derrot, S. Fauduet, L. Oury, C. Peyrard, S. 2012. Preservation Is Knowledge: A community-driven preservation approach. 9th
International Conference on Preservation of Digital Objects (iPRES), Canada
[7] Dougherty, M. Meyer, E. Madsen, C. Van Den Heuvel, C. Thomas, A. W Yatt, S. 2010. Researcher Engagement with Web Archives:
State of the Art, London, JISC. http://repository.jisc.ac.uk/544/1/JISC-REWA_StateoftheArt_August2010.pdf
[8] Dulong de Rosnay, M. Musiani, F. 2012. The Preservation of Digital Heritage: Epistemological and Legal Reflections. In: ESSACHESS – Journal for Communication Studies, 5 (2), pp. 81-94
[9] Eco, U. 2007. L’albero e il labirinto, Milano, Bompiani [10] Fabbri, P. 2001. La svolta semiotica, Roma/Bari, Laterza
[11] Giannetto, M. 2009-2010. Dalla carta alle reti informative al Sistema Archivistico Nazionale, In: Rassegna degli Archivi di Stato, N.s., V-VI, pp. 231-256
[12] Graham, B. 2002. Heritage as Knowledge: Capital or Culture? In: Urban Studies, 33, pp. 1003-1017
[13] Hale, Scott A., Blank, Grant, and Alexander, Victoria D. 2017. Live versus archive: Comparing a web archive and to a population of
webpages. In Niels Brugger and Ralph Schroeder (Eds.), The Web as History, London: UCL Press, pp. 45-61.
https://www.ucl.ac.uk/ucl-press/browse-books/the-web-as- history
[14] Harrison, T.L., Nelson, M.L. 2006. Just-In-Time Recovery of Missing Web Pages. In: Proceedings of the 17th Conference on Hypertext and Hypermedia. HYPERTEXT ’06, ACM, pp. 145–156
[15] Hockx-Yu, H. 2012, December 19. Digital humanities and the study of the web and web archives.
http://britishlibrary.typepad.co.uk/webarchive/2012/12/digital-humanities-and-the-study-of-the- web.html#sthash.CSWkLtSl.dpuf [16] Information Today. 2005, November 28. Internet Archive offers new archive service.
http://newsbreaks.infotoday.com/Digest/Internet-Archive-Offers-New-Archive-Service-16063.asp [17] Internet Archive. 2014, August. Number of unique IP addresses per day. https://archive.org/stats/ [18] Internet Archive. About the Internet Archive. https://archive.org/about/
[19] Internet Archive. Internet Archive projects. https://archive.org/projects/
[20] Lana, M. 2012. Biblioteche digitali: un'introduzione. Bologna Bononia University Press [21] Lana, M. 2004. Il testo nel computer : dal web all'analisi dei testi. Torino Bollati Boringhieri
[22] Lucatti, E. Treleani, M. 2013. Fare presente. Per une semiotica dell’archivio. In: Versus. Quaderni di studi semiotici, 116, Milano, Bompiani, pp. 129-148
[23] Lusenet, Y. 2007. Tending the Garden or Harvesting the Fields: Digital Preservation and the UNESCO Charter on the Preservation
of the Digital Heritage. Library Trends, 56 (1), pp. 164-182
[24] Mandic, S. 29/10/2011. Internet Archive e nuove tipologie di fonti storiche. In: Diacronie. Studi di Storia Contemporanea. Le sembianze di Clio: approcci alla storia. http://www.studistorici.com/2011/10/29/mandic_numero_8/
[25] Marchionini, G. 1997. A Study on Video Browsing Strategies. Technical Report. University of Maryland at College Park.
[26] Masanès, J. 2005. Web archiving methods and approaches: a comparative study. In: Library Trends, 54(1). http://muse.jhu.edu/journals/library_trends/v054/54.1masanas.html
[29] Negulescu, K.C. 2010. Web Archiving @ the Internet Archive. Presentation at the 2010 Digital Preservation Partners Meeting. http://1.usa.gov/XSjDG8
[30] Niu, J. 2012. An overview of web archiving. D-Lib Magazine, 18(3/4). http://dlib.org/dlib/march12/niu/03niu1.html [31] Pennock, M. 2013. Web archiving. http://dx.doi.org/10.7207/twr13-01
[32] Rahaman, H. Tan, B.-K. 2011. Interpreting Digital Heritage: A Conceptual Model With End-Users’ Perspective. In: International Journal of Architectural Computing, 9 (1), pp. 99-113
[33] Rogers, R. 2013. Digital Methods. Cambridge, MA, The MIT Press [34] Rosenthal, D. S. 2010a. How green is digital preservation?
http://www.digitalpreservation.gov/meetings/documents/othermeetings/Rosenthal.pdf [35] Rosenthal, D. S. 2010b. How are we ensuring the longevity of digital documents?
https://www.youtube.com/watch?v=h53DMtBUxsk
[36] Schafer, V. Musiani, F. Borelli, M. 2016. Negotiating the Web of the Past. In: French Journal for Media Research, 6, http://frenchjournalformediaresearch.com/lodel/index.php?id=952
[37] Smith, L. 2006. Uses of Heritage. London & New York, Routledge
[38] Smith, N. 1994. What can Archives offer the World Wide Web? Computing Laboratory, University of Kent, Canterbury, UKDing, W.,
[39] Thelwall, M., Vaughan, L. 2004. A fair history of the web? examining country balance in the internet archive. In: Library & Information Science Research 26(2)
[40] Tofel, B. 2007. Wayback for Accessing Web Archives. In: Proceedings of International Web Archiving Workshop. IWAW
[41] Tomasi, F. 2017. La preservazione del contenuto degli oggetti culturali: formalizzare la provenance. In: BIBLIOTHECAE.IT, 6, pp. 17-40
[42] Tomasi, F., Edizioni o archivi digitali? Knowledge sites e apporti disciplinari. In: Edizioni Critiche Digitali. Digital Critical Editions. Edizioni a confronto/comparing editions, Roma, Sapienza Università Editrice, 2016, pp. 129-136
[43] Tomasi, F. Daquino, M. 2015. Modellare ontologicamente il dominio archivistico in una prospettiva di integrazione disciplinare. In: JLIS.IT, 6, pp. 13-38
[44] UNESCO 2003. Charte sur la conservation du patrimoine numerique,
http:// portal.unesco.org/fr/ev.php-URL_ID=17721&URL_DO=DO_TOPIC&URL_SECTION=201.html
[45] Van de Sompel, H. 2012. SiteStory transactional web archive software released. D-Lib Magazine, 18(9/10). Retrieved from http://www.dlib.org/dlib/september12/09inbrief.html
[46] Zhuang, Z., Wagle, R., Giles, C. 2005. What’s there and what’s not?: focused crawling for missing documents in digital libraries. In: Proceedings of the 5th ACM/IEEE- CS Joint Conference on Digital Libraries. JCDL ’05, pp. 301–310.