• Non ci sono risultati.

In questo secondo paragrafo ci occuperemo brevemente delle problematiche che la tecnologia digitale ha portato ai documenti185, dato che è necessario imparare a comportarsi in modo adeguato rispetto alle

ICT186. Non si scenderà nel particolare di queste nè della loro risoluzione, tuttavia se ne darà una illustrazione generale. I “nuovi” problemi dei documenti (digitali) sono essenzialmente due: la conservazione e l’interoperabilità.

184 Di digerati parla anche Heartley (2010).

185 Documenti intesi genericamente come al capitolo 1.

186 Come confermano Rodes, Piejut and Plas (2003, Introduction Generale) “.. la production et la diffusion de contenus

éducatifs, scientifiques et culturels, la conservation du patrimoine numérique, la qualité de l’enseignement et de l’apprentissage sont autant de composantes essentielles des sociétés de la connaissance”. Essi evidenziano tra le altre cose la conservazione del materiale digitale come componente essenziale della società dell’informazione, definita qui come società della conoscenza. Per chiarimenti riguardo a questa diversa terminologia si veda il ragionamento diManole and Petac (2016). Gli autori sottolineano come information e knowledge society siano termini strategici, che sottolineano determinati aspetti della (stessa) società che descrivono. “Information society emphasizes the amount of information available and accessible. It focuses on technology. Knowledge-based societies are identified as societies that use and apply information in various areas of learning and development.”

LA CONSERVAZIONE

“Conservazione del digitale (espressione con cui traduciamo il termine inglese digital preservation): insieme delle attività realizzate per assicurare l’accesso continuo ai materiali digitali187 (sia surrogati che “nati digitali”188) per il tempo considerato necessario.”

Santoro (2006b)

Digital preservation: “keeping the bits and bytes safe and unaltered for a long period of time.” Hodge (2005)189

Uno dei problemi più grossi del digitale è avere complicazioni con la conservazione. Nonostante anche a livello analogico ci sia deterioramento e perdita dei documenti nel tempo190, questo a livello digitale avviene a livello più ampio e in tempo molto più ridotto191. Lo spiegano chiaramente Tola and Castellani

(2004, 321): “I documenti digitali durano meno di 20 anni.” Conferma Santoro (2001, 94-95) “la vita media di un cd-rom va dai cinque ai venticinque anni, mentre hardware, software e sistemi operativi hanno un ciclo di vita dai due ai cinque anni. […] la vita media di una pagina web è all’incirca di settanta giorni.”192.

Il problema della conservazione del digitale è stato presto compreso a livello istituzionale in tutte le discipline del documento. Una delle prime e più importanti elaborazioni complete a riguardo, “Preserving Digital Information” di Waters and Garret, risale già al 1996193. È frutto di anni di ricerche

da parte di una task force appositamente nominata194 dalla Commission on Preservation and Access195 e dal Research Libraries Group196 per investigare i modi per permettere accesso continuo e per sempre nel

187 Quindi per noi ai documenti.

188 I documenti digitali si distinguono, come segnalato da Ridi (2004, 7) per gli e- journal, in “digitali nativi (born digital),

esistenti esclusivamente (o comunque prevalentemente) in ambiente elettronico; digitalizzati “a priori”, […] come versione parallela di un originale cartaceo, […] digitalizzati “a posteriori” […] versioni digitali di collezioni retrospettive di periodici cartacei, […] con notevole ritardo (talvolta di secoli) rispetto agli originali”.

189 Tuttavia riteniamo sia importante segnalare come la conservazione non sia solamente un processo tecnico per mantenere i

bit disponi bili nel tempo. Come spiegano Lavoie and Dempsey (2004) si tratta anche di un processo sociale, culturale (perché si deve scegliere che cosa conservare); di un processo economico ( perché dispendioso e per moltissime risorse); di un processo legale ma soprattutto di un impegno a lungo termine che spesso è raggiunto con la cooperazione di più parti interessate. Concordano Burnell Heimerl, Jang and Johnson (2017) “just as we have considered the obsolescence of computing hardware and software, so too must we consider the obsolescence of computing culture, and how it might persist or rot.”

190 Per la conservazione del materiale cartaceo si veda Federici (2005).

191 Questo concetto è espliciatato chiaramente da Rothenberg (1999, 2): “The contents of most digital media evaporate long

before words written on high quality paper, and they often become unusably obsolete much sooner, ..”

192 Non si può dire lo stesso per i documenti “analogici”, scritti su altro materiale come papiro, pergamena o carta stessa, di cui

abbiamo testimonianze risalenti a millenni fa. Esempio nell’immagine in Clauser and Lucchesi (2009, 23). Nel testo sono presenti molti altri esempi a riguardo.

193 “Come punto di partenza si può assumere l’ormai celebre rapporto della Task Force on Archiving of Digital Information. “Il

rapporto della Task Force rimane a tutt’oggi lo studio più completo sull’argomento” Santoro (2006).

194 “Composed of individuals drawn from industry, museums, archives and libraries, publishers, scholarly societies and

government,…” Waters and Garrett (1996, iii). Per un elenco dei membri, si veda ( v-vi).

195Si vedaLusenet and Drench (2002) per una descrizione completa.

196 Ne tratta Van Camp (2003). Si tratta di un consorzio di biblioteche U.S.A. esistito da 1974 a 2006, quando si è fuso con

altre. Il suo scopo era migliorare, in modo collaborativo, l'accesso alle informazioni che supportano la ricerca e l'apprendimento.

futuro a documenti in formato digitale. In questo documento, conclusivo della task force, si è “aimed […] to identify the most demanding preservation issues and to frame them for appropriate action.” Waters, Garrett (1996, 40). La soluzione proposta propone tre tipi di azioni: progetti pilota, strutture di supporto e migliori pratiche. Questo studio è considerato il primo esempio; su di esso si sono basati moltissimi autori per elaborazioni successive. Da allora sono nate numerose associazioni e organizzazioni che nel tempo hanno proposto diverse iniziative per risolvere il problema della conservazione. Tra queste segnaliamo la Digital Preservation Coalition (DPC), organizzazione creata nel 2001 per la conservazione nel Regno Unito e a livello internazionale197. Interessante la produzione da parte di questa organizzazione di un handbook (Digital Preservation Coalition, 2015); siamo arrivati alla seconda edizione di questo testo, ma l’idea dell’associazione è continuare ad innovarsi198.

Dopo questa brevissima introduzione cronologica relativa agli studi sulla conservazione del digitale199, passiamo a trattare del motivo per cui è più difficile conservare un documento digitale rispetto ad uno cartaceo. Esso è dovuto alla materialità del supporto tecnologico200, ed è chiamato “obsolescenza digitale” o “tecnologica”. 201 Il termine, unione delle parole obsolescenza202 e digitale, ha un valore

proprio ed esprime, nelle parole di Guercio (2015): “la condizione che rende non leggibile203 e non

intelligibile e, quindi, inutilizzabile una risorsa digitale, a seguito dell’indisponibilità dei supporti o degli strumenti di lettura e di trattamento dei dati.” Vediamo il concetto espresso in questa modalità da diversi esperti in materia; tra le definizioni segnaliamo anche l’affermazione di Santoro (2001, 94), che chiarisce come “Tali documenti poi non solo sono più “fragili” dei loro corrispondenti analogici, ma più facilmente in grado di diventare fisicamente e logicamente “inaccessibili”: difatti il deterioramento dei supporti, la volatilità dei meccanismi di presentazione dei dati e la perdita di funzionalità dei sistemi di accesso sono tutti fattori che contribuiscono a rendere irraggiungibili un numero assai elevato di

documenti.” In effetti I documenti digitali possono essere soggetti a tre tipi differenti di obsolescenza: - del medium che li trasmette: “il deterioramento dei supporti”. Ad esempio i floppy disk di tipo 8 e 5¼

197 Hodge (2005). Nel sito ufficiale della DPC sai possono trovare I nomi di tutte le istituzioni coinvolte.

198 Per una spiegazione pratica di cosa si faccia come digital preservation si segnala Smit, Van Der Hoeven and Giaretta (2011,

38-39).

199 Da segnalare il fatto che ogni associazione o federazione crei un proprio metodo e delle proprie strategie di conservazione

del digitale valido per lei. Verheul (2008) tra gli altri può essere un esempio interessnte di questo.

200 “.. although its reproducibility make digital information theoretically invulnerable to the ravages of time, the physical media

on which it is stored are far from eternal.” Rothenberg (1999, 2).

201 Tola and Castellani ( 2004) riportano questo concetto più volte: “.. l’ostacolo principale alla conservazione delle memorie

digitali è l’obsolescenza tecnologica.” ( 22) “.. identificato nell’obsolescenza tecnologica il problema più urgente per la conservazione delle memorie digitali” ( 176).

202 “Diminuzione progressiva delle possibilità di sussistenza, efficienza, validità, gradimento all’interno di un ambiente” per

Devoto and Oli (2000, 1376) Dato che il termne deriva dall’inglese obsolescence ne diamo anche la definizione di n.a. (2007, 1029): “the state of becoming old- fashioned and no longer used, especially becouse of being replaced by something newer and more effective”.

203 Conferma il termine “illeggibili” Kastellec (2012, 64): “When the physical medium of a digital file decays to the point

che erano uno standard negli anni 80 del Novecento, ora non sono più in commercio perché sono un tipo di supporto superato204.. - dell’hardware205: “la perdita di funzionalità dei sistemi di accesso”. Ad esempio dai primi computer ad oggi sono cambiate le unità necessarie per inserire i supporti che contengono i documenti206, ed è

cambiata anche la composizione del computer stesso. - del software207: “la volatilità dei meccanismi di presentazione dei dati”. Si tratta sia del software con cui

è scritto il documento, sia del sistema operativo che permette di eseguire il software di cui nel tempo vengono proposte versioni nuove e migliorate208. “Given the rapid pace of change in computer hardware

and software, technological obsolescence is a constant concern” (Kastellec, 2012, 64). A causa di questa obsolescenza, documenti digitali del passato sono diventati ormai inaccessibili nel

presente209, e questo è un grande rischio per la cultura ma anche ad un altro livello, più pratico, se prendiamo in considerazione i documenti archivistici che rappresentano un’azione giuridica.

L’INTEROPERABILITÁ

Il documento quando espresso in bit e bytes soffre anche di altri tipi di problemi, legati al concetto di interoperabilità. Per darne una definizione semplice e non tecnica210, essa è la “capacità di un sistema informatico di interagire con altri sistemi informatici analoghi sulla base di requisiti minimi condivisi.”

204 Superato perché rispetto ai supporti più recenti può contenere poca informazione a più costo Per maggiori informazioni si

vedano le definizioni di CD- ROM and DVD- ROM e floppy disk in Henderson (2009).

205 “L’insieme dei componenti elettronici, elettrici e meccanici che costituiscono le apparecchiature fisiche di un sistema di

elaborazione” Vigini (1985, 58).

206 Se pensiamo alla maggior parte dei computer portatili con cui ci interfacciamo ogni giorno, ci rendiamo conto che essi non

possiedono più un lettore per CD- ROM.

207 “L’insieme delle procedure e delle istruzioni di un sistema di elaborazione dati; si identifica con un insieme di programmi”

Devoto and Oli (2000, 1972).

208 “Besides physical deterioration, the obsolescence of file formats can also render archived data unusable”. Henderson (2009,

37). “While software does not “wear out” like hardware, it can be slowly corrupted over time, often has external dependencies, and is subject to contamination from the outside environment.” Burnell, Heimerl, Jang and Johnson (2017).

Per informazioni più specifiche sulla software obsolescence si veda Sandborn (2007) che propone anche alcune soluzioni per risolvere in parte il problema.

209 A questo riguardo si è creato il termine digital dark age, “a possible future situation where it will be difficult or impossible

to read historical documents, because of inadequate digital preservation.” Smit, Van Der Hoeven and Giaretta (2011). Il concetto è stato sviluppato da diversi autori, generalmente per descrivere il Ventunesimo secolo come età buia per l’informazione per la sua difficile conservazione a causa del digitale. Segnaliamo a questo proposito Kuny and Cleveland (1998) e Brand (2003).

210 Anche questo concetto è complicato e ne tratteremo solo genericamente. Per ulteriori informazioni si segnala l’ “European

Interoperability Framework for pan-European eGovernment Services”, scritto nel 2004 su richiesta della Commissione Europea da parte di IDABC (Interoperable Delivery of European eGovernment Services to public Administrations, Businesses and Citizens), un programma comunitario appartenente appunto alla Commissione. Qui si trovano informazioni più dettagliate riguardo ai tre settori dell’interoperabilità, che può essere organizzativa, semantica e tecnica. Come ci riportano AA.VV. (2008, 33) nel testo dell’IDABC, il concetto di interoperabilità è definito come “la capacità dei sistemi tecnologici di informazione e comunicazione (ICT), come pure di processi operativi che essi supportano, di scambiare dati e permettere la distribuzione dell’informazione e della conoscenza.” Interessante far notare come questo concetto sia stato studiato più tardi rispetto ad altri che abbiamo preso in considerazione, e ne troviamo la prova nel fatto che Margail (1996, 31) scrive che “Devant l'absence de définition officielle (ce mot n'existe pas — encore - dans le dictionnaire), des tentatives d'explicitation ont été avances..” e poco dopo “la notion demeure encore floue.”. Se a metà degli anni Novanta ancora non si sapeva come descrivere l’interoperabilità, probabilmente era perché non si aveva ancora studiato a fondo il tema.

(Regole tecniche in materia di sistema di conservazione ai sensi degli articoli 20, commi 3 e 5-bis, 23-ter, comma 4, 43, commi 1 e 3, 44 , 44-bis e 71, comma 1, del Codice dell'amministrazione digitale di cui al decreto legislativo n. 82 del 2005, 2014)211 Per Ziccardi (2008, 255) un documento è considerato interoperabile se soddisfa determinate condizioni a due livelli212:

-tecnologico: quando facendo un’analisi a livello di dati e di servizi è possibile lo scambio tra i diversi sistemi perché formati e standard sono aperti;

- semantico: quando si ha la possibilità di condividere il “significato” dei documenti stessi213.

Per quanto riguarda l’interoperabilità tecnologica, credo sia qui necessario trattarne in maniera un po’ più approfondita. Per l’autore214, sia ha interoperabilità quando in un documento:

- il suo formato215 o il suo codice216 sono liberi, in modo che chiunque possa sviluppare sistemi che usano quel formato;

- il suo formato è diffuso a livello universale, in modo che chi riceve quel documento abbia gli strumenti tecnologici per leggerlo. Per l’interoperabilità quindi come già affermato è necessario cercare formati217 e

standard che siano aperti.

211In altre parole si può definire come “ la predisposizione di un prodotto tecnologico a cooperare con altri prodotti senza

particolari difficoltà, con affidabilità di risultato e con ottimizzazione delle risorse. Obiettivo dell’interoperabilità è dunque facilitare l’interazione fra applicazioni software differenti, nonchè lo scambio e il riutilizzo delle informazioni anche fra sistemi informativi non omogenei.” (Aliprandi, 2011). Se guardiamo all'area francese vediamo come: “les normes d'interopérabilité visent […] à garantir a priori la compatibilité et la fiabilité des liaisons entre les différentes composantes de l'infrastructure industrielle ou technique, en laissant ouverte la possibilité que de nouveaux acteurs s'agrègent au réseau. ”. Interessante questo chiarimento di Benghozi, Henry, Ravix , Romani and Segrestin (1996, 19) che distinguono tra interoperabilità, che garantisce a priori uno scambio corretto, e la compatibilità, che omogeneizza a posteriori. Per compatibilità si veda Henderson (2009): compatibility and portability.

212 Ridi (2004) tuttavia, che considera l’interoperabilità la “capacità di scambiare e riutilizzare proficuamente dati e

informazioni sia fra sistemi e organizzazioni distinte sia internamente ad esse”, ne identifica cinque tipologie: le già citate tecnologica e semantica, cui si aggiungono interoperabilità interistituzionale: “implica la disponibilità effettiva da parte delle istituzioni di rendere disponibili le proprie risorse informative”; intersettoriale: “che cerchi di superare le barriere culturali fra comunità disciplinari e professionali diverse, come ad esempio quelle fra biblioteche, musei e archivi”; internazionale: “che cerchi di superare le barriere culturali e linguistiche fra paesi.”

213Euzenat (2001): “Semantic interoperability is the faculty of interpreting the annotations at the semantic level”. Si veda il

testo per una analisi completa dell’interoperabilità semantica.

214Ziccardi (2008, 255).

215Il formato, per Amministrazione digitale: regole tecniche sul sistema di conservazione (2014), è la : “modalità di

rappresentazione della sequenza di bit che costituiscono il documento informatico; comunemente è identificato attraverso l’estensione del file”. Per più informazioni relative al formato si veda il testo completo che è per gran parte dedicato alla loro spiegazione esaustiva.

216 Si tratta di due tipi di codice: “Il codice sorgente è la forma in cui è redatto ogni programma, in un linguaggio che spieghi

ad altri umani che lo conoscono le caratteristiche e i percorsi logici seguiti dal programmatore nella realizzazione di un certo software; il codice oggetto, invece, è una lunga serie di impulsi elettrici negativi e positivi graficamente rappresentati da 1 e da 0, comprensibile al calcolatore.” : Menghetti (2014/2015, 5).

217 Un “formato è aperto se il modo di rappresentazione dei suoi dati è trasparente e/o la sua specifica è di pubblico dominio. Si

tratta generalmente (ma non esclusivamente) di standard fissati da autorità pubbliche e/o istituzioni internazionali il cui scopo è quello di fissare norme che assicurino l’interoperabilità tra software”, come spiega Aliprandi (2011, par 4.2.2).

IMG Il rapporto tra il concetto di standard e quello di formato. Nell’area più scura è rappresentata l’apertura dello stesso, da Aliprandi (2011, par 4.2.2).

I problemi a questo riguardo si creano generalmente perché aziende private creano software proprietari218, chiusi, per cui è impossibile scambiare informazioni con altri programmi anche se questi hanno lo stesso formato o codice219. La soluzione proposta è quella dell’uso di software open source220: sinteticamente, è un “software distribuito con una licenza che ne consente la libera distribuzione in forma sorgente, e conferisce la possibilità all’utente di poter modificare il programma originario e di poter distribuire la versione modificata.”221.

Tuttavia per avere un software open source e quindi perché ci sia interoperabilità è necessario che a livello internazionale vengano adottati degli standard222, ottenuti attraverso un processo di standardizzazione.

“[A standard is] a documented agreement containing technical specifications or other precise criteria to be used consistently as rules, guidelines, or definitions of characteristics to ensure that materials, products, processes and services are fit for their purpose”. Aliprandi (2011)223

218 “un formato è proprietario se il modo di rappresentazione dei suoi dati è opaco e la sua specifica non è pubblica. Si tratta in

genere di un formato sviluppato da un’azienda di software per codificare i dati di una specifica applicazione che essa produce: solo i prodotti di questa azienda potranno leggere correttamente e completamente i dati contenuti in un file a formato

proprietario. I formati proprietari possono inoltre essere protetti da un brevetto e possono imporre il versamento di royalty a chi ne fa uso” Aliprandi (2011, cap 4.2.1).

219 Per la classificazione delle tipologie di software per licenza di distribuzione si vedano i paragrafi 1.1 e 1.2 di Basso (2000). 220 Chiamati anche FLOSS a seguito di un dibattito concluso nel 2001. Per maggiori informazioni riguardo allo studio

terminologico si veda Aliprandi (2011).

221 Basso (2000, 1). Ci sembra importante ricordare che il fatto che un software sia open source ha forti implicazioni

economiche, come spiega Henderson (2009, 352) : “Open-source software has the potential for providing diversity and alternatives in a world where some categories such as PC operating systems and office software are dominated by one or a few large companies.” Al movimento open source sono date anche implicazioni sociali, cui accenna l’autore nel testo.

222 Per gli standard segnaliamo la differenza tra standard de jure e standard de facto di cui si possono leggere le definizioni in

Aliprandi (2011, par 2.1.1).

Gli standard che permettono interoperabilità sono gli standard aperti. Esistono diverse definizioni di standard aperto, date da studiosi ed organizzazioni del campo dell’informatica224; riportiamo per

semplicità la definizione fornita da ITU-T225 e riportata da Aliprandi (2011):

“Open Standards are standards made available to the general public and are developed (or approved) and maintained via a collaborative and consensus driven process. Open Standards facilitate interoperability and data exchange among different products or services and are intended for widespread adoption.”

Se possiedono formati standard aperti, i documenti non avranno alcun problema di interoperabilità. L’obiettivo è quindi fare in modo di raggiungere questa standardizzazione a livello internazionale per poter avere un utilizzo completo e a lungo termine delle tecnologie digitali a tutti i livelli di conoscenza di chi vive nell’information society.

Concetto fondamentale legato all’interoperabilità, di cui è necessario trattare,226 è il concetto di

metadati227. Si tratta, come si evince dalla sua etimologia228, di dati di secondo livello229, utilizzati per descrivere e classificare altri dati; sono importanti perché molto utili nella gestione di contenuti informativi o documentali, soprattutto nel caso di presenza di numerose informazioni230 . A volte è difficile distinguere i dati (primari), dai metadati (dati secondari); ma, e qui ci leghiamo al concetto di interoperabilità,

“abbiamo a che fare con metadati quando, volendo descrivere o gestire una risorsa informativa o un certo insieme di risorse informative, ne individuiamo e selezioniamo alcune caratteristiche al

224 Aliprandi (2011, cap. 3.2).

225 International Telecommunication Union – Telecommunication Standardization Bureau, una delle tre unità dell’ITU,

appunto l’International Telecommunication Union. Si occupa di creare standard internazionali che definiscano gli elementi all’interno dell’infrastruttura delle ICT.

226 Per l’importanza che questo concetto ha per il nostro elaborato.

227 Per un testo completo ma di livello introduttivo relativo ai metadati si segnala Murtha (2008).

228 Deriva infatti dall’unione delle parole meta- e dato. Meta deriva dal greco μετα- “elemento di parole composte che significa