• Non ci sono risultati.

La qualità di un IR non può prescindere da una corretta impostazione delle Politiche di conservazione (Digital Preservation), cioè dall’insieme delle azioni e degli interventi necessari a garantire un costante e affidabile accesso agli oggetti digitali per tutto l’arco di tempo in cui vengono considerati utili. La Conservazione delle risorse digitali è un problema da affrontare con attenzione e urgenza, pena una perdita globale della memoria di dimensioni finora sconosciute […]

Troppe istituzioni, nella fase di programmazione di un IR, tengono poco conto delle problematiche legate alla Conservazione. La programmazione di periodici backup dei dati non può essere ritenuta una misura sufficiente a garantirne la fruibilità nel lungo periodo […] Vanno favoriti, infine, l’aggiornamento continuo del personale, la collaborazione tra professionisti ed esperti di vari ambiti disciplinari e il coinvolgimento degli autori nelle Politiche di conservazione dei contenuti digitali

[Guerrini, 2010a, pp. 57-58, 60].

In futuro, una parte consistente – probabilmente la più rilevante – della memoria delle Istituzioni scientifiche, accademiche e culturali sarà formata da oggetti “nati” digitali, conservati in Archivi ad Accesso Aperto. Per garantire la sopravvivenza di queste risorse e la loro citazione:

occorre che le comunità accademiche e scientifiche si impegnino fortemente nella conservazione a lungo termine dei propri Archivi digitali […]

L’ACCESSO deve essere GARANTITO, fintanto che è ritenuto necessario, prevenendo e controllando le alterazioni ed i guasti dei supporti e dei sistemi, le anomalie di funzionamento dei Repository e gli effetti dell’evoluzione tecnologica. A tal fine

i processi per la CONSERVAZIONE A LUNGO TERMINE devono essere basati su Modelli organizzativi, Politiche e Strategie ben definite […]

L’AFFIDABILITÀ si riferisce alla capacità delle componenti Hardware e Software di operare e comportarsi in base alle specifiche, senza anomalie o errori (in teoria completamente, in pratica garantendo una percentuale molto elevata). La DISPONIBILITÀ è la percentuale di tempo nella quale un sistema, un’applicazione o un componente funzionano regolarmente rispetto al tempo totale di funzionamento richiesto. I salvataggi di dati e delle applicazioni, gli antivirus, i firewall, gli aggiornamenti dei sistemi operativi e dei Software applicativi, le configurazioni Hardware basate su componenti fault tolerant e ridondanti sono alcune delle tecniche comunemente adottate per garantire elevate percentuali di affidabilità e disponibilità.

[Pasqui, 2012, pp.1-2]

L’Archivio digitale di qualità deve garantire l’accesso e la conservazione a lungo termine dei contenuti che ospita.

l’espressione italiana “Conservazione digitale” indica tendenzialmente il processo di digitalizzazione di documenti analogici, mentre “Conservazione del documento/memoria/informazione/risorsa digitale” è la più comune traduzione dell’espressione DIGITAL PRESERVATION […] si tenda a sottovalutare la valenza della coppia terminologica Conservation/Preservation.

Mantenere anche in italiano la distinzione tra i due termini potrebbe essere funzionale per segnalare un binomio semantico che ha i suoi corrispettivi sia nell’ambito delle modalità di trasmissione dell’informazione(analogico/digitale) che di tipologia dell’intervento (curare/prevenire);

quindi “PRESERVAZIONE” indicherebbe meglio un’attenzione funzionale non solo a contenere ma a prevenire gli effetti dell’obsolescenza e della fragilità in contesti digitali

[Faiella, 2000, p.64]

Enormi quantità di informazioni tra loro molto differenti sono oggetto di codifica digitale; alcune tipologie di dati sono assimilabili ai documenti cartacei – ad esempio le biblioteche conservano documenti stampati sugli scaffali dai quali in futuro potranno essere prelevati e letti. Una situazione analoga a livello digitale significa che, in futuro, dovrà essere possibile prendere un file COMPUTERIZZATO e STAMPARLO [V. sito: Ricerca nel campo delle TIC].

154 Il tema della conservazione a lungo termine di oggetti digitali dovrebbe essere messo al centro già nella fase di progettazione del sistema Archivio, considerando che senza una preventiva programmazione degli aspetti della preservazione (“Preservation Planning”) dei dati elettronici racchiusi in diverse tipologie di documenti (compresi quelli dei risultati scientifici9), una grande massa di tali dati col tempo potrà rivelarsi illeggibile o a rischio, perché le nuove tecnologie non ne consentiranno la lettura o perché risulteranno incomprensibili agli utenti.

Secondo lo Standard per l’archiviazione e la conservazione delle risorse digitali a lungo termine - ISO 14721:2012 OAIS (Open Archival Information System), la RISORSA DIGITALE è un “INFORMATION PACKAGE“ (OAIS-IP) composto da:

1. METADATI che descrivono una RISORSA INFORMATIVA dal punto di vista del contenuto, amministrativo, strutturale, di provenienza;

2. OGGETTI DIGITALI ovvero i file, compreso i file multimediali che compongono la risorsa. L’OAIS-IP può riferirsi ad altri due tipi di entitàò:

1) la COLLEZIONE ORGANIZZATIVA (un insieme di risorse digitali gestite e/o prodotte nell’ambito di competenza di una qualsiasi struttura organizzativa dell’Ateneo: Biblioteca, Dipartimento, Centro, Istituto ecc.).

Le Collezioni Organizzative non possono essere strutturate gerarchicamente ma si presentano in forma atomistica nei confronti dell’Ente che le ospita.

Il materiale di una Collezione Organizzativa puo’:

contenere al suo interno sia le Risorse digitali singole che

organizzato e raccolto in Collezioni di Risorse, sulla base di un legame logico, tematico, gestionale o tramite una relazione di altra natura;

2) la COLLEZIONE di RISORSE:

è associata necessariamente ad una Collezione Organizzativa; puo’ contenere zero o piu’ sotto-collezioni di risorse.

Il PACCHETTO INFORMATIVO “OAIS-IP“ viene rappresentato da un file basato su uno schema di metadati METS (Metadata Encoding and Transmission Standard) in cui vengono descritti tutti i componenti costitutivi di una risorsa incluso i metadati. Le informazioni che secondo la terminologia OAIS possono essere considerate il PDI (Preservation Description Information) sono anch’esse contenute nel file METS.

Prima di implementare un’infrastruttura che possa ospitare le risorse digitali, occorre: considerare le prestazioni del Software scelto in relazione a:

capacità di immagazzinamento dei contenuti digitali;

capacità di adeguarsi alle misure per garantire l’accesso agli oggetti a lungo termine;

supporto dei formati di oggetti digitali per la conservazione a lungo termine;

capacità per l’assegnazione e la gestione di identificatori persistenti. Bisogna prevenire il fenomeno dei link interrotti (il ben noto errore “404 Not Found”) adottando soluzioni tecniche ed organizzative che superino i limiti delle citazioni basate sugli URL non persistenti;

possibilità di migrazione dei dati da una piattaforma ad un’altra; meccanismi di manutenzione, backup, disaster recovery e sicurezza;

valutare quali Standard possano essere applicati per mantenere inalterati (attendibili) file nel tempo;

abbozzare le Politiche organizzative e Strategie per valutare la fattibilità del sistema in vista della persistenza e della conservazione degli oggetti digitali, e per definire gli ASPETTI

9 Il sito della Community CASPAR (<http://www.casparpreserves.eu/>) offre una serie di video istruttivi a supporto delle tematiche di preservazione digitale. Il video “ESA-ESRIN: Preserving Digital Data within the Scientific Domain” parla dell’importanza di preservazione di dati scientifici dell’European Space Agency e dell’Advanced Computer Systems.

155 ORGANIZZATIVI compreso i RUOLI che possono essere richiesti a supporto dei processi di conservazione.

In un Archivio implementato è necessaria una costante revisione e valutazione (auditing and assessment) delle Politiche e Strategie definite a supporto dell’intero ciclo di vita di oggetti digitali, per poter tempestivamente far fronte ai cambiamenti di tipo organizzativo, delle Politiche legali e tecnici.

In seguito saranno esposte informazioni, elencate fonti, e forniti rimandi di approfondimento relativamente al tema del presente paragrafo.

Open Archival Information Systems (OAIS). Standard ISO 14721:2012

Reference Model for OAIS: Recommendation for Space Data System Practices. Versione integrale: <http://public.ccsds.org/publications/archive/650x0m2.pdf>

OAIS è “an ARCHIVE, consisting of an organization of People and Systems, that has accepted the responsibility to Preserve Information and make it available for a Designated Community […]

The term "OPEN" in OAIS is used to imply that ISO 14721:2012, as well as future related International Standards, are developed in OPEN FORUMS, and it does not imply that access to the archive is unrestricted.

I principi definiti dall’OAIS Reference Model (Figura 41) è un prerequisito chiave per la costruzione di Repository affidabili (Trusted) e per assicurare la conservazione a lungo termine di risorse informative che essi ospitano.

Figura 41. Open Archival Information System (OAIS) - Reference model

OAIS definisce un pacchetto di informazioni d'ARCHIVIO (Archival Information Package) che contiene tutte le informazioni necessarie per la Conservazione a lungo termine di un oggetto informativo digitale.

Confronto fra Software per la gestione di Digital Repository (DSpace, Fedora, Digitool,

aDORe, Greenstore, MyCoRe). Progetto Magazzini Digitali: <http://www.rinascimento-

156 Tra i criteri di inclusione nell’analisi dei Software ci sono:

il supporto per lo Standard ISO 14721:2012 OAIS (Open Archival Information System) per la conservazione delle risorse digitali a lungo termine;

il supporto per gli identificatori persistenti URL, importanti nell’ottica della garanzia dell’accesso ai dati digitali a lungo termine.

Digital preservation & records management Programme”.

JISC (Joint Information Systems Committee):

<http://www.jisc.ac.uk/whatwedo/programmes/preservation.aspx>

La conservazione dei contenuti digitali è una serie di attività gestionali necessarie a garantire un accesso significante a lungo termine agli oggetti digitali.

La necessità di sviluppo di un Information Environment volto a supportare gli Archivi digitali, la Conservazione del digitale, cross-searching tra gli Archivi.

JISC “Digital Preservation briefing paper”

<http://www.jisc.ac.uk/publications/briefingpapers/2006/pub_digipreservationbp.aspx> Continued access to authentic digital assets. Gli assetti digitali (es. documento, collezione, ebook, aggregazione, immagine, mappa, video) di un Archivio devono essere preservati per garantire la loro autenticità per il futuro utilizzo.

What is Digital Preservation? La preservazione digitale è una serie di azioni e di interventi necessari per assicurare l'accesso continuo e affidabile a oggetti digitali autentici;

Digital Curation. La gestione attiva e la valutazione dei contenuti digitali attraverso il

monitoraggio del loro ciclo di vita. Digital Curation si basa sui concetti di base della conservazione digitale, sottolineando le opportunità di valore aggiunto e della conoscenza attraverso l'annotazione e la continuità nella gestione delle risorse;

Digital Curation Centre (DCC). Fornisce un piano per la ricerca e lo sviluppo delle questioni sulla Digital Curation e promuove esperienze e buone pratiche per la gestione dei risultati di ricerca in formato digitale.

DCC Curation Lifecycle Model: <http://ijdc.net/index.php/ijdc/article/view/69>

Tale Modello può essere utilizzato in combinazione con gli Standard rilevanti per pianificare le attività di Conservazione a lungo termine a diversi livelli. Le strategie di Conservazione devono essere messe in atto sia a livello degli Archivi (Repository) che degli oggetti digitali.

PREMIS (PREservation Metadata: Implementation Strategies). PREMIS Data Dictionary for Preservation Metadata ( v. 2)

<http://www.loc.gov/standards/premis/>

PREMIS e’ uno Standard internazionale sviluppato sul Modello OAIS per:

identificare e valutare STRATEGIE per la codifica, la memorizzazione e la gestione dei metadati nei sistemi di Digital Preservation;

fornire i metadati per sostenere la Conservazione di oggetti digitali e per garantirli l'usabilità a lungo termine.

Preserving Access to Digital Information (PADI): <http://pandora.nla.gov.au/pan/10691/20110824- 1153/www.nla.gov.au/padi/topics/18.html>

È un sito pubblicato dalla Biblioteca Nazionale di Australia. Offre una guida sintetica alle principali strategie per la Conservazione digitale:

la migrazione (migration): il trasferimento dei dati su un nuovo sistema anche su supporti digitali diversi. Questa strategia può comportare la conversione delle risorse da un formato a un altro;

157 il refreshing: il trasferimento di dati tra due supporti digitali dello stesso tipo; in questo modo non ci sono cambi o alterazioni dei dati;

la duplicazione (replication): la creazione di copie sui dati in più sistemi;

l’emulazione (emulation): la duplicazione delle funzionalità di un sistema obsoleto. L’emulazione richiede la creazione di emulatori, programmi che traducono il codice e le istruzioni di un ambiente-macchina in modo da farli girare correttamente in un altro;

l’incapsulamento (encapsulation) dei dati al fine di garantire la protezione degli stessi; Così come le risorse informative digitali, anche i metadati (informazioni sulla creazione, diritti di accesso, restrizioni di accesso, storia di preservazione e diritti per l'uso) possono subire l’obsolescenza. Il formato ASCII (American Standard Code for Information Interchange), che utilizza caratteri leggibili e non codici numerici e che è largamente diffuso, è considerato il formato più durevole per i metadati.

“Politiche di gestione della Conservazione delle collezioni digitali:

Strategie a breve termine per contrastare problemi a lungo termine”:

<http://www.dpworkshop.org/dpm-ita/foundation/oais/index.html>

Questo documento contiene 6 Capitoli e 6 Appendici che forniscono le informazioni fondamentali per la realizzazione di un’infrastruttura digitale conforme allo standard OAIS. Presenta, inoltre, i settori che sono oggetto di studi ulteriori da parte dei gruppi di lavoro OAIS.

Digital Preservation Europe (DPE):

<http://www.digitalpreservationeurope.eu/registries/resources/>

È una collezione di risorse on-line che riporta le informazioni utili sugli studi e sui progetti di Archivi digitali.

Digital Preservation Coalition (DPC): <http://www.dpconline.org/>

È un’organizzazione non-profit costituita in Inghilterra per coordinare una serie di azioni per affrontare le sfide derivanti dalla tematica "Conservazione del digitale" e per condividere la medesima conoscenza a livello internazionale.

Open Archives Initiative Object Reuse and Exchange (OAI-ORE) <http://www.openarchives.org/ore/>

OAI-ORE definisce Standard per la descrizione e lo scambio di aggregazioni delle risorse Web. Lo scopo di questi Standard è di esporre i contenuti delle medesime aggregazioni alle applicazioni che supportano controllo di autorità, deposito, scambio, visualizzazione, riuso, e preservazione.

“What Does OAI-ORE mean for Digital Preservation?”:

<http://www.ariadne.ac.uk/issue57/rumsey-osteen#What_Does_OAI- ORE_Mean_for_Digital_Preservation>

“Linee Guida DRIVER”:

< http://www.driver-support.eu/documents/DRIVER_Guidelines_v2_Final_2008-11- 13.pdf> Chapter 7: Annex: Use of PERSISTENT IDENTIFIERS:

“PERSISTENT IDENTIFIERS for web resources are needed to create a stable and reliable infrastructure. This does not concern technicalities, but mainly agreements on an organizational level”.

“Linee Guida per gli Archivi Istituzionali” (CRUI, Italia):

<http://www.crui.it/HomePage.aspx?ref=1781>.

Sono create in conformità alle “Linee Guida OpenAIRE”

(<http://www.openaire.eu/it/component/attachments/download/79%E2%8C%A9=en>) alla loro volta basate sulle “Linee Guida DRIVER”.

Nel paragrafo “PRESERVAZIONE” vengono indicati, in modo sintetico, gli aspetti principali di una POLITICA di CONSERVAZIONE delle risorse digitali, in cui viene

158 accentuata l’importanza di:

un’accurata selezione del materiale a cui si deve garantire la persistenza dell’accesso a lungo termine;

lo sviluppo delle POLITICHE di CONSERVAZIONE in conformità allo Standard per la Conservazione del digitale OAIS (strumenti concettuali e indicazioni organizzative per poter predisporre un’adeguata progettazione degli interventi conservativi fin dal momento della creazione dell’Archivio);

la gestione di IDENTIFICATORI PERSISTENTI (PERSISTENT IDENTIFIERS) basati su URIs (UNIFORM RESOURCE IDENTIFIERS) forniti di un meccanismo di risoluzione agli identificatori permanenti (Handle, DOI, URN);

lo sviluppo di sistemi di Storage - Backup - Business Continuity - Disaster Recovery - reportistica (log);

la gestione dei formati (conversione, migrazione, emulazione); la gestione di metadati per la conservazione;

la garanzia dell’autenticità (integrità, firma digitale) dei dati .

IDENTIFICATORI PERSISTENTI (PID)

“Per risolvere il problema delle versioni e delle copie autentiche si devono individuare sistemi affidabili di citazione delle risorse, basati su Identificatori Unici e Persistenti” [Guerrini, 2010a, p.59]

L’associazione di un Identificatore Persistente a una risorsa digitale è considerata oggi una buona pratica che contribuisce alla risoluzione del problema del reperimento affidabile delle risorse in rete e, allo stesso tempo, può supportare la certificazione dell’autenticità della risorsa, della sua provenienza, dei suoi diritti di sfruttamento

[V. sito: “Deposito Legale“] URN (Uniform Resource Name)

<http://www.iana.org/assignments/urn-namespaces/urn-namespaces.xml>

È un URI (Uniform Resource Identifier) che identifica una risorsa mediante un "nome" in un particolare dominio di nomi ("namespace").

A differenza del URL (Uniform Resource Locator), URN non permette l'identificazione della locazione (l'indirizzo) della risorsa in rete.

Un esempio di URN è il codice ISBN: questi identifica univocamente un libro, ma non ci da alcuna informazione sulla locazione dello stesso.

Un URN deve rimandare almeno a un URL attraverso cui accedere all'oggetto.

L'URN collega l'originale e una copia della risorsa d'Archivio mediante un indirizzo e rappresenta così un link sempre attivo nel Catalogo della biblioteca digitale.

NBN (National Bibliography Number):

<http://www.rinascimento-digitale.it/index.php?L=&ID=535&CERCA=NBN#535>

È un Identificatore Persistente basato su URN per individuare in modo univoco una pubblicazione.

Il Progetto NBN Italia (NBN:IT) ha realizzato un servizio di Identificazione Persistente basato sullo standard NBN che assegna alle biblioteche nazionali la responsabilità esclusiva della gestione del sottodominio nazionale NBN:IT per la generazione degli Identificatori NBN italiani per:

il deposito legale nazionale delle risorse digitali degli editori (art. 37 DPR 252/2006);

il deposito delle Tesi di Dottorato in formato digitale presso le Biblioteche Nazionali Centrali di Firenze e Roma.

159 non basta di essere identificati solo da un PID locale che ne garantisca l’unicità e la persistenza a livello di Repository. Esse potrebbero essere meglio identificate attraverso l’utilizzo di un Global Identifier fornito di un robusto meccanismo di risoluzione che ne garantisca l’univocità e la persistenza della risorsa anche al di fuori del Repository.

DOI (Digital Object Identifier) System: <http://www.doi.org/> Agenzie di registrazione di identificatori DOI:

Crossref: <www.crossref.org>;

mEDRA (multilingual European DOI Registration Agency): <www.medra.org>. Il Global Identifier DOI:

viene impiegato per l'identificazione duratura/persistente, all'interno di una rete digitale, di qualsiasi entità che sia oggetto di Proprietà Intellettuale (PI) e per associarvi i relativi dati di riferimento, i metadati, secondo uno schema strutturato ed estensibile;

è un sistema internazionalmente condiviso per gestire riferimenti e citazioni di risorse correlate a pubblicazioni scientifiche.

DOI identifica la risorsa e non la sua localizzazione (URL). In caso di spostamento della URL, è sufficiente aggiornare la relativa informazione nella banca dati DOI per garantire la persistenza dei link costruiti anche in passato.

DOI è utilizzato per gestire:

il “Cross-linking“ tra gli articoli di Riviste scientifiche online;

il “Forward-linking“, un servizio che consente il rinvio alle pubblicazioni di un editore tramite le citazioni incorporate direttamente in una piattaforma (es. Repository);

aggregazioni delle informazioni secondo aree tematiche omogenee, renderle disponibili da un unico punto di accesso (“Multiple Resolution“) identificato da un DOI

L’approccio del DOI è integrativo e non sostitutivo dei modelli già in essere. Ad esempio, a partire da un ISBN, è possibile creare – anche attraverso procedure automatiche – un link persistente DOI riferito alla risorsa identificata, rendendola cosi “azionabile in rete“ ovvero accessibile in Internet.

Fra i vari Global Identifier esistenti, il DOI è senza dubbio quello maggiormente affermato a livello internazionale e costituisce lo Standard più adottato nel mondo dei contenuti editoriali. I DOI possono essere abilitati per essere utilizzati in applicazioni di tipo Linked Data.

Handle System: <http://www.handle.net/>

Viene impiegato per assegnare e gestire Identificatori (handles) Persistenti agli oggetti digitali ed alle risorse presenti in rete.

“Sustainability of Digital FORMATS. Planning for Library of Congress Collections“:

<http://www.digitalpreservation.gov/formats/intro/intro.shtml> Tra gli obiettivi di questo documento vi sono:

supporto alla pianificazione strategica per quanto riguarda i Formati dei contenuti digitali con cui garantire la conservazione a lungo termine;

identificare e descrivere i formati per la sostenibilità a lungo termine. Sviluppare strategie per sostenere questi formati incluso raccomandazioni riguardanti gli strumenti e la documentazione necessari per la loro gestione;

identificare e descrivere formati non adatti per la sostenibilità a lungo termine, e sviluppare strategie per sostenere i contenuti incapsulati nei medesimi formati.

InterPARES (International Research on Permanent Authentic Records in Electronic

160 È un Progetto istituito in Canada avente l’obiettivo di elaborare le conoscenze teoriche e metodologiche essenziali (Standard, Politiche, Strategie e Piani) sulla Conservazione a lungo termine di oggetti digitali.

NESTOR Project:

<http://www.dnb.de/DE/Wir/Kooperation/nestor/nestor_node.html>;

<http://www.langzeitarchivierung.de/Subsites/nestor/DE/Home/home_node.html>

È una rete di cooperazione composta da 12 istituzioni dei paesi di lingua tedesca che promuovono la conoscenza sulla Conservazione del digitale.

“NESTOR-Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung Cross-linking“.(Manuale di NESTOR: Una piccola enciclopedia sul cross-linking della Conservazione a lungo termine):

<http://www.nestor.sub.uni-goettingen.de/handbuch/index.php>: Le tematiche del Handbuch:

Politiche di Preservazione a lungo termine; Affidabilità dei contenuti e sicurezza dei sistemi; Modello OAIS;

PREMIS (PREservation Metadata: Implementation Strategies) Standard; METS (Metadata Encoding and Transmission Standard);

Formati per la Conservazione a lungo termine;

Strategie della Conservazione digitale (migrazione, emulazione, microfilm); Accesso e reperimento. Identificatori persistenti;

Hardware;

Sistemi di storage per l’archiviazione a lungo termine; Aspetti legali;

Procedure per l’archiviazione di diverse tipologie di oggetti (documenti di testo,