• Non ci sono risultati.

Area della conservazione permanente (area statica)

Questa è l’area di lavoro centrale rispetto alla conservazione a lungo termine: in questo punto (illustrato nella figura seguente) vengono ottimizzate tutte le procedure per la conservazione a lungo termine del conferimento digitale. Una volta che l’autore ha confermato la lista dei file conferiti – o che tramite successivi aggiustamenti si sia arrivati a questo punto – i file verranno trasferiti dall’area di deposito a quella per la conservazione.

Il conferimento viene copiato nell’area deputata alla conservazione a lungo termine in forma criptata sui server del centro di calcolo dell’Università di Pavia: una volta che la copia è completata (e che quindi il conferimento sia terminato), l’accesso a quest’area è consentito in modalità di sola lettura, e i documenti non possono essere

128

modificati. Per garantire la maggior sicurezza possibile, come anche richiesto dai

NDSA Levels of Digital Preservation

125, non è certo

l’unica copia disponibile dei dati conferiti, né l’unica forma in cui vengono conservati da PAD, che invece utilizza diversi sistemi per garantire che i dati non vadano persi, e allo stesso tempo per poterli recuperare in caso di problemi:

Long Term Preservation

. I dati vengono masterizzati su DVD per la conservazione

archival grade

con strato in oro, in forma non criptata, impacchettati sottovuoto (per limitare il più possibile il deterioramento fisico dovuto ad agenti esterni) e conservati in cassetta di sicurezza presso il

caveau

di una banca: questo permette che possano essere riutilizzati in futuro. La masterizzazione dei dati è il procedimento tecnico; è opportuno però tenere in considerazione se sia il caso di copiare solo i dati originali (e quindi trasferire il

bitstream

dei documenti) oppure anche le conversioni dei file in TXT, PDF/A-1, ODF e i dati del conferimento: rispetto a questo punto si stanno valutando alcune implementazioni data l’importanza del contesto;

Disaster recovery

: oltre alla sincronizzazione sul secondo server a Cremona vengono fatte delle copie di

backup

su nastro del server primario (in questo modo vengono osservati i parametri suggeriti dall’NDSA di avere “almeno tre copie geograficamente separate con differenti trattamenti di

disaster

recovery

”: copie criptate sul server primario di Pavia e su quello di Cremona,

backup

su nastro e DVD non criptata in cassetta di sicurezza).

Una volta trasferito completamente il conferimento nell’area di sola lettura dell’archiviazione, le aree di

staging

e deposito vengono cancellate; saranno riutilizzate in caso di un nuovo conferimento da parte dello stesso autore (perché bisogna ricordare che ogni autore ha una sua specifica area). A questo punto l’unica area che contiene i dati è l’area della conservazione permanente, ed è possibile accedervi solo in modalità di lettura: qualsiasi operazione si debba fare sui documenti

129

conferiti da questo momento in poi, andrà effettuata nell’area di lavoro in cui verranno copiati i file.

In realtà, terminata questa fase con le copie ridondanti sui server dell’Università, i

backup

su nastro e i DVD in cassetta di sicurezza, le operazioni vere e proprie di conservazione a lungo termine potrebbero in buona parte considerarsi concluse. Se, cioè, l’unico obiettivo fosse garantire la possibilità che gli archivi degli autori sopravvivano autentici nel tempo a livello di

bitstream

, le fasi che abbiamo affrontato finora soddisfano questo requisito poiché garantiscono che questi stessi file copiati nella struttura di PAD possano mantenersi intatti per gli anni a venire,

esattamente come sono

. L’altra sfida che pone la conservazione digitale a lungo termine, però, è quella di mantenere i file intatti, oltre che a livello di

bitstream

, anche nella possibilità di accedere al contenuto e alla rappresentazione del contenuto (e questo non sempre è possibile contemporaneamente): per questo la struttura e gli obiettivi di PAD non si esauriscono con l’acquisizione del conferimento nell’area di deposito permanente: oltre a garantire la conservazione anche a livello di rappresentazione del contenuto, nell’area di lavoro la struttura lavora sui metadati e sul riuso dei dati (e dei contenuti).

In riferimento alla funzione del modello OAIS questa è la fase di archiviazione o

archival storage

(illustrata nell’immagine precedente), in cui i documenti effettivamente selezionati per il conferimento vengono copiati nell’area della conservazione permanente:

130

• Viene mantenuta l’immagine disco del materiale conferito;

• Si procede alla masterizzazione del DVD per la conservazione;

• Quotidianamente il sistema provvede al controllo degli errori attraverso la verifica dei

checksum

;

• Quotidianamente viene operato, sempre automaticamente, il controllo dei virus;

• Si controlla che le varie procedure di

disaster recovery

siano attive (

backup

su nastro e server geograficamente distaccato)

• Aggiornamento dei metadati di QUANDO con i risultati dei vari controlli, e la segnalazione di eventuali anomalie.

Per quanto riguarda le funzioni del modello OAIS, le funzioni rimanenti (

Data management,, Administration, Access

,

Preservation

planning

e

Common Services

ovvero Gestione dei dati, Amministrazione, Accesso, Pianificazione della conservazione e Servizi comuni) riguardano l’ordinaria amministrazione della struttura, necessaria a garantire un corretto funzionamento di tutto il sistema e a mantenere i dati sempre aggiornati; queste funzioni attraversano interamente o per una buona parte il sistema di PAD, e le azioni che prevedono non saranno pertanto esclusivamente ascrivibili ad un’area piuttosto che ad un’altra . Rendiamo conto delle rimanenti funzioni simultaneamente in questo punto, prima dell’area del database.

Per la gestione dei dati (illustrata nell’immagine precedente) le azioni previste sono:

131

• La regolare amministrazione del database;

• L’attivazione fondi e conferimenti (in fase di acquisizione e nei vari passaggi tra una fase e l’altra);

• Creare

query

e statistiche da utilizzare in fase di catalogazione del conferimento;

Report

sui file del conferimento da allegare al contratto;

• Aggiornamento metadati di QUANDO ad ogni modifica e operazione effettuata.

L’amministrazione dei dati e del sistema (nella figura precedente) provvede alle seguenti operazioni:

• Audit delle operazioni;

• Interazione con il controllo qualità QUANDO (per le verifiche);

• Abilitazione utenti e permessi in base alle restrizioni dei documenti o dei conferimenti;

132

Le politiche di accesso (nell’immagine precedente) principalmente provvedono a:

• Garantire il rispetto del diritto d'accesso, secondo la volontà dell’autore;

• Fornire un’interfaccia utente per la navigazione dei documenti;

• Fornire una piattaforma di ricerca open source (Solr/Lucene) che opera sui documenti di un fondo.

Le azioni intraprese per pianificare la conservazione dei documenti (e quindi le operazioni da tenere sotto controllo per non rischiare di

133

ritrovarsi con errori, virus, perdita di dati e altre problematiche, così come illustrate nell’immagine precedente) sono:

• Audit delle operazioni, in modo da garantire sempre un’adeguata qualità del lavoro svolto (anche in automatico);

• Interazione con QUANDO (per verificare quali possono essere i punti – se ce ne sono – che hanno generato errori);

• Sorveglianza negli aggiornamenti delle procedure di: Estrazione metadati,

Conversione documenti, Virtualizzazione;

• Sorveglianza degli sforzi fatti in materia d'archiviazione per avere fondi e dati consistenti anche sotto il profilo archivistico;

• Formulazione di raccomandazioni per il mantenimento della leggibilità dell'informazione stoccata;

• Pianificazione delle migrazioni e dei processi di copiatura. Infine, i Servizi comuni, non hanno uno schema delle funzioni, poiché si intende un insieme di relazioni con tutti gli altri elementi pervasivo al punto che una schematizzazione grafica genererebbe solo più confusione.