1 Introduzione
1.1
Ordinamenti giuridici e dematerializzazione
Negli ultimi anni in Italia è stata sviluppata una legislazione, piuttosto complessa e articolata, al fine di regolamentare nella società i diversi aspetti di alcune tecnologie informatiche.
Questi ordinamenti danno validità giuridica e legale a tali tecnologie che quindi possono essere utilizzate anche in ambiti “ufficiali”; un tipico esempio riguarda la tecnica di firma digitale che esiste e viene utilizzata da svariati anni, ma che ha acquisito una validità giuridica solo dal 1997 [LEX1]. L’utilizzo della firma digitale è stato poi reso realmente attuabile qualche anno dopo, con successive norme integrative.
Un aspetto particolare sul quale oggi è aperto un vivo dibattito riguarda la cosiddetta “dematerializzazione”, ovvero l’archiviazione elettronica di documenti digitali.
Col termine “dematerializzazione” si intende il processo tramite il quale i documenti analogici (cartacei) perdono la loro fisicità perché trasposti in forma digitale.
Per rendere possibile un effettivo processo di dematerializzazione, gli obiettivi da perseguire sono:
- produzione di documentazione direttamente in formato elettronico;
- conversione dei documenti presenti negli archivi cartacei esistenti in documentazione elettronica;
- riduzione delle procedure che generano documentazione cartacea quando queste possono essere sostituite da procedure che utilizzano strumenti per lo scambio di dati in formato elettronico.
Conseguentemente è necessaria la predisposizione di archivi digitali che possano contenere tali documenti e garantirne la conservazione.
Il processo di dematerializzazione pone le sue fondamenta sulla tendenza crescente, già in atto nelle Pubbliche Amministrazioni, all’uso di strumenti ICT per il trattamento delle informazioni nei processi operativi.
Negli anni si sono susseguite varie regolamentazioni che disciplinavano solo in modo marginale tale processo. Nel 2001 si è avuta la prima stesura, da parte del CNIPA (allora AIPA), di una deliberazione ad hoc [LEX2]. La seconda stesura, ancora oggi in vigore, è del 2004 (Deliberazione CNIPA n.11/2004 [LEX3]). Nel gennaio 2008 è stata resa nota una proposta di regole tecniche [LEX4], frutto delle conoscenze acquisite negli ultimi anni, che dovrebbero tra breve definire, con maggiore precisione, il processo di dematerializzazione e costituzione di archivi digitali.
1.2 Ambito progettuale
L’Istituto di Fisiologia Clinica del CNR di Pisa ha sviluppato negli anni un sistema per la gestione elettronica dei dati prodotti durante l’attività clinica. La documentazione generata dai dati archiviati (referti, lettere di dimissioni ecc.) non ha però validità legale, in quanto priva di firma digitale. Ai fini della conservazione è necessario produrre copia della stessa su un supporto analogico (carta, lastre ecc.); inoltre, ad oggi, non esiste un’organizzazione di procedure e strumenti per la conservazione a lungo termine dei documenti digitali.
Di conseguenza, benché la gestione dell’attività clinica avvenga tramite strumenti per la generazione ed il trattamento di documenti informatici, si continua comunque a produrre ed accumulare documentazione cartacea.
Questo è il motivo per il quale è sorta l’esigenza di realizzare un sistema informativo per la conservazione di beni digitali.
Il lavoro di tesi è consistito appunto nella progettazione e nella realizzazione di un prototipo di sistema informativo per la conservazione a lungo termine e con validità legale di documentazione sanitaria e amministrativa (e più in generale di documenti in formato elettronico).
Il sistema progettato ha un ruolo centrale per lo sviluppo del processo di dematerializzazione all’interno dell’Istituto. Il sistema di archiviazione infatti si rende necessario per la realizzazione dei primi due passi del processo di dematerializzazione: a monte del sistema dovranno essere quindi attivate procedure per la produzione di documentazione valida in formato elettronico, ma anche procedure di riproduzione sostitutiva del cartaceo esistente in documentazione elettronica.
Durante la progettazione del servizio è stato tenuto conto, ovviamente, di quella che è la normativa vigente (in particolare dell’articolo 5 della deliberazione CNIPA 11/2004), della proposta di regole tecniche redatta nel Gennaio 2008 dal CNIPA, dei tavoli tecnici interministeriali relativi alla conservazione digitale, dello stato dell’arte sulla tecnologia esistente, della tipologia di documenti da conservare, delle procedure di gestione dell’archivio digitale, dello standard ISO 14721 “Open Archive Information System”.
1.3 Progettazione del sistema
La progettazione del sistema ha riguardato una grande varietà di aspetti, tutti necessari per una corretta e ragionevole valutazione del sistema che si andava a formare.
Sono state studiate tutte le caratteristiche principali, dalle più “tangibili”, come la valutazione dell’hardware e dei supporti di memorizzazione, alle più “teoriche”, come lo studio dei documenti e dei relativi metadati ed attributi, utili per l’indicizzazione delle informazioni.
Le fasi che di seguito vengono proposte ricalcano la struttura della tesi. Ogni fase è rappresentata da uno specifico capitolo presente in questo lavoro.
1.3.1 Fase 1: studio della normativa
È stato ovviamente necessario, per prima cosa, uno studio della normativa vigente (Deliberazione CNIPA 11/2004), e della proposta di regole tecniche diffusa dal CNIPA nel gennaio 2008.
Inoltre è stato valutato il quadro normativo relativo alla dematerializzazione e gestione di documenti informatici precedente alla Deliberazione CNIPA.
La fase qui descritta è trattata nel prossimo capitolo, che espone anche i requisiti che sono stati posti per la progettazione del sistema.
1.3.2 Fase 2: supporti di memorizzazione
È stato subito chiaro che la realizzazione del sistema di conservazione richiedeva innanzitutto uno studio accurato dei supporti di memorizzazione. I supporti di memorizzazione costituiscono infatti il nucleo ed il valore di un sistema di archiviazione: è su di essi che l’informazione viene mantenuta.
La prima normativa riguardante l’archiviazione digitale, ed in parte anche la Deliberazione CNIPA in vigore, prevedono solo supporti ottici di memorizzazione. È questo il motivo per il quale spesso i sistemi di archiviazione proprietari prevedono l’utilizzo solo di CD e DVD come supporti di memorizzazione dei documenti da archiviare.
L’ammettere solo supporti ottici di memorizzazione ha fatto scaturire l’errato principio di far coincidere un volume di archiviazione1 con un supporto di
memorizzazione. Essendo la capacità dei supporti ottici (CD e DVD) piuttosto limitata, si supponeva che la capacità di un volume di archiviazione fosse
1 Un volume di archiviazione consiste in un insieme di documenti (omogenei per qualche loro
dipendente più dalla capienza dei CD o dei DVD che dalle dimensioni e dal numero dei file che compongono i documenti del volume. Facendo così, però, si è alterato il concetto di volume di archiviazione, la cui essenza è, a nostro parere, quella di contenere file omogenei a prescindere dal loro numero o dalla loro dimensione.
L’articolo 8 della vigente Deliberazione CNIPA permette però la costituzione di archivi digitali fondati anche su supporti di memorizzazione differenti, basati su tecnologie diverse da quella ottica. In questo modo vengono ammessi anche altri tipi di supporto, come il nastro magnetico.
Il motivo per cui veniva ammessa solo la tecnologia ottica risiedeva, probabilmente, nella concezione errata che l’immutabilità del documento archiviato dipendesse dalla non modificabilità del supporto. Oggi, invece si preferisce affidare la non modificabilità del documento alle tecniche di firma digitale.
Inoltre è stata constatata la deteriorabilità di supporti quali CD e DVD, che inizialmente sembrava potessero garantire oltre 25 anni di affidabilità, che invece si è rivelata essere solamente di pochi anni.
Vista la fondamentale importanza dei supporti di memorizzazione in un sistema di conservazione, la ridotta dimensione ed affidabilità dei supporti ottici come CD e DVD, la recente diffusione di supporti ottici come Blu-ray o HD-DVD, la ammissione di supporti di memorizzazione con tecnologie non ottiche, una valutazione accurata dei supporti di memorizzazione, esposta nel capitolo terzo, è stata obbligata.
1.3.3 Fase 3: tipologia di documenti da conservare, metadati ed attributi
Questa fase, descritta nel quarto capitolo e svoltasi parallelamente alla valutazione dei formati software (fase 4), ha riguardato lo studio della tipologia di documenti da conservare. Durante questo studio sono stati definiti i metadati relativi ai documenti analizzati e selezionato un insieme di attributi, utili per una
successiva indicizzazione dei documenti nell’archivio ed una corretta memorizzazione del loro contenuto.
1.3.4 Fase 4: formato software dei documenti
La quarta fase di progettazione è consistita nella scelta del formato software di memorizzazione dei documenti. Questa scelta è di notevole importanza per il sistema di conservazione dei documenti.
La normativa non prevede e non pregiudica nessun formato software particolare. Era comunque evidente che l’utilizzo di determinati formati, in particolare di quelli aperti, standard e documentati, era da prediligere in quanto tali formati assicurano indipendenza dal produttore, interoperabilità e longevità.
Le procedure automatizzate dell’ambito clinico o amministrativo all’interno dell’Istituto spesso sviluppano documenti di formato PDF (Portable Document Format). Archiviare documenti con tale formato è rischioso dal punto di vista della conservazione. I documenti PDF spesso possono includere link esterni oppure macrositruzioni che in qualche modo li rendono dipendenti dal momento e dall’ambiente in cui tali documenti vengono “aperti”.
In questa fase è stato valutato un formato PDF particolare, studiato appositamente per la conservazione per lungo periodo di documenti.
La scelta di specifici formati software auto-descrittivi come l’XML, ma anche come il DICOM, formato per documenti sanitari o di diagnostica per immagini, aumenta le potenzialità del sistema e permette una migliore indicizzazione dei documenti in base agli attributi che possiedono i documenti stessi, se rappresentati con questi particolari formati.
Questa fase è esposta nel quinto capitolo.
1.3.5 Fase 5: architettura del sistema per la conservazione dei documenti
considerazione i Tavoli Tecnici interministeriali organizzati dal CNIPA e svolti nel 2006 [CNIPA2/11] ed il modello proposto dallo standard OAIS [DOC10], cui spesso i tavoli tecnici interministeriali fanno riferimento. Questi documenti sono commentati nel sesto capitolo.
È stato progettato il sistema informatico per la conservazione dei documenti e predisposte le funzioni di gestione per attuare il piano di conservazione dell’archivio in base alla normativa.
È stato progettato un database per la conservazione delle informazioni relative ai documenti archiviati, necessario oltretutto per la ricerca dei documenti sui supporti di memorizzazione. Uno dei problemi degli archivi cartacei è infatti, oltre che la conservazione dei documenti, anche il loro reperimento, spesso oneroso e a volte addirittura impossibile. La normativa sull’archiviazione digitale non prevede la costituzione di una base di dati a questo scopo, ma è chiaro che essa è necessaria per una più veloce ricerca nell’archivio digitale dei documenti.
Sono state definite le procedure necessarie per la conservazione di un documento; tali procedure possono essere definite nelle fasi:
1. ricezione del documento;
2. verifica dell’integrità del documento e della validità della firma associata2;
3. indicizzazione del documento tramite i metadati nel database degli indici; 4. inserimento del documento in un volume di conservazione ed inserimento della sua impronta digitale (hash) in un file indice associato al volume;
5. al completamento del volume, chiusura dello stesso mediante apposizione della firma digitale;
6. archiviazione del volume e dell’indice associato su un supporto di memorizzazione.
Ogni operazione effettuata sul sistema deve essere riportata in appositi file di log. È stato effettuata una valutazione delle informazioni da inserire nei file di log.
2 In particolare è necessario verificare che la firma non scada nel periodo che intercorre tra la
Inoltre sono state studiate le procedure per la verifica periodica dello stato dei supporti e previste le operazioni di riversamento diretto3 “travaso” causato dalla
cattiva qualità o obsolescenza del supporto) e di riversamento sostitutivo4
(modifica del formato software dei documenti causato dall’obsolescenza del formato stesso).
È previsto che i documenti archiviati si possano trovare in tre possibili “stati”: online (disponibile in tempo reale), nearline (disponibile nel giro di minuti), offline (non disponibile in tempi brevi). È stata studiato come dare agli utenti la possibilità di poter richiedere la visione dei documenti richiesti, in funzione dello stato.
È stata studiata la regolamentazione di ogni attività connessa all’identificazione e all’accesso al sistema degli utenti. È stato pensato di definire diverse tipologie di utenti, differenti in base a “diritti” concessi, e dipendenti dal ruolo “reale” ricoperto all’interno dell’istituto.
L’architettura e le funzionalità del sistema sono descritte nel capitolo settimo.
1.3.6 Fase 6: implementazione di un prototipo di sistema per l’archiviazione di documenti digitali
In base allo studio progettuale effettuato, è stato implementato un prototipo di sistema per l’archiviazione e conservazione di documenti digitali.
L’implementazione ha previsto lo sviluppo ex-novo di applicativi e l’integrazione di essi con software esistente.
Le applicazioni sono state sviluppate avvalendosi di progetti Open Source (come ad esempio il framework open Axis2 [WWW4] prodotto dall’Apache Software Foundation od il database PostgresSQL [WWW5]).
È stato sviluppato inoltre un client web di esempio, sfruttando la piattaforma web server Apache [WWW6].
In questa fase è stata valutata la possibilità di utilizzo ed integrazione di alcuni progetti software Open Source tramite i quali implementare alcuni aspetti del sistema informativo. In particolare sono stati ritenuti utili:
- Shibboleth: progetto del gruppo Middelware Architecture Committee for Education, appartenente al consorsio Internet2, per l’implementazione open di un sistema web di autenticazione ed accesso federato RBAC (Role Based Access Control) e di Single Sign On [WWW1];
- SysLog: standard IETF per la trasmissione di informazioni di logging; il software è presente nativamente su sistemi Unix [WWW2];
- Request Tracker: ticketing system che permette di sottomettere in modo automatico ticket (segnalazioni o richieste) via web [WWW3];